大师兄的应用回归分析学习笔记(三):一元线性回归(二)
大师兄的应用回归分析学习笔记(五):多元线性回归(二)
一、多元线性回归模型
- 在实际问题中,一元线性回归只不过是回归分析中的一种特例,通常是对影响某种现象的许多因素进行简化考虑的结果。
1. 多元线性回归模型的一般形式
- 设随机变量y与一般变量
的线性回归模型为:
是p个未知参数
是回归常数
是回归系数
- y是被解释变量(因变量)
是p个可以精准测量并控制的一般变量(解释变量、自变量)
- p=1时,为一元线性回归模型;p>1时,为多元线性回归模型。
为随机误差
- 理论回归方程:
- 假定
![]()
- 回归设计矩阵:
是一个
阶矩阵
2. 多元线性回归模型的基本假定
- 解释变量
是确定性变量,不是随机变量,且要求
(自变量列之间不相关,样本量的个数大于解释变量的个数,X是以满轶矩阵)。
- 随机误差项具有零均值和等方差(高斯-马儿柯夫条件),即假设观测值没有系统误差,且随机误差项在不同样本点之间是不相关的,并且有相同的精度。
- y服从n维正态分布。
3. 多元线性回归方程的解释
- 假设有
- 加入
保持不变,则有
- 对一般情况下含有p个自变量的多元线性回归而言,每个回归系数
可解释为自变量
每增加一个单位,因变量y的平均增加幅度。
二、回归参数的估计
1. 回归参数的普通最小二乘估计
- 最小二乘法,就是寻找参数
的估计值
,使离差平方和
达到极小。
-
就称为回归参数
的最小二乘估计。
- 经验回归方程:
2. 回归值与残差
- 在求出回归参数的最小二乘估计后,可以用经验回归方程计算因变量的回归值与残差值。
-
的回归拟合值:
- 相应的,因变量向量
的回归值:
- 误差项方差
的无偏估计为:
- 如果用普通最小二乘法估计多元线性回归模型的未知参数,样本量必须不少于模型中参数的个数。
3. 回归参数的最大似然估计
- 多元线性回归的最大似然与一元线性回归的最大似然估计的思想一致。
-
~
服从正态分布,y的概率分布为:
~
- 似然函数为:
- 其中的未知参数是
和
![]()
- 最大似然估计就是选取使似然数L达到最大的
和
![]()
- 在正态假定下,回归数
的最大似然估计与普通最小二乘估计完全相同,即
- 误差项方差
的最大似然估计为: