大师兄的应用回归分析学习笔记(二十四):主成分回归与偏最小二乘(三)
大师兄的应用回归分析学习笔记(二十六):非线性回归(二)
一、可化为线性回归的曲线回归
- 实际问题中,有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的,其中一些回归模型通过对自变量或因变量的函数变换可以转化为线性模型,利用线性回归求解未知参数,并做回归诊断。
-
,
- 只需令
即可转化为
关于
的线性形式。
- 新引进的自变量只能依赖于原始变量,而不能与未知参数有关,如当b未知时,则不能通过变量替换转化为线性形式。
- 可以令
,于是得到
的线性表达式
![]()
- 两边同时取自然对数,得
![]()
- 令
,得到
的一元线性回归模型
![]()
- 不能通过等式两边同时取自然对数的方法将回归模型线性化,只能用非线性最小二乘方法求解。
- 在对非线性回归模型线性化时,总是假定误差项的形式就是能够使回归模型线性化的形式,为了方便,常常省去误差项,仅写出回归函数的形式。
- SPSS给出了十几种常见的可线性化的曲线回归方程,其中自变量以t表示:
英文名称 | 中文名称 | 方程形式 |
---|---|---|
Linear | 线性函数 | |
Logarithm | 对数函数 | |
Inverse | 逆函数 | |
Quadratic | 二次曲线 | |
Cubic | 三次曲线 | |
Power | 幂函数 | |
Compound | 复合函数 | |
S | S形函数 | |
Logistic | 逻辑函数 |
u是预先给定的常数 |
Growth | 增长曲线 | |
Exponent | 指数函数 |
1. 示例
- 对GDP的拟合:
- 选取GDP指标为因变量
- 单位为亿元
- 拟合GPD关于时间t的趋势曲线
- 以1991年为基准年,取值为t=1
- 首先画出GDP对变量t的散点图:
- 从散点图可以看到,GDP大致为指数函数形式。
- 在本案例中,复合函数
的形式与经济意义更吻合。
-
做复合函数线性回归:
- 线性回归
![]()
- 复合函数回归
![]()
- 两者的残差不能直接相比。
- 复合函数回归系数为
b_1=1.148$
- 回归方程为:
- 式中
表示GDP的平均发展速度,平均增长速度为
![]()