大师兄的应用回归分析学习笔记(二十五):非线性回归(一)

大师兄的应用回归分析学习笔记(二十四):主成分回归与偏最小二乘(三)
大师兄的应用回归分析学习笔记(二十六):非线性回归(二)

一、可化为线性回归的曲线回归

  • 实际问题中,有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的,其中一些回归模型通过对自变量或因变量的函数变换可以转化为线性模型,利用线性回归求解未知参数,并做回归诊断。
  • y=\beta_0+\beta_1e^{bx}+\epsilon(b已知)
  • 只需令x'=e^{bx}即可转化为y关于x'的线性形式。
  • 新引进的自变量只能依赖于原始变量,而不能与未知参数有关,如当b未知时,则不能通过变量替换转化为线性形式。
  • y=\beta_0+\beta_1x+\beta_2x^2+...+\beta_px^p+\epsilon
  • 可以令x_1=x,x_2=x^2,...,x_p=x^p,于是得到x_1,x_2,...,x_p的线性表达式y=\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_px_p+\epsilon
  • y=ae^{bx}e^\epsilon
  • 两边同时取自然对数,得ln_y=ln_a+bx+\epsilon
  • y'=lny,\beta_0=lna,\beta_1=b,得到y'关于x的一元线性回归模型y'=\beta_0+\beta_1x+\epsilon
  • y=ae^{bx}+\epsilon
  • 不能通过等式两边同时取自然对数的方法将回归模型线性化,只能用非线性最小二乘方法求解。
  • 在对非线性回归模型线性化时,总是假定误差项的形式就是能够使回归模型线性化的形式,为了方便,常常省去误差项,仅写出回归函数的形式。
  • SPSS给出了十几种常见的可线性化的曲线回归方程,其中自变量以t表示:
英文名称 中文名称 方程形式
Linear 线性函数 y=\beta_0+\beta_1t
Logarithm 对数函数 y=\beta_0+\beta_1lnt
Inverse 逆函数 y=\beta_0+\beta_1/t
Quadratic 二次曲线 y=\beta_0+\beta_1t+\beta_2t^2
Cubic 三次曲线 y=\beta_0+\beta_1t+\beta_2t^2+\beta_3t^3
Power 幂函数 y=b_0t^{b_1}
Compound 复合函数 y=b_0b_1^t
S S形函数 y=exp(b_0+b_1/t)
Logistic 逻辑函数 y=\frac{1}{\frac{1}{u}+b_ob_1^t}
u是预先给定的常数
Growth 增长曲线 y=exp(b_0+b_1t)
Exponent 指数函数 y=b_0exp(b_1t)
1. 示例
  • 对GDP的拟合:
  • 选取GDP指标为因变量
  • 单位为亿元
  • 拟合GPD关于时间t的趋势曲线
  • 以1991年为基准年,取值为t=1
  • 首先画出GDP对变量t的散点图:
  • 从散点图可以看到,GDP大致为指数函数形式。
  • 在本案例中,复合函数y=b_0b_1^t的形式与经济意义更吻合。
  • 做复合函数线性回归:



  • 线性回归SSE=8435^{10}
  • 复合函数回归SSE = 0.306 ,R^2=0.984
  • 两者的残差不能直接相比。
  • 复合函数回归系数为b_0=24852.764,等比系数b_1=1.148$
  • 回归方程为:\hat y = 24852.764 \times (1.148)^t
  • 式中b_1 = 114.8\%表示GDP的平均发展速度,平均增长速度为14.8\%
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容