2018-12-17过度拟合

欠拟合(underfitting) 、高偏差(bias)

过度拟合或过拟合(overfitting)、 高方差(variance) 

线性回归示例1
逻辑回归示例2

当我们的假设函数的形式很难映射到数据的趋势时,不合适或者偏见很大。 它通常由太简单或使用太少功能的功能引起。 另一方面,过度拟合或高变异是由适合可用数据的假设函数引起的,但不能很好地概括以预测新数据。 它通常是由复杂的函数引起的,它会产生许多与数据无关的不必要的曲线和角度。

变量过多引发的过度拟合

过度拟合的问题会在变量过多的时候,发生这种时候训练出的方程总能很好的拟合训练数据。所以你的代价函数实际上可能非常接近于0或者就是0 。但是这样的曲线它千方百计的拟合于训练数据,这样导致它无法泛化到新的数据样本中, 以至于无法预测新样本价格。在这里术语"泛化" 指的是一个假设模型能够应用到新样本的能力,新样本数据是没有出现在训练集中的房子。 

过度拟合的解决办法,适用于逻辑回归、线性回归。

过度拟合解决办法
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 以我们前面讲述的线性回归为例,比如我们在训练集上训练出最优的模型,但是当我们将其使用到测试集时,测试的误差很大,我...
    nightwish夜愿阅读 14,852评论 0 5
  • 问:阔腿裤里边儿兜了一只蚊子是什么感受~ 答:1、2、3、4、5,换个腿,6、7 从恨里看到 活在爱里有多幸福
    不说真话会死星人阅读 1,111评论 0 0
  • 1、产生死锁的条件: 产生死锁的四个必要条件:(1) 互斥条件:一个资源每次只能被一个进程使用。(2) 请求与保持...
    jemmy_xl阅读 2,801评论 0 1