离群点分析

LOF算法

使用基于密度的局部离群点检测算法LOF
鉴于LOF算法的特点,使用了文献[1]中的DLOF算法,在文献中的局部可达密度为


图1

注意:|Nk(p)|即p的第k邻域值,在p的第k距离可能不止一个时,|Nk(p)|在lrdk(p)的表达式中可能会比较小,可能会造成此处的可达密度为无穷,或造成下文中的LOF值为无穷比无穷,带来计算上得到困扰,所以我们在这里可以把|Nk(p)|写为k


图2

图一图二表达的内容是一样的
局部离群因子为:(离群因子越接近1,说明p的其邻域点密度差不多,p可能和邻域同属一簇)
图3

[1]胡彩平, 秦小麟. 一种基于密度的局部离群点检测算法DLOF[J]. 计算机研究与发展, 2010, 47(12):2110-2116.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转载: wangyibo0201 在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和...
    We2sWing阅读 9,597评论 0 0
  • 什么是离群点   离群点是一个数据对象,它显著不同于其他数据对象,好像它是被不同的机制产生的一样。有时也称非离群点...
    尼小摩阅读 10,570评论 0 6
  • 前言 友情提示,这篇文章很长,光是滑动到底部就需要好几秒,请合理安排阅读时间。 最近在学习异常值探测(Outlie...
    401a26360366阅读 6,796评论 0 2
  • 最近在读毕淑敏的《人生终要有一场触及灵魂的旅行》。 To touch the soul in travel. 她以...
    归园田居其一阅读 1,807评论 0 1
  • 日子过得比流水都快,看着钟表一点一点的走过,不知不觉十五天又一转而逝,大年也渐渐过去,沉浸在喜悦之中,没有感觉,就...
    正捌阅读 1,748评论 3 10