聚类、分类

clustering

k-means法

API

>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])
批量 K-means 法 MiniBatchKMeans

API

相似性传播 Affinity Propagation

API

适合中小型的数据集

均值漂移 MeanShift

API

回归

用到的回归类

regr = linear_model.LinearRegression()
线性回归的多分类

例子

OvO 一对一

把类别两两配对,制造N(N-1)个分类器。所有分类器预测结果最重合的那个类别,即为此点的分类。

OvR 一对多

共有N个分类器,每个分类器把一个类别记为‘+’的,其他类别一块记为‘-'的。预测时,若有一个分类器预测结果为+,则把它当做最终结果。

Paste_Image.png

OvO的存储开销比较大,时间开销更小,由于用所有类别训练,结果比一对多更准。

MvM 多对多

每个分类器对所有类进行划分,分为-和+。有二元编码和三元编码,三元编码多了个「停用类」。

方法称作「纠错输出码」EOOC。

这三个方法很难说出谁更强。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,242评论 19 139
  • 一、实验目的 学习使用 weka 中的常用分类器,完成数据分类任务。 二、实验内容 了解 weka 中 explo...
    yigoh阅读 8,682评论 5 4
  • 机器学习 经验 数据 数据中产生模型model 的算法 学习算法 learning algorithm 数据集 d...
    时待吾阅读 4,077评论 0 3
  • 由于昨晚的电闪雷明,狂风大作,村中停电了。 早晨,出门一看,门前一人粗的大杨村已连根拔出,斜斜的躺在路...
    王斐妈妈阅读 165评论 0 1
  • update: 新版的豆瓣FM 竟然跟我画的差不离! 好赞 以豆瓣为例 来听歌 顶端有电台信息 我要加心 往上滑 ...
    南不图阅读 421评论 0 2