sklearn里的make_blobs

make_blobs函数是为聚类产生数据集
产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度，默认值是2
centers:产生数据的中心点，默认值3
cluster_std：数据集的标准差，浮点数或者浮点数序列，默认值1.0
center_box：中心确定之后的数据边界，默认值(-10.0, 10.0)
shuffle ：洗乱，默认值是True
random_state:官网解释是随机生成器的种子
更多参数即使请参考：http://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html#sklearn.datasets.make_blobs

X, y = make_blobs(n_samples=n_samples, random_state=random_state)

n_samples
生成集合长度

n_features
X的纬度

centers
默认是3个也就是0、1、2，这是指y的取值范围

random_state
相同的值具有可重现性，也就是所指定一个相同的，以便于下次重现

下面几个是猜测的

cluster_std
数据集的标准差，浮点数或者浮点数序列，默认值1.0
一般用浮点数，y的范围是几就给几个参数，效果是使散点图中的点分散开

center_box shuffle 不常用，不说了

最后编辑于：2017.12.10 07:34:49

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

sklearn里的make_blobs

推荐阅读更多精彩内容