sklearn里的make_blobs

make_blobs函数是为聚类产生数据集
产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度,默认值是2
centers:产生数据的中心点,默认值3
cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0
center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
shuffle :洗乱,默认值是True
random_state:官网解释是随机生成器的种子
更多参数即使请参考:http://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html#sklearn.datasets.make_blobs

X, y = make_blobs(n_samples=n_samples, random_state=random_state)

n_samples
生成集合长度

n_features
X的纬度

centers
默认是3个 也就是0、1、2, 这是指y的取值范围

random_state
相同的值具有可重现性,也就是所指定一个相同的,以便于下次重现


下面几个是猜测的

cluster_std
数据集的标准差,浮点数或者浮点数序列,默认值1.0
一般用浮点数,y的范围是几就给几个参数,效果是使散点图中的点分散开

center_box shuffle 不常用,不说了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容