实用机器学习---笔记(数据处理)

机器学习首先需要做好数据处理。

1.数据收集

2.重点特征的确认

3.数据规范化:

分类特征不要使用位操作来表现一个种类;最好一个分类一个数据

缺失的数据,可新定义一个新类、可根据附近数据来设置新指、可用整体数据的平均值、中位值等代替。

要注意从原有特征中细化新的有用的特征

要将数据规划到合适区间(如-1到1,0到1等)

4.通过数据可视化来缺点特征是否有意义

分类型数据可用马赛克图或盒图

数值数据可用密度图或散点图

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容