数学建模

你用编程解决过什么有趣的事情?

和两名队友笑了四天四夜完成美赛建模。
整个比赛过程,我是负责编程部分的:
R语言的的dplr包做ETL(数据清洗、转化、加载)以及用K-means clustering 做数据填充;latex的排版语法,一个专门排版用的专业软件。

背景介绍
◊项目背景:根据缺失大量数据的系列表格(美国7806所高校),建立相关模型,进而搭建美国高校的评价体系,
帮助一个慈善机构决策,使得捐款金额100 (百万美元)能最大程度上改善学生的表现。

◊ 要解决的问题:依据这个评价体系,确定获得捐款的高校以及金额数目、捐款金额分期发放方式。

◊ 提供的数据集:共7806所高校,每所高校有95个变量,只有11个变量数据是完整的,另外84个变量都缺失大量数据;另外提供一个候选名单高校的表格,共2809所。

解决步骤

分析问题

  • 数据体量太大,且各变量类型都不一样,有类型变量也有数值型变量,数值型变量又有整数型和浮点型。怎样对数据标准化处理?
  • 缺失大量数据,缺失值处理该
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 数学建模竞赛经验干货 一、团队的组建 1、团队主要角色:建模者、编程者、论文撰写者。2、应具备的素质:负责建模的同...
    晨染未央阅读 5,604评论 0 17
  • title: 正则表达式断言tags: [正则表达式]date: 2017-11-15 23:55:55 正则表达...
    歇歇阅读 8,982评论 4 9
  • - 01 - 今早一个德国的朋友告诉我,Bobo结婚了。 Bobo是我本科在慕尼黑交换时的男朋友,一个纯正的理工博...
    大瑶大摆阅读 3,335评论 1 1
  • 随机播放到中考后暑假一直单曲循环的歌,被代入到当时腿上放着电脑坐在床上的场景,比勺子无意中掉落在盘子上发出咣当声正...
    会飞的熊本熊阅读 1,261评论 0 0