学习小组第七天-xz

今天学习使用tidry包

tidry包是何方神圣

功能

tidry包是把需要用的数据处理成标准而统一的数据框
(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
1、新建数据框

a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
数据框

代码解释
rep,重复,括号中填要重复的字符和重复次数。
paste,连接两个字符串,括号要填两个待连接字符并指定分隔符(sep),没有分隔符就填sep=“”。
1:3表示从1到三。如需一列中需要填入三个无规律的数字,可以用向量c(1,3,4),同样如果填的是字符串也需要加双引号,例如c("doudou","huahua","xiaoyu")。
了解概念:key-value--“键值对” ,表示一种对应关系。“键”和“值”都是列名,如SampleName和Expression的对应。
函数后面一般都要加括号,括号里第一个参数是都数据框名
字符串要加双引号(行名和列名也是字符串,但是可以不用加),其他单元格(姑且这么叫了)里出现的字符串要加。
行 raw
列 column,简化写法为col

gather函数

使用前
使用前

使用后

代码
pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
gather(pin2,GeneId,SampleName,Expression)

在处理表格时会遇到NA值,对于NA怎么办呢?

三种处理方式:
(1).删除整行 drop_na(X,X2)#括号里填数据框名,依据的列名(有空值那一列的列名)
(2).根据上下文蒙一个 fill(X,X2)
(3).同一列的空值填上同一个数。replace_na(X,list(X2=2)) #括号里填数据框名,要填的列名=要填的值

separate函数

separate:按列分割
separate_rows:按行分割
unite:分割完了再合并回去

代码
separate(pin2,Expression,into=c("a","b"))#pin2表格的Expression分割成a,b
separate_rows(pin2,Expression)#pin2按照行分割
unite(pin2,a,b,col="Expression",ser="")#将分割的a,b重新合并成Expression

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 在挖掘分析的过程当中对字符串的处理是极为重要的,且出现也较为频繁,R语言作为当前最为流行的开源数据分析和可视化平台...
    果果哥哥BBQ阅读 11,177评论 0 8
  • 今天我从早上起来就开始整理孩子们的资料,一边收拾,一边写教学日志,一边思考如何才能使教学更加完善,几天前一直在构思...
    小眉毛2016阅读 1,644评论 0 1
  • 喜欢你 是我不小心 不小心的自以为是 喜欢了你 怪我不经意 不经意的神迷 喜欢了你 让我不确定 不确定我自己 喜欢...
    烊小蜜阅读 1,222评论 2 2
  • 2017年6月9日 星期五 晴 今天我和她爸都上白班,晚上下班回来,李云哲还没到家。过了一会儿,回来啦,一进...
    云哲云灿妈妈阅读 1,053评论 0 1
  • 在商品分类中由于需要使用无限极的分类,自己动手实现如下:数据表: 最后生成的列表 tp模板 最终显示
    IT宝哥哥阅读 1,742评论 0 1