根据HMP文件统计区间内SNP的个数

image.png

现有区间如上,需要统计各区间内的SNP个数 (示例文件中的Chr文件)

公司返还的,或者说从hmp等格式上截取下来的之后SNP位点,例如下图


image.png

由重测序或者大芯片的行数过多,无法在excel上进行操作

现采用R的For循环进行简单的汇总统计

for (i in 1:nrow(Chr))   #循环次数为Chr文件的总行数
  {
  chrosmome<-Chr[i,1]
  start<-Chr[i,2]
  end<-Chr[i,3]          #获取3个定义的值
  huizong[i,1]<-chrosmome
  huizong[i,2]<- start
  huizong[i,3]<- end        #赋值到新表
  huizong[i,4]<-nrow(dplyr::filter(SNP,X.CHROM==chrosmome,between(POS,start,end))) #筛选符合条件的SNP
  }

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。