bioawk

bioawk是awk的超集.

bioawk能额外解析的生物数据格式

$ bioawk -c help

  • bed:
    1:chrom 2:start 3:end 4:name 5:score 6:strand 7:thickstart 8:thickend 9:rgb 10:blockcount 11:blocksizes 12:blockstarts
  • sam:
    1:qname 2:flag 3:rname 4:pos 5:mapq 6:cigar 7:rnext 8:pnext 9:tlen 10:seq 11:qual
  • vcf:
    1:chrom 2:pos 3:id 4:ref 5:alt 6:qual 7:filter 8:info
  • gff:
    1:seqname 2:source 3:feature 4:start 5:end 6:score 7:filter 8:strand 9:group 10:attribute
  • fastx:
    1:name 2:seq 3:qual 4:comment

bed为常见的染色体位置格式

sam格式为比对结果的格式

vcf为突变结果格式

gff格式用的少

fastx为序列格式,包括fasta和fastq

示例

只取长度为166的序列

    bioawk -c fastx 'length($seq)==166{print "@"$name"\n"$seq"\n+\n"$qual}'  in.fq > out.fq
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • bioawk -c help bed:1:chrom 2:start 3:end 4:name 5:score 6...
    琼脂糖阅读 380评论 0 1
  • bioawk是李恒开发的基于linux awk的一个扩展工具。用过awk的都知道,它是一款逐行处理文本的古老编程语...
    popucui阅读 1,077评论 0 2
  • Introduction What is Bowtie 2? Bowtie 2 is an ultrafast a...
    wzz阅读 5,806评论 0 5
  • 早上洗漱完毕后,吃着昨晚买好的面包,随手打开了《人间世》第四集。昨天我已经看完了前三集,真实的场面拍摄带来强劲...
    空气公园阅读 723评论 0 3
  • 1、注册ShareSDK的账号 创建应用 创建应用 获取应用的App Key和App Secret 具体步骤参考官...
    Nicole__Zhang阅读 1,974评论 0 1