python将fasta文件均分

step1:将fasta均分为N个文件,每个文件序列数目相等

参考这篇文章:https://blog.csdn.net/whiteof/article/details/123685985

输出结果中每条序列格式均为:id:squence

step2:调整输出fasta格式,将id和sequence分行

import sys

infile, outfile = sys.argv[1], sys.argv[2]

def change_fasta(infa, outfile):

    outf = open(outfile, "w")

    faf = open(infa, "r")

    f = faf.readlines()

    for line in f:

        newline = line.replace(':', '\n')

        outf.write(newline)

change_fasta(infile, outfile)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容