有没有办法使用 BioPython 将 FASTA 文件转换为 Genbank 格式?关于如何从 Genbank 转换为 FASTA 有很多答案,但反过来不行。
最佳答案
在转换之前,您必须将字母表分配给序列(DNA 或蛋白质)
from Bio import SeqIO
from Bio.Alphabet import generic_dna, generic_protein
input_handle = open("test.fasta", "rU")
output_handle = open("test.gb", "w")
sequences = list(SeqIO.parse(input_handle, "fasta"))
#asign generic_dna or generic_protein
for seq in sequences:
seq.seq.alphabet = generic_dna
count = SeqIO.write(sequences, output_handle, "genbank")
output_handle.close()
input_handle.close()
print "Coverted %i records" % count
对于输入:
>I28Q9A102FII8J 等级=0668881 x=2144.0 y=1105.0 长度=418
ACGTCATGAGAGTTTGATCATGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGATGAA
GCTCCAGCTTGCTGGGGTGGATTAGTGGCGAAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTCTGGGAT
AAGCGTTGGAAACGACGTCTAATACCGGATATGACGACCGATGGCATCATCTGGTTGTGGAAAGAATTTTGGTC
AAGGATGGACTCGCGGCCTATCAGGTAGTTGGTGAGGTAATGGCTCACCAAGCCTACGACGGGTAGCCGGCCTG
AGAGGGTGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGGAATATTGCA
CAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGGGATGACGGCC
>I28Q9A102JMH72 秩=0320459 x=3829.0 y=3120.0 长度=512
ACGTCATGAGAGTTTGATCCTGGTCTCAGGATGAACGCTAGCGGCAGGCTTAACACATGCAAGTCGAGGGTAGAA
ATAGCTTGCTATTTTGAGACCGGCGCACGGGTGCGTAACGCGTATGCAATCTGCCTTTTACAGGGGAATAGCCC
AGAGAAATTTGATTAATGCCCCATAGCGCTGCAGGGCGGCATCGCCGAGCAGCTAAAGTCACAACGGTAAAGA
TGAGCATGCGTCCCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCGATGATGGGTAGGGTCCTGAGAGGG
AGATCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGG
GCGCAAGCCTGAACCAGCCATGCCGCGTGCAGGATGAAGGCCTTCGGGTTGTAAACTGCTTTTGACGGAACGAA
AAAGCT
你得到:
LOCUS I28Q9A102FII8J 418 bp DNA UNK 01-JAN-1980
定义 I28Q9A102FII8J 等级=0668881 x=2144.0 y=1105.0 长度=418
接入I28Q9A102FII8J
版本 I28Q9A102FII8J
关键词。
来源 。
有机体。
.
特点位置/预选赛
起源
1 acgtcatgag agtttgatca tggctcagga cgaacgctgg cggcgtgctt aacacatgca
第61话
第121话
第181话
第241话
第301话
第361话
//
LOCUS I28Q9A102JMH72 450 bp DNA UNK 01-JAN-1980
定义 I28Q9A102JMH72 秩=0320459 x=3829.0 y=3120.0 长度=512
接入I28Q9A102JMH72
版本 I28Q9A102JMH72
关键词。
来源 。
有机体。
.
特点位置/预选赛
起源
1 acgtcatgag agtttgatcc tggctcagga tgaacgctag cggcaggctt aacacatgca
第61话
第121话
第181话
第241话
第301话
第361话
第421话
//
关于biopython - 将 FASTA 转换为 GenBank,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30181545/