我想知道是否有办法从 uniprot 蛋白质 id 中获取蛋白质序列。我确实检查了一些在线软件,但它们允许一次获得一个序列,但我有 5536 个 vlues。 biopython中是否有任何包可以做到这一点?
最佳答案
Uniprot 的所有序列都可以从“http://www.uniprot.org/uniprot/”+ UniprotID +.fasta 访问。您可以获得任何序列
import requests as r
from Bio import SeqIO
from io import StringIO
cID='P04637'
baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)
Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))
cID 可以是列表或单个条目,如果您循环访问错误列表,只需在下载之间添加延迟,尽量不要使服务器饱和。希望能帮助到你
关于python - 来自uniprot蛋白质id python的蛋白质序列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52569622/