我想知道是否有办法从 uniprot 蛋白质 id 中获取蛋白质序列。我确实检查了一些在线软件,但它们允许一次获得一个序列,但我有 5536 个 vlues。 biopython中是否有任何包可以做到这一点?

最佳答案

Uniprot 的所有序列都可以从“http://www.uniprot.org/uniprot/”+ UniprotID +.fasta 访问。您可以获得任何序列

import requests as r
from Bio import SeqIO
from io import StringIO

cID='P04637'

baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)

Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))

cID 可以是列表或单个条目,如果您循环访问错误列表,只需在下载之间添加延迟,尽量不要使服务器饱和。希望能帮助到你

关于python - 来自uniprot蛋白质id python的蛋白质序列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52569622/

10-12 20:08