TCDB是对膜转运蛋白(Membrane Transport Protein)进行分类的一个数据库,它制定了一套转运蛋白分类系统(Transporter Classification), 简称TC System, 类似于对酶进行分类的EC系统,只不过TC系统同时提供了功能和进化信息;
TCDB对于每一个转运蛋白家族,提供了一个TC Nmuber, TC Number 由小数点分隔的5为数字或者字母构成
目前TCDB提供了超过800个转运蛋白家族, 包含10000多条唯一的蛋白质序列和10000多篇文献
数据库网址如下:
http://www.tcdb.org/
对于整个TC 分类系统而言,包含5个层级的分类,所以TC Number 包含5个数字或者字母, 每个数字或字母实际代表某一个层级的分类结果,第一级分类包括以下几个大类:
http://www.tcdb.org/browse.php
点击左侧的+,可以对某个具体的分类进行展开,这样就可以看到其包含的具体的分类系统
对于TCDB而言,是可以免费下载的,下载的链接如下:
http://www.tcdb.org/download.php
点击 TCDB FsatA Sequences 超链接,下载所有的序列,下载下来的序列内容如下:
>gnl|TC-DB|1001796365|4.F.1.1.5 CDP-alcohol phosphatidyltransferase [Marinobacter excellens]
MDSIRPATFQIPAAVRELGWAALLLFFVLLSVHEWFSPPGWFGLLAILIFATQGALILTR
WPARQNFGWANRTTLLRSILVVSLVAWAPFLPAADSSALWIYGVACLIALILDGVDGKVA
RATNSNSEFGARFDMELDALFIFGLCVATMAIGKAGPWVLMLALMRYAFLAASHFLTWLN
QPLPDSFRRKTVCVWQVVTLMIAILPPTPTGFAGTTLAMALALLGWSFALDVRWLYQRRH
YHEN
在序列标识符中,1001796365 代表该蛋白质序列在GeneBank 数据库中的编号, 4.F.1.1.5 是TC Number, 代表该蛋白质所属的转运蛋白家族,CDP-alcohol phosphatidyltransferase 是对该转运蛋白家族功能的具体描述,[Marinobacter excellens] 是该蛋白序列的来源物种
有了fasta序列之后,我们可以对序列进行TCDB的功能注释了
TCDB还提供了TCID 与其他数据库的关联,点击ID Mapping 超链接,可以看到下图:
以GO 数据库为例,go.tsv 文件中的部分内容如下:
GO:0008076 1.A.1.1.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005249 1.A.1.1.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0006813 1.A.1.1.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0008076 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005515 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005249 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0006813 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0055085 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0043005 1.A.1.3.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0043025 1.A.1.3.1 Voltage-gated Ion Channel (VIC) Superfamily .
可以看到保存的实际是TC Number 和 GO的对应关系,其他的文件内容是类似的,只不过link的数据库不一样。