TCDB是对膜转运蛋白(Membrane Transport Protein)进行分类的一个数据库,它制定了一套转运蛋白分类系统(Transporter Classification), 简称TC System, 类似于对酶进行分类的EC系统,只不过TC系统同时提供了功能和进化信息;

TCDB对于每一个转运蛋白家族,提供了一个TC Nmuber, TC Number 由小数点分隔的5为数字或者字母构成

TCDB 数据库简介-LMLPHP

目前TCDB提供了超过800个转运蛋白家族, 包含10000多条唯一的蛋白质序列和10000多篇文献

数据库网址如下:

http://www.tcdb.org/

对于整个TC 分类系统而言,包含5个层级的分类,所以TC Number 包含5个数字或者字母, 每个数字或字母实际代表某一个层级的分类结果,第一级分类包括以下几个大类:

http://www.tcdb.org/browse.php

TCDB 数据库简介-LMLPHP

点击左侧的+,可以对某个具体的分类进行展开,这样就可以看到其包含的具体的分类系统

对于TCDB而言,是可以免费下载的,下载的链接如下:

http://www.tcdb.org/download.php

TCDB 数据库简介-LMLPHP

点击 TCDB FsatA Sequences 超链接,下载所有的序列,下载下来的序列内容如下:

>gnl|TC-DB|1001796365|4.F.1.1.5 CDP-alcohol phosphatidyltransferase [Marinobacter excellens]
MDSIRPATFQIPAAVRELGWAALLLFFVLLSVHEWFSPPGWFGLLAILIFATQGALILTR
WPARQNFGWANRTTLLRSILVVSLVAWAPFLPAADSSALWIYGVACLIALILDGVDGKVA
RATNSNSEFGARFDMELDALFIFGLCVATMAIGKAGPWVLMLALMRYAFLAASHFLTWLN
QPLPDSFRRKTVCVWQVVTLMIAILPPTPTGFAGTTLAMALALLGWSFALDVRWLYQRRH
YHEN

在序列标识符中,1001796365 代表该蛋白质序列在GeneBank 数据库中的编号, 4.F.1.1.5 是TC Number, 代表该蛋白质所属的转运蛋白家族,CDP-alcohol phosphatidyltransferase 是对该转运蛋白家族功能的具体描述,[Marinobacter excellens] 是该蛋白序列的来源物种

有了fasta序列之后,我们可以对序列进行TCDB的功能注释了

TCDB还提供了TCID 与其他数据库的关联,点击ID Mapping 超链接,可以看到下图:

TCDB 数据库简介-LMLPHP

以GO 数据库为例,go.tsv 文件中的部分内容如下:

GO:0008076      1.A.1.1.1        Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005249 1.A.1.1.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0006813 1.A.1.1.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0008076 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005515 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0005249 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0006813 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0055085 1.A.1.2.2 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0043005 1.A.1.3.1 Voltage-gated Ion Channel (VIC) Superfamily .
GO:0043025 1.A.1.3.1 Voltage-gated Ion Channel (VIC) Superfamily .

可以看到保存的实际是TC Number 和 GO的对应关系,其他的文件内容是类似的,只不过link的数据库不一样。

05-11 22:38