KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库;

KEGG Orthology 简称KO, 对于每个功能已知的基因,会把和其同源的基因所有基因都归为一类,就是每一个KO, 并赋予一个K number, 用该基因的功能作为这个KO的功能;

基于同源基因具有相似功能的假设,把每个基因的功能进行了扩充,对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology, 用该基因的功能作为该orthology 的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库

举一个例子,对于 K00161 这个K number 来说,对应的同源基因的列表可以从KEGG的官网查询得到

打开这个链接 http://www.genome.jp/kegg/ko.html , 在查询的文本框中输入K number, 如下图所示:

KEGG orthology (KO) 数据库简介-LMLPHP

点击Orthology table 按钮,跳转到下面的链接

http://www.kegg.jp/kegg-bin/view_ortholog_table?orthology=K00161

在该链接中,可以看到这个KO下对应的所有同源基因

KEGG orthology (KO) 数据库简介-LMLPHP

从下拉列表中,可以查询对应分类的同源基因,如之显示动物中的同源基因;

对于已知的基因,可以直接在数据库中检索得到对应的功能,那么对于新发现的基因,如何利用KO数据库来研究其功能呢?

根据同源基因的定义,序列相似度在80%以上的就定义为同源基因,同样的,对于功能未知的基因,只需要根据序列比对查找对应的功能已知的同源基因就可以了

但是现在没法免费下载得到KEGG Gene对应的序列了,好在KEGG官网提供了一个在线的工具,BlastKOALA

这个工具基于blast 比对,将输入的基因序列和KEGG Gene 数据库中的序列去比对,查找最佳匹配的一个gene, 将该基因对应的K number 赋予查询的基因

地址如下:http://www.kegg.jp/blastkoala/

首先在文本框中输入带查询的基因的序列

KEGG orthology (KO) 数据库简介-LMLPHP

第二步设置对应的物种信息,减少查询的物种范围

KEGG orthology (KO) 数据库简介-LMLPHP

第三步根据选择用于检索的基因集数据库

KEGG orthology (KO) 数据库简介-LMLPHP

最后输入邮箱地址,提交任务就可以了

KEGG orthology (KO) 数据库简介-LMLPHP

首先会给你的邮箱发一封邮件,你必须点击这个邮件中的链接才能开始工作,当结束后,会再发一封邮件给你;

KO 数据库只是研究基因功能的一个基础数据库,KEGG中还包含其他的基于基因功能构建的数据库,如Pathway, Brite, Module  数据库等,只有对KO数据库有一个清晰的认识,才能够去理解这些数据库。

04-21 06:09