1、基因系列中的data索引
2、基因ID之间的转换
对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自如。
今天主要记录几个ID转换的方式:
以果蝇为例
详细的了解阅读下面:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README
1、从NCBI下载基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Invertebrates/Drosophila_melanogaster.gene_info.gz
从中可以看到很详细的各种基因信息
2、从NCBI下载基因与其他ID转换的信息:
一、转refseq:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2refseq.gz
二、转ENSG:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2ensembl.gz#TCGA小工具ENSG转换由此而来
三、转uniprot:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
四、转unigene:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2unigene
五、基因与GO的对应关系:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2go.gz
3、使用ID_Mapping:http://www.uniprot.org/uploadlists/
4、提取lncRNA的看这里:https://www.shengxin.ren/question/23
以上是数据原始信息,可以根据以上信息提取整理,应付各种常见的基因ID转换基本没啥问题了