转录本(transcript)长度范围  到

--3216021----

3UTR                       stop_codon                      CDS3         |      |           CDS2       |      |           CDS1                       start_codon                     5UTR

|      |                           |      |

3214482------------------------------------------------------------3216968----3421702--3421901----3670552-----------------------------------------------------------3671498

exon3(3UTR,stop_codon, CDS3)                                    exon3(CDS2)                                      exon1(5UTR,stop_codon, CDS1)

解释 transcript、UTR、stop_codon、exon、CDS、start_codon关系

CDS,是编码一段蛋白产物的序列。cds必定是一个orf。但也可能包括很多orf。反之,每个orf不一定都是cds。
开放阅读框(ORF)是基因序列的一部分,有内含子的,且包含一段可以编码蛋白的碱基序列。由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列编码一个蛋白。OEF排除内含子就是CDS

25、转录本(transcript)组成(gtf文件的第三列)-LMLPHP

05-02 20:18