生物信息学-miRNA
转录组的分类:
Noncoding RNA可分为负责Regulatory和housekeeping,housekeeping就是组织日常功能miRNA便是Regulatory RNA中的一种,长度18-22bp,具有短序列特异性,数量少于lncRNA,在相关物种中保守,20%-30%的miRNA可通过对non-coding RNA的靶向结合,达到调控编码蛋白质过程,从而调控制造蛋白质。
miRNA参与生命活动,RNAi(RNA interference)是miRNA的一种调节机制。与miRNA调控RNA相对应的便是siRNA的调控RNA的过程。
siRNA人根据已知的mRNA外源合成的non-coding RNA,它可以match到target mRNA,从而控制mRNA,对其进行切割降解。
而miRNA是内源产生的,它比较灵活,可以match到原本mismatch的mRNA上,从而抑制mRNA翻译。
动物中生成miRNA机制是在核内由pri-miRNA生成pre-miRNA,将pre-miRNA运至核外时,对miRNA利用两种酶进行切割并复制臂上miRNA。如下图
植物中生成miRNA机制是在核内由pri-miRNA生成pre-miRNA,再利用同一种酶对两臂进行切割,从而复制臂上miRNA,存在两个出核分支。如下图
Oncomirs是与肿瘤相关的miRNA,可作为疾病诊断的分子标准物。
eg:当该分子下降时提示某种癌症患者预后不好
Eg:当位于同一个分子通路中的两种miRNA变化相反时,提示某种癌症患者预后情况
常见的Databases有miRBase,PMRD和TargetScan等。其中,miRBase是最大的database。research时,可以通过cluster,expression或sequence判断未知核酸序列是否为miRNA。在查阅时,可查看改miRNA的树形发育图,如果是pri-miRNA则小写mir,pre-miRNA大写miR;
PMRD是plant microRNA database,TargetScan用于预测可能的靶基因,靶基因就是mRNA,也可以使用online resource查询某些miRNA的信息。
以miRNA-8485为例,说明证明新miRNA需要判断该序列有无茎环结构,长度是否符合标准,及加工体系的特点,证明出新miRNA后,可以分析其调控作用。
常用的寻找新miRNA的Software如下图所示:
预测新miRNA有以下两种原理:
原理一是non-sequencing,即直接在库中利用sequence找相似miRNA的片段,根据该片段序列对应的结构信息,推测该miRScan的结构,从而得到该未知miRNA的茎环结构、茎环范围、五连体、凸起和额外pair sequence的信息。
原理二是sequencing,即因为NGS的推广而出现的miRNA-seq,通过bioinformation来得到其表达谱,identify存在的miRNA或预测新的miRNA,最后预测target mRNA。现在普遍采用原理二。miRNA-seq如下图:
分析流程:
miRDeep用于发现新miRNA,可通过搜库找到match多的区域,在该区域中抽取sequence,这些sequence可用来预测二级结构,比如是否有茎环结构
在预测target mRNA方面,plant的预测结果更好,而animal 需要匹配seed regions,该区域大概有2-8pb,可利用自由能或G-U pairs, mismatches或gaps的限制性个数,或高保守区域得分来判定预测结果的可信度,经典target site如图所示:1.canonical的5’端;2.seed region;3.3’端,
预测miRNA target常用软件:
因为miRNA存在可变剪接体,所以有多种类型的miRNA。