find_circ 通过识别junction reads 来预测circRNA
和参考基因组比对完之后,首先剔除和基因组完全比对的reads,保留没比对上的reads, 这部分reads 直接比是比对不上基因组的,因为其来自不同的外显子区域,直接比对的话不允许这么大片段的缺失,那么如何区分剪切的spliced read 和 来自环状RNA的junction read呢,从上面的示意图我们可以直接看出,spliced read 的两部分比对在基因组上的前后位置和转录本中的位置保持一致,而来自circRNA的junction read 其比对的位置是相反的;具体操作的时候,首先从junction read的5'端和3'端取一部分序列,分别叫做5' anchor 和 3" anchor, 如果两个序列比对的位置是相反的,这条reads 就是一个可能的junction read, 然后将anchor read 一直延伸,直到连接处为止,如果到连接处为止序列都能够完全匹配,再看连接点处的剪切模式是否符合AG-GT的剪切模式,如果以上条件都满足,就认定这是一个circRNA
通过对不同组织中的circRNA 进行预测,发现不同组织中存在的circRNA的数量和种类是有差别的,就是说circRNA 具有组织特异性
对人的不同的细胞系进行环状RNA的预测,发现不同细胞系中存在的circRNA的数量和种类都是有差异的,说明circRNA 具有组织特异性;
预测得到的circRNA如何验证:
以上面的circRNA 为例,通常为扩增这一区域的线性RNA, 我们采用的引物都是Convertgent 所示的方向,但是为了扩增circRNA, 引物的方向应该是Divergent 方向
通过电泳的结果可以看到,对于cDNA , 使用Divergent 方向的引物可以扩增出circRNA 片段,而对于基因组DNA(gDNA), 则扩增不出对应的片段来