RNA-seq这个工具该什么时候用?ATAC-seq该什么时候用?有相当一部分项目设计不行,导致花大钱测了一些没有意义的数据。
还是在中心法则这个框架下来解释,这是生物信息的核心。打开华大科技服务官网梳理一下现在到底都有些什么测序技术:
- 全基因组测序和重测序 - 组装以及寻找变异 (外显子和目标区域测序)
- RNA-seq测序 - 基因表达 (smRNA,lncRNA,circRNA,PB全长,可变剪切)
- 甲基化测序
- ChIP-seq和ATAC-seq
- 蛋白组 - 所有蛋白的变化
- 代谢组 - 植物尤其是茶叶经常用
- 免疫组库测序 - TB细胞
- 单细胞
- 三维基因组测序
测序只是一种工具,关键是研究问题的逻辑,如何将关键的问题讲成一个让人感兴趣的故事。多看看文章解读,看别人是如何设计实验的。
survey,发育,疾病,调控。
这篇综述的语言好晦涩,实在是难以下咽。
对DNA的物理接触是染色质的一个高度动态的特性,在建立和维持细胞特征方面具有重要的作用。epigenome是指DNA序列不发生变化,但是组蛋白和结构发生变化,从而对基因的初始表达进行调控。DNA甲基化和组蛋白修饰。
基因组上的染色质可访问性的组织反映了物理上的相互作用的网络,通过增强子,启动子,绝缘子和染色质结合因子协同调节基因表达。enhancers, promoters, insulators and chromatin- binding factors。不像基因表达那么单一,基本单位是基因;表观的主要基本单位最少有两个增强子和启动子。
可访问性的动态变化会根据外部刺激和动态发育而改变,已有证据表明可访问性的稳态的维持是通过染色质结合因子和核小体的竞争性的相互作用来调节的。(染色质结合因子和核小体是相互竞争与DNA结合的)
以下我们会研究基因组的可访问性是如何被测量的,以及如何探索转录因子在启动可访问性的重塑中的角色,我们的目标是说明染色质可访问性如何定义调控元素,以及这些表观特征是如何动态变化来调控基因表达。
Chromatin- binding factors:直接或间接与DNA结合的非组蛋白大分子
Transcription factor:一种直接与DNA结合的非组蛋白。
Architectural proteins:在染色质组织中起结构作用的蛋白质,包括连接蛋白和核心组蛋白,以及绝缘体蛋白。
Nucleosome occupancy:一个特定的DNA序列被核心组蛋白八聚体结合的时间。
Chromatin accessibility是指核酸大分子能够与染色质上的DNA进行物理接触的程度,由核小体的占据度和拓扑组织以及染色质结合因子与DNA的结合来决定。
nucleosome是染色质的核心结构原件,有组蛋白八聚体和147bp的DNA组成,
核小体的组成和转录后修饰反应了不同的功能状态和调节了染色质可及性,通过各种机制,比如改变转录因子(TF)结合和调节活性染色质重塑的核小体亲和力。
整个基因组中核小体的拓扑组织是不均匀的:它密集的排列在特定的和基本的异染色质上,组蛋白在调节基因座处被耗尽,包括增强子,绝缘体和转录基因体内。
核小体间DNA通常由TF,RNA聚合酶或具有接头组蛋白的构建蛋白结合,其促进高级染色质组织并调节DNA的进入。
核小体占据和接头组蛋白占据在整个基因组中具有不同的动态,形成了从闭合染色质到高度动态,可接近或允许的染色质的可及性连续体(图1)。
可接近的基因组包含约2-3%的总DNA序列,但捕获超过90%的由TF结合的区域。
除少数富含异染色质的TF外,ENCODE项目中调查的绝大多数TF几乎都与开放染色质结合。
TFs与组蛋白和其他染色质结合蛋白动态地竞争来调节核小体占据,并促进局部访问DNA; 反过来,细胞类型的可访问性环境调解TF结合。
对于多细胞系统,TF具有广泛的功能作用,在短时间尺度上提供转录的动态调节,并建立和维持共享共同基因组的细胞类型的持久表观遗传管道化。
因此,染色质可及性反映了聚集的TF结合和遗传基因座的调节潜力。
该观点为追踪确定细胞状态的转录调节因子的差异结合的可及性的变化建立了分析基础。
- DNase-seq
- ATAC-seq
- MNase-seq
- NOMe-seq
待续~