ATAC-seq(下)

生信技能树 2024-01-19 22:22

编者荐语:

上中下三篇终于集齐了!

上一期《ATAC-seq分析(中)》的分享,我们主要是通过motif筛选染色质开放区域可能结合的转录因子(TFs);也通过FIMO回头看了特定TFs能够可能作用的基因。通过上述分析,我们便可预测到目标TF和他们下游的靶基因。但是,一般而言,下游靶基因可能有成百上千了,那么,如何精准筛选到互作关系密切的几个关键基因呢?这一期,我们浅谈一下我对下游分析的一些认识,供大家参考学习,欢迎评论留言讨论新的研究思路!

1.RNA-seq与ATAC-seq联合分析

染色质以紧密缠绕的形式存在,当基因要进行转录的时候,紧密缠绕的染色质则会松散开来,ATAC测序其实是利用Tn5转座酶将细胞核内松散的染色质区域切割开来,从而对细胞中正在转录中的区域进行DNA序列测序。即,其主要的目的是研究正在转录的那部分DNA序列,这些DNA序列大部分位于转录本区域的上下游区域,我们可以利用这些区域对一些基因上的顺式调控元件进行研究。最常见的一种分析手段就是通过注释开放区域,对其进行motif分析,筛选出这些区域可能作用的转录因子。至于为什么想到寻找TFs,因为基因的表达离不开转录因子对转录起始位点的识别和启动。另外,某一关键TF作用那些下游调控基因,一方面可通过在线数据库进行分析;一方面通过ATAC-seq/ChIP-seq的motif分析;另一方面就是RNA-seq。联合转录组测序结果,可以从整体分析DNA转录为RNA的变化过程,进而对相关基因进行功能分析。这里推荐两篇典型文献的思路:

1)Integration of ATAC-seq and RNA-seq Unravels Chromatin Accessibility during Sex Reversal in Orange-Spotted Grouper (Epinephelus coioides)


图片

文章链接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7215633/

2)Integration of RNA-seq and ATAC-seq identifies muscle-regulated hub genes in cattle 
图片

文章链接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9404375/

简言之,这一类文章的思路就是通过两种不同组学对性状差异进行分析,最后通过Overlapping这两种组学的结果,筛选出差异表达基因。再结合GO和KEGG功能分析,筛选出与表型差异密切相关的靶基因进行后期的实验验证。

2. ATAC-seq与ChIP-seq的联合分析

ChIP-seq主要用于研究组蛋白修饰和转录因子直接作用的DNA序列。组蛋白修饰位点往往与转录调控的顺式作用元件紧密相关,是一种重要的表观调控方式;而染色质的可及性则是转录激活的重要表征。因此,联合ChIP-seq及ATAC-seq描绘表型差异的表观调控图谱,可为研究表型差异的调控机制提供试验基础。

图片

该图来自NC的一篇文章“Core transcription regulatory circuitry orchestrates corneal epithelial homeostasis”,作者把几种常见的组蛋白修饰和ATAC数据进行了比较分析,发现ATAC-seq鉴定的染色质开放区域主要分布在基因间区和内含子区,部分存在于promoter区;右图作者对ATAC激活的启动子区域和增强子区域对应的组蛋白修饰水平进行了比较分析,发现激活的启动子区域具有高水平H3K27ac和H3K4me3修饰,低水平H3K4me1修饰(I);激活的增强子区域:高水平H3K27ac和H3K4me1修饰,低水平H3K4me3修饰(II);H3K27me3似乎与ATAC的结果无关。通过这样的比较分析,我们很容易将组蛋白修饰与ATAC的数据进行联合,从而筛选到我们关注的增强子区或启动子区对应的组蛋白修饰调控的基因。再将筛选到的基因放到IGV浏览器中,直观地展示了靶基因的染色质可及性及组蛋白修饰水平之间的相关性。图片

同样地,这样获取到的靶基因可能成百上千,如何找到我们关注的几个基因?哈哈,这里又要用到GO、KEGG和GSEA分析了。

图片
 GO结果展示
图片
KEGG结果展示
图片
GESA分析结果展示

这些分析做完,我们就能锁定要研究的信号通路和功能基因了,当然,我们还是想继续寻找核心因子,这个时候可以结合PPI网络分析,最终靶定到核心因子:图片

3.结合WGCNA分析获取hub基因 

通过上述的分析,我们很容易找到要关注的转录因子和靶基因,这个再结合WGCNA分析,去看一下我们要关注的转录因子和靶基因是否与我们想关注的性状密切相关,进一步对上面的分析结果做一个验证。至此,我想上游基因的筛选工作就算比较完整了吧,后面就是实验验证了。图片图片


微信扫一扫
关注该公众号