17+ TME文章提供单细胞注释新思路

古勿 生信人 2023-07-03 07:01 发表于北京

Morning,guys!今天小编跟大家分享一篇5月份 Nature Communications发表的肿瘤免疫微环境(TME)相关的单细胞文章,跟经典的单细胞注释方法不同的是,这篇文章通过整合多种癌症的scRNA-seq 数据集,构建了与细胞类型、细胞状态和信号通路相关的元组分MeCs,用来注释TME中的细胞状态,并识别关键的转录调控因子,弥补了使用marker基因注释细胞在分辨率和一致性方面的不足。


图片


一、说在前面

TME中癌细胞与非癌细胞之间的相互作用在肿瘤进展和治疗反应中扮演着重要角色,因此,对TME中细胞亚型的识别也尤为重要。小伙伴应该都知道,目前的单细胞注释方法可分为自动注释和人工注释两大类。自动注释通过使用来自数据库或文献的marker gene列表,或经过专业注释的参考数据集对新的单细胞数据进行注释。人工细胞注释则是对单个细胞的表达进行挖掘,基于专业的生物学背景知识进行细胞注释。前者准确度有限,后者耗时耗力,对专业要求高,抛开这些缺点不说,这两种方法都依赖于marker基因,在不同的癌症队列中缺乏一致性。因此,这篇文章采用了更宽泛、更能代表细胞状态的组分来定义细胞。


二、方法简介

研究使用MAESTRO处理了TISCH数据库中的单细胞数据集,得到了包含27种癌型的200多万个细胞,并将细胞根据癌型和注释标签分成了93个集合。文章基于不同集合间的相似组分构建了元组件- MeC,MeC是MetaTiME的内核,在生物学上可以理解为细胞类型、细胞状态和信号活性。MetaTiME首先对scRNA-seq数据按照标准程序进行处理,包括归一化、对数转换、使用 Harmony去除批次效应、构建相邻图、聚类和UMAP可视化。然后,MetaTiME利用TME细胞的表达矩阵进行注释,分析结果包括每个细胞的 MeC特征得分和每个亚群富集的MeC状态以及富集得分。注释之后,MetaTiME对不同条件下的肿瘤 scRNA-seq 数据进行特征差异分析,为每个簇提供富集的 MeC,并用最富集的 MeC 命名每个簇。此外,对于每个MeC,研究还为调控前100个基因的TFs进行评分。


图片图1. MetaTiME流程


三、主要结果
1、MetaTiME识别MeCs
如图1所示,MetaTiME的工作流程包括三部分:识别MeC,解释MeC和注释细胞状态。MeC识别阶段是从共享相似细胞特性的多个单细胞量度中检测可重复的变异源;MeC的解释需要使用生物标志物数据库、通路信息以及染色质分析数据;在注释阶段,用户使用 MetaTime将 MeCs 映射到自己的肿瘤 scRNA-seq 数据集上,以获得带注释的细胞状态和特征。在MeC识别阶段,MetaTiME使用独立成分分析 (ICA)分解每个数据集的表达矩阵,最大化基因表达组分之间的相互独立性,并根据权重过滤独立组分 (IC),最后得到了 86 个训练 MeC(图 2.a)。

每个 MeC 代表一个独立的转录变异来源,通常存在于 TME 中。通过查看 MeCs 中排名靠前的基因,作者发现 MeCs反映了TME 中的常见生物学过程,具有高度的可解释性。例如,来自最大IC簇的MeC高度富集ISG15、IFI6、LY6E和MX1等干扰素反应基因,表明潜在的干扰素反应是肿瘤样本中最常见的转录变异来源(图2.a-b)。值得注意的是,每个MeC的top基因都富含已知的生物标志物或调控子,例如,几个 T 细胞相关的MeCs识别在 T 细胞中共表达的基因模块,反映了不同T细胞相关过程的激活(图 2.c)。

研究利用z权重高的基因来对MeC进行功能注释,发现 86 个 MeCs表现出了与细胞类型、细胞状态和信号通路活动相对应的基因表达模式,描绘了TME中非癌细胞的状态(图 2)。细胞类型MeCs的top genes与已知的谱系特异性markers相匹配,包括B细胞的CD74、CD79A、MS4A1,T细胞的 CD3D、CD8A、CD8B,以及 CD14 +单核细胞的 LYZ、VCAN、S100A9(图2.b,2.d)。作者将86个注释后的MeC分成了六个细胞谱系和一个信号通路:B cells、T/NK cells、Dendritic cells、Monocytes/macrophages、Stroma cells、Other myeloid cells和Pan-cell Signaling。其中,B细胞谱系有6个MeCs;T细胞谱系有20个 MeCs,涵盖 CD8 T 细胞、CD4 T 细胞和NK细胞;树突状细胞谱系有4个MeCs;单核细胞和巨噬细胞有12个相关的 MeCs;髓系细胞有3个MeCs,涵盖血小板、红细胞和肥大细胞;基质细胞有6个MeCs,涵盖成纤维细胞、肌成纤维细胞和内皮细胞;信号通路中有35个MeCs(图 2.b)。而且,这些MeCs中的基因表达具有高度的特异性(图 2.d)。

图片
图2. 解释MeC

2、MetaTiME注释细胞状态和特征
MetaTime提供了一个工具包用来识别scRNA-seq TME数据中的MeC特征和富集的细胞状态。MetaTiME注释工具包将归一化和标准化后的 scRNA-seq表达矩阵作为输入,将每个细胞映射到训练的MeC空间,为预定义的细胞簇注释最显著富集的细胞状态。研究对一个基底细胞癌的单细胞数据集进行了注释(图3.a),可发现耗尽的 CD8 T细胞和滤泡辅助性T细胞之间的差异(图3.c)。结果表明,显著富集的细胞状态与原始研究中的人工注释结果相匹配(图3.b),且具有更高的分辨率和相应marker的高度表达(图 3.d)。有趣的是,MetaTiME不仅注释出了 CD8 T 细胞和 CD4 T 细胞亚型,而且还将细胞进一步细分为在增殖、细胞毒性、衰竭水平等方面具有极化表达的细胞状态,B 细胞群进一步分为不同的 B 细胞发育状态,包括具有细胞周期和 MYC 活性的 B 细胞簇(图 3.a-b)。因此,研究使用MetaTime重新注释了所有肿瘤 的scRNA队列,并分析了细胞状态在癌症队列中的分布。如图3.e所示,肿瘤具有高度异质性,TME 细胞组成仅在一定程度上由癌症类型决定,例如,胆管癌高度富含基质细胞。此外,膀胱癌、乳腺癌和皮肤癌等肿瘤高度浸润 MeC-12、GZMK + CCL5 + CD8 T 细胞状态,这表明免疫浸润是样本依赖性的。

图片
图3. MetaTiME注释细胞状态

3、差异 MetaTiME 分析
作者选择了两个 ICB 数据集,一个是基底细胞癌 (BCC) 数据,样本来自 ICB 治疗前后,另一个是膀胱癌 (BLCA)数据,样本来自 ICB 反应者和无反应者。研究旨在通过比较不同样本中MeC特征的差异,以了解ICB治疗期间的免疫反应。作者使用 MetaTime 应用于每个簇的细胞状态注释和每个细胞的 MeC特征评估,使用双侧t检验筛选在不同状况下差异表达的MeC特征。在 ICB 治疗前后的比较中,发现在ICB治疗后的样本中,细胞毒性 T 细胞和 B 细胞MeC的表达水平更高,一些单核细胞和巨噬细胞状态在 ICB 处理后受到抑制(图4.a)。值得注意的是,与 BLCA ICB队列中的应答者相比,IL1B阳性巨噬细胞特征在无应答者中升高(图4.b)。由于IL1B通路的激活是炎症过程的已知调节因子,因此,研究使用TCGA数据集来分析IL1B阳性巨噬细胞特征是否与炎症过程相关,发现 IL1B 特征的较高表达与多种癌症的较低存活率相关,尤其是在低级别胶质瘤 (LGG) 和肾细胞癌 (KIRC)中,这表明具有 IL1B 通路激活的巨噬细胞状态与不良预后和较低的 ICB 疗效有关。

由于特定的骨髓细胞状态与癌症存活和治疗反应相关,研究系统地表征了与单核细胞和巨噬细胞相关的MeCs。在合并相似的状态后,MetaTiME的十二 种单核细胞和巨噬细胞相关的MeCs总结为了六种单核细胞或巨噬细胞状态, 单核细胞分为CD14 + 和CD16 +两类,巨噬细胞相关的四种MeCs是C1Q + 、SPP1 + 、富含脂质和 IL1B +,此外,还有两种代表干扰素和 MHC-II 信号通路的MeCs,在巨噬细胞中观察到的频率较低(图4.c)。同之前通过maeker genes定义肿瘤相关巨噬细胞的研究相比, MetaTime 定义的巨噬细胞 MeCs反映了与所选标记基因的共表达关系,并且揭示了其他不同的成分。为了研究不同巨噬细胞状态之间的功能差异,作者对MeC的top基因做了GSEA分析,发现不同巨噬细胞状态的代谢具有异质性(图4.d)。例如,葡萄糖代谢和糖基化途径在 SPP1 + 巨噬细胞中高度活跃,而溶酶体和吞噬体活性在 C1Q + 巨噬细胞中最为丰富,溶酶体和胆固醇代谢,在富含脂质的状态下富集,炎症性 IL1B 和 NFkB 通路在 IL1B + 巨噬细胞中高度活跃。此外,几种巨噬细胞状态与细胞信号传导有关,如C1Q + MeC 具有 C1QA、C1QB 和 C1QC,这些补体分子家族的成员可能在慢性炎症中具有双重功能。

图片
图4. 差异特征分析

4、肿瘤免疫的转录调节因子
文章接下来研究了调节MeCs 的转录因子 (TFs),并假设 MeCs 子集中基因的共表达是通过TF的调节来决定的。研究使用之前开发的软件Lisa来预测调节每个MeC top genes的TF,并将 Lisa 的预测得分与 MeC的 z 权重进行比较。研究发现,对于许多 MeC,相同的TFs既被预测为MeC的调节因子又在MeC中高度表达。但是,被Lisa预测为MeC调节因子的TF通常并不具有高MeC z-权重,并且具有高 MeC z-权重的 TF并不总是具有高 Lisa得分。在干扰素反应信号通路MeC-0中,STAT1具有很高的z-weight,并且Lisa也将 STAT1列为top调节因子,这与STAT1被称为干扰素反应的主要调节因子相一致(图5.a)。几个谱系定义的TFs表现出自调节模式,包括浆细胞样树突状细胞中的 TCF4和浆细胞中的 XBP1(图 5.b)。巨噬细胞相关的MeCs由CEBPB等髓系TFs和与免疫刺激反应相关的TFs调控。MeC-37代表富含脂质的巨噬细胞,在MeC-37中,虽然PPARG居于Lisa预测的top调节因子之列(图5.c),但 PPARG的 z-权重并不高,但排名靠前的共表达基因确实富集在PPARG信号通路中(图4.d),可能是因为 PPARG是通过其配体进行调节的。

研究还发现糖皮质激素受体 (GR)信号与 MeC-20、CXCL13 + Tfh 的调节有关,GR 在MeC 和 Lisa 评分中是排名最高的TF(图5.d)。MeC-20和CXCL13 + Tfh中的top基因包括几个GR的直接靶基因,如SRGN和FKBP5。研究在CXCL13基因的启动子和增强子位点附近观察到了GR的直接结合,这些增强子在B细胞系Nalm6、单核细胞系THP1和癌细胞系等多个细胞系中是保守的。此外,在另一种分泌CXCL13的细胞状态 MeC-40(CXCL13 + 耗尽的CD8 T 细胞)中,GR 在 Lisa 和 MeC评分中的排名也比较靠前(图 5.d)。基于此,研究认为GR可能是耗竭的 CD8 T细胞以及CD4 T 滤泡辅助 T 细胞中 CXCL13分泌细胞状态的转录驱动因素,GR通路可能是肿瘤免疫调节的候选靶点。

图片
图5. MetaTiME优化肿瘤免疫转录调控因子

四、说在最后
总的来说,这篇文章开发了MetaTiME工具包,构建了86个具有生物学涵义的MeCs,通过将TME scRNA-seq表达矩阵映射到 MeC 空间,我们可以描绘TME 转录程序和细胞状态的功能景观,也可以将细胞进行更细致的划分,为挖掘潜在的免疫治疗靶点提供了新思路。想要代码的小伙伴可自行去https://github.com/yi-zhang/MetaTiME获取吆,have a nice day!

考文献
Zhang Y, Xiang G, Jiang AY, Lynch A, Zeng Z, Wang C, Zhang W, Fan J, Kang J, Gu SS, Wan C, Zhang B, Liu XS, Brown M, Meyer CA. MetaTiME integrates single-cell gene expression to characterize the meta-components of the tumor immune microenvironment. Nat Commun. 2023 May 6;14(1):2634. doi: 10.1038/s41467-023-38333-8. PMID: 37149682; PMCID: PMC10164163.

往期热点 (点击标题跳转)

01

线粒体质量控制

02

孟德尔随机化

03

成纤维细胞(CAFs)

04

单细胞空间转录组

05

肿瘤相关巨噬细胞(TAM)

06

细胞死亡

07

耐药



图片

课题设计 | 组学测序 |生信分析

培训工具 | 热点互动 | 资源互换


图文排版|CY

文章转载请联系 | 15510012760(微信)

广告商务合作 | 18501253903(微信)



微信扫一扫
关注该公众号