推荐活动

【Cell Research】北大汤富酬团队:一种长读单细胞ATAC测序方法,同步检测染色质可及性和遗传变异

首页 » 《转》译 2022-10-12 转化医学网 赞(3)
分享: 
导读
可访问的染色质区域(the accessible chromatin regions)在人类基因组调控元件(regulatory elements)中富集。通过对可访问的染色质区域的研究,科学家们已鉴定出许多与人类疾病相关的遗传变异。目前,对单个细胞内开放染色质区域进行检测的一种成熟方法是:通过下一代测序(NGS)平台,使用测序技术对转座酶可及性染色质(transposase-accessible chromatin)进行单细胞测定(即scATAC-seq)。  然而,这种方法依然面临着挑战:对于来自scATAC-seq的数据,若要进行单倍型定相(haplotype phasing)或探测其中的大规模结构变异(large-scale structural variations)——例如插入(insertions)、缺失(deletions)、重复(duplications)、反转(inversions)、异位(translocations)——依然存在难度。这些挑战可以通过基于第三代测序(TGS)平台的单分子长度测序(single-molecule long-read sequencing)进行解决。

为了将长读测序的优势整合到scATAC-seq中,北京大学生命科学学院生物医学前沿创新中心汤富酬教授团队开发了一种基于纳米孔测序平台的转座酶可及性染色质单细胞测定方法(scNanoATAC-seq)——该方法是一种基于微板的scATAC-seq方法,可以与TGS测序平台相兼容。相关研究成果于10月11日发表于Cell Research杂志。


https://www.nature.com/articles/s41422-022-00730-x


评估scNanoATAC-seq



为了评估scNanoATAC-seq在捕获单个细胞中染色质可及性方面的性能,研究团队在五种人类细胞系(GM12878,eHAP1,HEK293T,HFF-1和K562)以及人外周血单核细胞(PBMC)中测试了scNanoATAC-seq方法。此研究中,scNanoATAC-seq 文库的读取长度中位数范围为4000 bp至4900 bp。研究者使用转录起始位点(TSS)富集、片段数和读端的分数(FRIP)评估了scNanoATAC-seq方法产生的数据的质量。


GM12878细胞的scNanoATAC-seq读取端在TSS周围显示出强烈的富集模式和围绕CCCCTC结合因子(CTCF)结合位点的足迹,这与基于NGS的scATAC-seq数据中的相似。研究团队利用编码候选顺式调节元件(cCRE)来分析从基于NGS的scATAC-seq数据和基于TGS的SCNANOATAC-seq数据调用的GM12878细胞的峰分布。在scNanoATAC-seq峰中,发现CTCF纯元素和远端增强子样特征(dELS)的比例增加,而启动子样特征(PLS)和近端增强子样特征(pELS)的比例相对低于基于NGS的scATAC-seq,类似于基因区域注释的富集谱。在K562细胞和HEK293T细胞的峰中发现了一致的注释结果。当研究者使用cCRE集作为监管元素的基准来评估峰值调用的精度和召回率时,基于NGS的scATAC-seq和基于TGS的scNanoATAC-seq之间的性能相当。


研究团队进行了两批物种混合实验,使用四种等量混合的细胞系,包括两种人细胞系(K562和GM12878)和两种小鼠细胞系(mESC和MEF)。在两个技术重复中,2.2%(223个中的5个)和1.6%(248个中的4个)单细胞被鉴定为双细胞,这对于单细胞染色质可及性测序是可以接受的。


接下来,研究者将五个人类细胞系的scNanoATAC-seq数据投影到均匀流形近似和投影(UMAP)空间中。每个细胞系都通过无监督聚类很好地区分,没有显着的批次效应。


为了估计scNanoATAC-seq的单细胞的最佳通量,研究者通过对读数进行采样来模拟单细胞数据,而无需从每个细胞系的伪体积替换到每个细胞的特定数量的读数。每个细胞一万次读数(每个测序运行2000个细胞)是scNanoATAC-seq方法的最大通量。


研究者在细胞类型特异性转录因子的结合位点上发现了强烈的足迹,这与10×scATAC-seq数据中的足迹一致。为了评估scNanoATAC-seq方法是否适用于体内样品,研究者对来自单个供体的分选和未分选的PBMC进行了scNanoATAC-seq。CD4 T细胞,CD8 T细胞,B细胞和单核细胞在分选和未分类的PBMC中均被清楚地鉴定出来,没有显着的批次效应。为了将 scNanoATAC-seq 数据的峰值呼叫质量与 10× scATAC-seq 数据的峰值呼叫质量进行比较,还对 PBMC 进行了基于cCREs的基准测试。测试结果表明,scNanoATAC-seq在鉴定不同的细胞群和揭示每个细胞群染色质可及性的关键调节特征方面表现良好。


一种基于纳米孔测序平台的转座酶可及性染色质单细胞测定方法(scNanoATAC-seq)

——该方法是一种基于微板的scATAC-seq方法,可以与TGS测序平台相兼容。


研究意义

scNanoATAC-seq是一种基于TGS平台的长读单细胞ATAC测序方法,可应用于各种生物学领域。它可以同时检测单个细胞内的染色质可及性和遗传变异(包括SV,SNPs和CNV)。此研究揭示了等位基因特异性峰值(allele-specific peaks,ASPs)——即使是在某个峰值内不存在杂合的单核苷酸多态性(heterozygous SNPs)。这对于基于NGS平台的短读scATAC-seq而言,是无法实现的。


研究提供了来自scNanoATAC-seq的相邻峰之间共通性直接证据,其中同一单个细胞中两个位点的染色质可及性以及实际上在同一等位基因上的染色质可及性是通过长读数同时检测到的。


在目前的测序深度下,scNanoATAC-seq文库的成本不到每细胞2.5美元。由于在相同测序深度下,ONT((Oxford Nanopore Technologies)测序的成本仍高于NGS平台的成本,所以需要根据不同需求来选择测序方法——通过更多片段以富集更强烈的表观遗传信号,或是通过长读方式来探测长读取特异性特征(例如结构变异SVs 等)。(转化医学网360zhyx.com)


参考资料:

https://www.nature.com/articles/s41422-022-00730-x

注:本文旨在介绍医学研究进展,不能作为治疗方案参考。如需获得健康指导,请至正规医院就诊。




评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发