一项由欧洲分子生物学实验室(EMBL)领导的研究表明,长读长测序可以揭示复杂的染色体结构重排模式,而这些模式此前一直被经常使用的短读长测序所忽略。
就像在黑暗的小路上行走时,手电筒投下的光束比蜡烛更宽一样,长读长基因组测序似乎也比短读长测序更能阐明DNA突变的基因组图谱。
一项由欧洲分子生物学实验室(EMBL)领导的研究表明,长读长测序可以揭示复杂的染色体结构重排模式,而这些模式此前一直被经常使用的短读长测序所忽略。这项成果于近日发表在《Cell Genomics》杂志上。
短读长 vs. 长读长测序
长期以来,科学家们主要使用短读长基因组测序来探索癌症的突变图谱。短读长测序技术具有高通量,但只能生成许多短片段的DNA,然后研究人员将其拼凑在一起,利用计算工具来识别基因组中的突变。然而,他们怀疑这种方法漏掉了一些突变模式,比如体细胞结构变异(SSV)。这些结构变异是指大片段DNA的重排(如缺失或重复等),已知与大多数致癌突变有关。
新近的长读长测序方法有望为癌症基因组突变的检测提供了一种更好的方法。在这项研究中,EMBL的科学家采用了Oxford Nanopore纳米孔测序技术。纳米孔测序允许研究人员对长的DNA或RNA片段进行实时测序。它的原理是在核酸穿过蛋白质纳米孔时监测电流的变化。由此产生的信号在解码后给出特定的DNA或RNA序列。
与短读长测序相比,长读长测序的设备更小,速度更快,可以读取更长的DNA链。因此,它们之间的区别就像500片和50片的拼图,碎片越少,越容易组装。此外,它可以让研究人员了解癌症表观基因组的变化。
论文第一作者、EMBL的高级生物信息学家Tobias Rausch说:“我们知道,使用短读长测序,我们并没有得到一张完整的图像。现在的技术进步让我们可以真正使用长读长测序,并发现缺失的东西。”
如何识别以前未发现的突变模式
此次的研究对象是髓母细胞瘤,一种原发性的儿童脑肿瘤。研究人员在诊断和治疗后采集肿瘤细胞,并利用长读长测序方法来鉴定一种导致基因组中较长片段重排的新突变模式,然后他们在其他癌症类型中确认这一模式。
“从一开始,我们就明白开发方法需要成为我们工作的一个重要组成部分,”Rausch说。“我们如何在癌症基因组的情景下最好地使用长读长测序?方法交付是这个项目中的重要部分,从中产生的多个工具有望应用于更广泛的领域。”
然而,除了方法之外,科学家们还鉴定出一种相当复杂的结构变异模式,称为模板式插入(templated insertion thread),其特点是短的插入片段显示出普遍的自我串联结构,长度可达到50 kb。这种模式在脂肪肉瘤中的发生率高达74%,并且经常伴随着染色体碎裂。在此之前,短读长测序没有检测到这种模式。
EMBL研究小组的负责人Jan Korbel表示:“在基因组测序中看到突变模式并不太令人惊讶,但只用一个样本就能做到这一点,而且是以往人们从未发现的东西,这一点令人震惊。不过,这也是因为短读长测序无法将其拼凑起来。现在,我们能够观察到这种复杂的重排,并真正了解它们的内部结构。”
展望未来
从单个样本中鉴定出突变模式后,研究人员意识到需要对更大的队列进行后续研究,以便更好地了解该模式并确定其是否具有临床意义。目前,只有少量样本采用长读长测序技术进行了研究。
“长读长测序确实有很多令人兴奋的地方。”Korbel说。“我们已经计划在更大的范围内继续我们的工作,其中的一些合作项目正在试点将这种长读长测序应用于临床环境中,一般来说,在采用测序技术后,患者的生存率往往更高。”
参考文献
Long-read sequencing of diagnosis and post-therapy medulloblastoma reveals complex rearrangement patterns and epigenetic signatures