在过去十年里,来自细菌和古菌防御系统的CRISPR,被改造成了多种CRISPR基因编辑工具,这让我们的基因编辑技术得到了快速发展,这些工具也被成功应用到了人体临床试验中以治疗遗传疾病和癌症。
自然界中潜在的基因编辑工具并非只有CRISPR,全世界的科学家们也在不断挖掘具有基因编辑潜力的新工具,以解决现有基因编辑工具尺寸太大、脱靶性等问题,扩展“基因编辑百宝箱”。在这方面,CRISPR基因编辑先驱张锋教授一直走在最前沿。
2023年4月6日,张锋教授团队在 Science 期刊发表了题为:Structure of the R2 non-LTR retrotransposon initiating target-primed reverse transcription 的研究论文。
该研究报道了一种有潜力的新型基因编辑工具——家蚕R2非LTR逆转录转座子的冷冻电镜结构,并解析了R2基于逆转录酶活性在基因组中插入DNA序列的具体过程。张锋团队还使用Cas9在体外将R2重定向到非原生序列,证明了R2未来可以作为一种新型RNA引导的基因插入工具。
非长末端重复序列(non-LTR)逆转录转座子是人类基因组中最丰富的一类可移动遗传元件(MGE),主要以LINE-1和SINE(或Alu)元件为代表。尽管它们在基因组中普遍存在,并通过致突变性和重组对遗传多样性作出了贡献,但关于它们的转移机制以及是否可以作为基因插入工具仍需进一步研究。
值得一提的是,近期对家蚕R2元件(选择性插入28S rRNA基因)的开创性研究极大地促进了对这类可移动遗传元件(MGE)的理解。R2像所有non-LTR逆转录转座子一样,编码一个具有DNA结合、核酸内切酶和逆转录酶等结构域的开放阅读框(ORF)。其中,核酸内切酶结构域切割目标DNA,逆转录酶结构域使用从缺口暴露的3'端启动R2 RNA的逆转录,从而产生R2元件的新的基因组副本。这一过程被称为靶向启动逆转录(Target-Primed Reverse Transcription,TPRT),是non-LTR逆转录转座子及其Ⅱ型内含子祖先的特征。
启动逆转录的缺口链被称为底链,non-LTR逆转录转座子对其自身RNA的逆转录是特异性的。对于R2来说,这种特异性需要在3'UTR上的一个元件,但精确的基序还没有被定位,目前还不清楚R2是如何特异性地识别28S rRNA靶基因的,或者DNA断裂是如何与同一蛋白质中的逆转录耦合的。
R2Bm逆转录转座子的结构域:ZnF,锌指;NTE,N端延伸;RT,逆转录酶;RLE,限制性样内切酶
为了解决这些问题,张锋团队利用家蚕R2蛋白(R2Bm)自身的3'UTR在28S rRNA基因上启动TPRT,解决了其冷冻电镜结构。该结构表明,R2Bm使用其N-ZnF和Myb结构域来定位内切酶靶序列,这一模型与其他non-LTR逆转录转座子的模型形成了对比,在其他non-LTR逆转录转座子中,内切酶结构域是靶位点选择的唯一决定因素。
R2Bm逆转录转座子的冷冻电子显微镜结构
研究团队还发现了R2Bm可以识别的两个重要的靶位点基序——RUM和RASIN。有意思的是,当研究人员使用RUM-RASIN一致基序搜索家蚕基因组时,可以在核糖体DNA序列之外发现许多潜在的脱靶位点。因此,张锋团队检查了先前鉴定的家蚕非28S插入序列,发现目标位点与28S的相似性有限,但有一个TTAAcG|T RASIN基序(‘|’表示插入位点,小写字母表示偏离28S)和一个GCTACTTGCGCAT RUM基序。
R2Bm切割位点上游的目标DNA识别
然而,令人意外的是,R2Bm在非28S序列上的插入很少,这表明其他因素可能在调节R2Bm转位中起重要作用,包括染色质可及性、其他序列基序或目标DNA解旋和退火的能力。不仅如此,R2Bm的冷冻电镜结构还揭示了与目标DNA的广泛界面,即TPRT所需的3'UTR的一个小核心区域,并表明R2Bm可以通过与SpCas9构建融合蛋白,以重新编程其插入位置。
R2Bm与3' UTR RNA的相互作用
值得注意的是,non-LTR逆转录转座子形成了一个多样化的家族,即使在R2超级演化支中,元件之间也有显著差异。R2Bm是R2-D支元件的代表,其具有单个C2H2 N端ZnF结构域,但R2-A支元件具有三个串联的N端ZnF结构域,这可能会创建更广泛的DNA结合界面,并在靶位点选择上具有更严格的要求。
构建R2Bm-SpCas9(H840A)融合蛋白,以实现非原生序列靶向
总而言之,这项发表在 Science 的研究通过解析家蚕R2 TPRT复合物的结构,促进了对non-LTR逆转录转座子的具体转位过程的理解,并提出了将这些转座子工程化和应用于精准基因插入的构想,为基因编辑工具百宝箱再增添一件强大的“法宝”。
论文链接:
https://www.science.org/doi/10.1126/science.adg7883