gnomAD联盟的科学家发布了关于人类遗传变异的第一组发现

   日期:2025-02-02     来源:本站    作者:admin    浏览:77    
核心提示:      在过去的八年中,基因组聚集数据库(gnomAD)联盟(及其前身外显子组聚集联盟(ExAC))一直与世界各地的遗传学家合作,汇

  

  

  在过去的八年中,基因组聚集数据库(gnomAD)联盟(及其前身外显子组聚集联盟(ExAC))一直与世界各地的遗传学家合作,汇编和研究来自世界各地人群的125,000多个外显子组和15,000多个全基因组。

  现在,在《通讯与医学》杂志上发表的七篇论文中,gnomAD联盟的科学家们描述了他们从数据库中获得的第一组发现,展示了这个庞大数据集的力量。综合这些研究:

  1. 对一类被称为功能丧失(LoF)变异的罕见遗传变异提供了更完整的目录和理解,这种变异被认为会破坏基因编码的蛋白质;

  2. 引入最大的综合参考图,研究尚未充分但重要的一类遗传变异,称为结构变异;

  3. 展示解释独特变异形式和变异生物学背景的工具如何帮助临床遗传学家诊断罕见遗传病患者;和

  4. 说明像gnomAD这样的人口规模数据集如何帮助评估拟议的药物靶点。

  麻省理工学院布罗德研究所、哈佛大学和麻省总医院(MGH)的研究人员担任所有研究的共同第一作者或共同资深作者,来自英国伦敦帝国理工学院、直接面向消费者的基因公司23andMe和其他机构的科学家为个别论文做出了贡献。国际上有100多名科学家和团体向该联盟提供了数据和/或分析工作。

  “从某种意义上说,gnomAD是财团财团的产物,因为底层数据代表了许多团体的工作和贡献,这些团体一直在收集外显子组和基因组序列,作为理解人类生物学的一种方式,”Konrad Karczewski说,他是该系列旗舰论文的第一作者,也是Broad和MGH分析和转化遗传学部门的计算生物学家。“这些论文中的每一篇都代表着有人为数据集带来了一个新的角度,他们说,‘我有一个想法,可以让我们把所有这些都投入使用,’并为遗传学社区创造了一个新的资源。”看到它展开真是太神奇了。”

  麦克阿瑟和他在Broad和MGH的同事建立了ExAC,然后又建立了gnomAD,以扩展1000基因组计划的工作,这是第一个大规模的国际努力,为人类遗传变异编目,以及其他项目。

  麦克阿瑟回忆说:“2012年,我的实验室正在对罕见疾病患者的基因组进行测序,发现现有的正常变异目录不够大,也不够多样化,无法帮助我们解释我们所看到的基因变化。”“与此同时,我们在世界各地的同事已经对数万人进行了测序,以研究常见的复杂疾病。因此,我们着手将这些数据集整合在一起,为罕见疾病研究创建一个参考数据集。”

  2014年10月,ExAC联盟发布了第一个全外显子组数据集。然后它开始收集全基因组数据,演变成gnomAD联盟,并于2017年2月发布了gnomAD v1.0。

  随后的gnomAD版本侧重于增加外显子组和基因组的数量,数据中突出显示的变异量以及数据集的多样性。

  这些新论文基于gnomAD v2.1.1数据集,其中包括来自2.5万多名东亚和南亚后裔、近1.8万名拉丁裔后裔和1.2万名非洲裔或非裔美国人后裔的基因组和外显子组。

  七篇论文中的两篇表明,大型基因组数据集可以帮助研究人员更多地了解罕见或未被充分研究的遗传变异类型。

  由Karczewski和MacArthur领导并发表在《科学》杂志上的这项旗舰研究描述了gnomAD并绘制了功能丧失(LoF)变异图:被认为完全破坏蛋白质编码基因功能的遗传变化。作者在gnomAD数据集中确定了超过44.3万个LoF变体,大大超过了以前的所有目录。通过将每个基因中这些罕见变异的数量与人类基因组突变率的新模型的预测进行比较,作者还能够根据它们对破坏性突变的耐受性对所有蛋白质编码基因进行分类——也就是说,基因在被遗传变化破坏时引起重大疾病的可能性有多大。这种新的分类方案精确地指出了更有可能与智力残疾等严重疾病有关的基因。

  Karczewski解释说:“到目前为止,gnomAD目录让我们对基因对变异的敏感性光谱有了最好的了解,并为支持在常见和罕见疾病中发现基因提供了资源。”

  Karczewski和MacArthur的研究侧重于小变异(点突变、小插入或缺失等),而研究生Ryan Collins、Broad联合科学家Harrison Brand、研究所成员Michael Talkowski和同事则使用gnomAD来探索结构变异。这类基因组变异包括重复、缺失、倒位和其他涉及较大DNA片段(通常大于50-100个碱基长)的变化。他们的研究也发表在了《gnomAD- sv》杂志上,这是一个在近15000个gnomAD基因组中发现的超过43.3万个结构变异的目录。gnomAD-SV中的变异代表了大多数已知的主要结构变异类别,并共同形成了迄今为止最大的结构变异图。

  塔尔科夫斯基指出:“在全基因组数据中识别结构变异是出了名的具有挑战性,以前从未在这种规模上进行过调查。”塔尔科夫斯基也是MGH基因组医学中心的一名教员。“但它们比任何其他形式的变异都能改变基因组中更多的个体碱基,并且是人类进化和疾病的公认驱动因素。”

  他们的调查得出了几个令人惊讶的发现。例如,作者发现,平均个体基因组中至少有25%的罕见LoF变异实际上是结构变异,许多人携带了有害或有害的结构改变,但没有预期的表型或临床结果。

  他们还指出,许多基因对复制和删除同样敏感;也就是说,从进化的角度来看,获得一个或多个基因拷贝可能和失去一个一样不受欢迎。

  塔尔科夫斯基说:“通过在gnomAD中建立这个目录,我们学到了很多东西,但我们显然只触及了了解基因组结构对生物学和疾病的影响的表面。”

  其中三篇论文揭示了gnomAD对不同类型的遗传变异的深入分类以及变异产生的细胞环境如何帮助临床遗传学家更准确地确定给定的变异对患者是保护、中性还是有害。

  在一篇论文中,贝丽尔·卡明斯(Beryl Cummings),前Broad/MGH研究生,现在在麦克阿瑟迷宫治疗公司(Maze Therapeutics, MacArthur)和他的同事发现,特定基因片段如何表达的组织基础差异可以改变这些片段中变异对生物学和疾病风险的下游影响。该团队将gnomAD和基因型组织表达(GTEx)项目的数据结合起来,开发了一种利用这些差异来评估变异临床意义的方法。

  在《通讯》杂志上,麦克阿瑟、研究生王清波和合作者调查了多核苷酸变异——由两个或更多附近的碱基对变化组成的变异,它们一起遗传。这些变异可能具有复杂的影响,这项研究首次尝试系统地编目这些变异,检查它们在整个基因组中的分布,并预测它们对基因结构和功能的影响。

  在另一项通讯研究中,伦敦帝国理工学院的麦克阿瑟、尼古拉·惠芬和詹姆斯·韦尔及其同事探索了基因5 '非翻译区DNA变异的影响,该区域位于细胞转录机制开始读取基因蛋白质密码的位置之前。这些区域的变异可以欺骗细胞在错误的地方开始读取基因,但以前没有得到充分的记录。

  “临床实验室每天都在使用gnomAD,”临床遗传学家海蒂·雷姆(Heidi Rehm)说;Broad公司MPG的成员,临床研究测序平台的医学总监;MGH医学部首席基因组学官;并与布罗德研究所成员马克·戴利共同担任gnomAD指导委员会主席。“这些研究中的方法已经帮助我们更好地解释了患者的基因检测结果。”

  剩下的两项gnomAD研究描述了不同的群体规模的基因数据如何帮助研究人员评估和选择最佳的药物靶点。

  2018年,Broad的联合科学家埃里克·米尼克尔(Eric Minikel)在他的研究博客上思考了是否可以使用具有自然发生的预测LoF变异的基因来评估药物靶向这些基因的安全性。他写道,如果一个自然灭活的基因似乎没有有害影响,也许可以用药物安全地抑制该基因。这篇博客文章成为Minikel、MacArthur和同事们应用gnomAD数据集探讨这个问题的论文的基础。他们提出了将LoF变异的见解纳入药物开发过程的方法。

  利用Broad的专业知识,Michael J. Fox基金会发起了一项合作,由帝国理工学院的whffin、MacArthur、Broad的博士后Irina Armean、23andMe的Aaron Kleinman和Paul Cannon等人合作,使用gnomAD、UK Biobank和23andMe中编组的LoF变异,研究减少与帕金森病风险相关的LRRK2基因表达的潜在安全责任。在医学领域,他们利用这些数据预测,降低LRRK2蛋白水平或部分阻断该基因活性的药物不太可能产生严重的副作用。

  麦克阿瑟说:“我们已经在gnomAD中记录了大量的基因破坏变异。”“通过这两项研究,我们已经展示了如何利用这些变异来阐明和评估潜在的药物靶点。”

  所有数据的公开共享从一开始就是gnomAD项目的核心原则。这七篇论文背后的数据在2016年通过gnomAD浏览器公开发布,没有使用或发表限制。

  麦克阿瑟说:“这种资源已经对医学研究和临床实践产生了广泛的影响,这证明了基因组数据共享和聚合的不可思议的价值。”“自从我们提供数据以来,已有350多项独立研究利用gnomAD研究癌症易感性、心血管疾病、罕见遗传疾病等。

  “但我们离发现饱和或解决不同的解释还很远,”他补充说。“联盟的下一步工作将集中于增加这些资源的规模和种群多样性,并将由此产生的大规模遗传数据集与临床信息联系起来。”

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行