通过挖掘人类基因组中的变异,研究人员对表型多样性和疾病病因的种群历史和遗传基础有了深刻的见解。尽管早期的努力主要基于常见变体的阵列基因分型,但全基因组测序(WGS)已成为了解人类进化和迁徙历史的遗传变异的有效方法。在不同人群之间进行比较,大多数遗传变异都是稀有且特定于人群的,这突出了表征当地人群多样性的重要性。因此,许多国家开始了基于人群的WGS研究。然而,在人类遗传学研究中以欧洲为中心的偏见导致人们越来越关注在实施精准医学过程中健康差距的变化。尽管亚洲是最大的大陆,拥有约45亿不同种族的居民,占全球人口的60%,但公共数据库中的亚洲基因组严重不足。
最近,华中科技大学公共卫生学院王超龙及新加坡基因组研究所刘建军共同通讯在Cell在线发表题为"Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore "的研究论文, 该研究通过对4810名新加坡华人,马来人和印度人的全基因组测序,研究人员发现了9830万个SNP和少量插入或缺失,其中一半以上是新发现的。人口结构分析表明,新加坡三个族群对亚洲遗传多样性有很强的代表性,并揭示了与马来人有关的新颖血统。此外,根据人口统计学的推论,马来人从大约24800年前从中国分裂出来,并在大约1700年前与东亚人经历了重大的交融。此外,该研究确定了20个用于自然选择的候选基因座,其中14个具有与复杂特征和疾病的强大关联。最后,该研究表明这些数据可以大大改善亚洲和大洋洲不同人群的基因型估算。这些结果凸显了这些数据作为在广泛的地理区域中增强人类遗传学发现能力的资源的价值。
通过挖掘人类基因组中的变异,研究人员对表型多样性和疾病病因的种群历史和遗传基础有了深刻的见解。尽管早期的努力主要基于常见变体的阵列基因分型,但全基因组测序(WGS)已成为了解人类进化和迁徙历史的遗传变异的有效方法。一个重要的里程碑是1000个基因组计划(1KGP),该计划对来自26个种群的2500个基因组进行了测序,测序深度约为7.4倍,并分类了8800万个变异位点。通过大规模测序分析对因果变异进行直接评估已导致人群和临床遗传学的融合,人群遗传信息已成为精准医学的基石,其应用已在孟德尔疾病的诊断,药物使用优化,药物开发和疾病风险预测等。
SG10K数据集的质量评估
在不同人群之间进行比较,大多数遗传变异都是稀有且特定于人群的,这突出了表征当地人群多样性的重要性。因此,许多国家开始了基于人群的WGS研究。然而,在人类遗传学研究中以欧洲为中心的偏见导致人们越来越关注在实施精准医学过程中健康差距的变化。尽管亚洲是最大的大陆,拥有约45亿不同种族的居民,占全球人口的60%,但公共数据库中的亚洲基因组严重不足。例如,单倍型参考协会汇集了来自20个研究的32,488个基因组,以构建一个大型的参考基因组,但是它仅适合于插补欧洲人。此外,在基因组聚合数据库(gnomAD)中,其15496个基因组中只有约5%来自东亚,而没有一个来自南亚。此外,在精准医学跨学科组(TOPMed)计划中,其145,000个样本中只有约10%是亚洲人。在亚洲,大多数最新发表的WGS研究样本规模较小。
每个健康个体的致病性纯合子数量与中国人,马来人和印度人的近亲繁殖系数的关系
尽管地域很小,但由于其移民历史,新加坡的人口也多种多样。新加坡人大致分为四个种族:华人,马来人,印第安人和其他种族。新加坡居民中有74.3%是华人,来自华南的几种方言群体,而华北的少数群体。马来人占总人口的13.4%,包括东南亚不同南斯拉夫语系的后裔,主要来自马来西亚和印度尼西亚。在英国殖民时期,大约9.1%的人口是印度裔,他们来自印度移民。大多数印度人是印度东南部的泰卢加斯和泰米尔人,少数是印度北部的锡克教徒和帕坦族人;其余3.2%的人口主要是欧洲人和中东人。因此,对新加坡人的WGS分析具有使亚洲乃至全球其他地区的人口受益的潜力。在这里,研究人员描述了SG10K项目试点研究的初步发现,这是一项旨在使10,000个新加坡人全基因组测序的全国性努力。
SG人群中的选择信号
对于该研究,通过对4810名新加坡华人,马来人和印度人的全基因组测序,研究人员发现了9830万个SNP和少量插入或缺失,其中一半以上是新发现的。人口结构分析表明,新加坡三个族群对亚洲遗传多样性有很强的代表性,并揭示了与马来人有关的新颖血统。
文章总结
此外,根据人口统计学的推论,马来人从大约24800年前从中国分裂出来,并在大约1700年前与东亚人经历了重大的交融。此外,该研究确定了20个用于自然选择的候选基因座,其中14个具有与复杂特征和疾病的强大关联。最后,该研究表明这些数据可以大大改善亚洲和大洋洲不同人群的基因型估算。这些结果凸显了这些数据作为在广泛的地理区域中增强人类遗传学发现能力的资源的价值。
参考信息:
https://www.cell.com/cell/fulltext/S0092-8674(19)31070-0#