• 12月23日 星期一

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

2020年4月30日,《Cell Research》期刊刊登了一篇由上海交通大学医学院附属瑞金医院内分泌科主导的ChinaMAP(中国代谢解析计划)的研究成果,说起“中国代谢解析计划”这个词大家可能很陌生,但如果换成“全基因组测序计划”大家就倍感亲切了。没错,这其实就是来自咱中国的第一份全覆盖、大样本、高深度的全基因组测序数据。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

Cell Research期刊论文

为了得到更加准确的基因组数据,科学家抽取了全国27个省份(直辖市)、涵盖8个民族共计1万多人的随机样本,根据这些样本的基因测序结果,基本可以建立代表全国人口的基因数据。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

基因

那么,这份全基因组测序数据如何呢?有什么实际应用吗?这篇文章,我们一探究竟!

全基因组测序工作的必要性

学过生物的网友应该知道,基因就是人类的第二张身份证,每一个人的基因都有着独特的DNA编码序列,人们可以通过对DNA的检测来做亲子鉴定,或者来确认死者、犯罪嫌疑人的身份。

前几天看网上消息,一位男子带双胞胎儿子做亲子鉴定,发现其中一位孩子竟然不是自己的,这件比中彩票概率还低的奇葩事件在网上引起了热议,这里用到的亲子鉴定技术就是基因测序工作的一小部分。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

那么,基因测序除了能用于亲子鉴定外,是否还有其他意义呢?

其实,基因测序能够通过身上任何一处组织的一滴血或者毛发中来获得全部的基因序列,这对于精准医疗、疾病监测等方面都具有重大意义。

作用一:精准医疗

精准医疗的概念由美国提出,随后在世界各国掀起了热潮。精准医疗中的“精准”指的就是快速找到疾病的发病基因,从而精准用药,精准医疗中的关键技术就是基因测序。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

作用二:寻找细菌、病毒类传染病的宿主

基因测序不仅仅应用于人类,同样可用于对细菌、病毒的研究。现代医学认为,人类目前的很多疾病都是由于病原微生物的侵袭造成,因此为了找到病毒源头并对症下药,就需要利用基因测序的手段对这些微生物进行研究。

例如,在这次对抗新冠肺炎的防疫斗争中,中国生物学家首先完成了对新冠病毒的基因测序工作,为找到发病源头提供了依据。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

新冠病毒

作用三:经济效益显著

有权威调查结果显示,全球基因测序市场的总量从2007年的8亿美元增长至2015年的59亿美元,年复合增长率为18.7%,预计2020年将达到138亿美元。因此,基因测序拥有庞大的市场和广阔的发展前景,经济效益显著。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

基因测序市场规模

中国第一份真正意义上的基因数据库

全基因测序工作如此重要,但你知道中国的进展如何吗?

其实,中国的基因测序工作还真称不上领先,中国在基因测序方面的影响力甚至和世界第二大经济体的身份不怎么匹配。

为什么这么说呢?我们来看一下下面这个图。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

全球大规模的基因组计划

上图是全球已知的大规模人群基因组项目,包括英国10万人基因组计划、英国UK biobank计划、美国All of US计划等,而这其中又以美国All of US计划最为宏大,该计划检测100万美国人群,约占全国总人口的千分之三。此外,韩国、新加坡、澳大利亚等国家也已经在积极发起属于他们自己的基因组学计划。

而这些国家之外,唯独缺少中国的身影。上图中唯一涉及到中国的基因组计划——千人基因组项目仅有301人参与检测,与美国的100万人相去甚远。

要知道,中国早就尝试开始了基因检测计划,作为“人类基因组计划”的6个参与国家之一的中国,可谓是起了个大早,却没赶上大集!中国是世界上第一人口大国,拥有汉族、藏族、回族、蒙古族等56个民族,基因资源非常丰富,但一直以来,中国的基因组学研究却迟滞不前。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

藏族姑娘

那么,为什么中国的基因组计划近些年进展乏力呢?还是离不开一个字,“钱”!

基因组测序技术虽然发展已经成熟,但涉及到大规模样本采集的成本却相当昂贵。以英国的GenomicsEngland项目为例,英国的前期规划计划完成10万人基因检测,在2018年测序完成8.7万人,项目投资高达7800万英镑,也就是7亿人民币!而英国计划在后期完成500万人的基因检测任务,项目资金投入高达402亿人民币,这项工程对英国来说可谓天价!

但我们反过来想,全基因测序项目如此烧钱,那英国人为什么执着于测序呢?

好了,我们接下来介绍一下开篇所讲述的这项由中国主导完成的基因测序研究工作,也就是中国代谢解析计划,该研究工作由上海交通大学医学院附属瑞金医院发起,样本数据覆盖了全给27个省市、8个民族的1万余人,虽然与英国的500万人,甚至是美国的100万人指标相比称不上宏大,但这仍然是中国第一份已经完成的大规模基因解析数据库

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

瑞金医院

聊一聊中国全基因组测序结果

在说明测序结果之前,我们先来详细认识一下ChinaMAP计划。

前文我们提到,该计划是由上海交大附属瑞金医院主导完成,目前完成了10588人的测序任务,主要完成了中国人群遗传变异数据构建、基因组特征比较和变异频谱解析等任务,我们姑且称之为一期计划。

按照瑞金医院的介绍,该计划后续会进行更多样本的研究,用于解释中国汉族及大部分少数民族的多样化遗传结构,并从基因角度解释糖尿病等代谢疾病的发病规律。

后期计划进行3个方面的研究,一是上海城市化进程中的社区心血管风险研究,这需要5万上海本地人的样本采集;二是完成中国非传染性疾病的监测,这需要全国15万人的样本采集;三是完成中国糖尿病患者癌症风险评估,这需要25万名样本的采集。可见,要真正意义上完成ChinaMAP计划,样本数量远超1万人。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

接下来,我们就来详细聊聊对这1万余人的检测成果。

研究成果1:丰富了国际基因数据库

在ChinaMAP一期测序中,共得到了1.36亿个SNP和1000万个插入或缺失位点,这其中有一半属于多个国际通用的数据库中没有的位点,大大丰富了国际基因数据库。

SNP:基因在特定的位点上,DNA序列存在差异,比如点突变、缺失、插入或者置换,这些差异构成了基因的多态性,这种现象在生物学上被称为SNP,即单核苷酸多态性。

下图是ChinaMAP与国际数据库TOPMed、gnomAD、dbSNP和1KGP相比,测量出的新型SNP数目和等位基因频谱。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

ChinaMAP识别的SNP数目和等位基因频谱

研究成果2:汉族构成进一步细分、少数民族差异性显著

在这次检测之前,汉族只有北方汉族和南方汉族之分。而通过该研究成果,汉族人群可根据基因差异重新细分成7个亚群。如下图所示,这7个亚群分别是:

北方汉族:北京、天津、河南、河北、山东、辽宁、吉林、黑龙江、山西;

西北汉族:甘肃、陕西;

东部汉族:江苏、浙江、上海、安徽;

中部汉族:湖北;

南方汉族:贵州、四川、重庆、湖南、云南、江西;

东南汉族:福建;

岭南汉族:广东、广西;

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

汉族细分构成

根据基因测序结果:藏族、彝族、蒙古族、苗族、壮族的基因结构与汉族都存在明显差异,有独立的基因构造;

满族和北方汉族基因相近,可能是因为清朝时期满族与汉族的深度融合有关;

回族和西北汉族、北方汉族的基因相近,这可能是因为西北的河西走廊地区历代以来就是丝绸之路,是中国汉族人口迁徙的重要地区,因此产生了汉族和回族的基因融合。

研究成果3:日本与中国北方汉族人群聚类完全重叠

上文我们分析了国内汉族之间、汉族与少数民族之间的基因差异,那么,中国人与国际上其他国家的基因差异如何呢?

根据检测结果,中国人与非洲人的基因差异最大,欧洲、南亚和拉丁美洲次之,这可能是黄种人和黑种人、白种人之间的种族差异造成的;

另一方面,中国北方汉族人和日本人的基因差异最小,群聚类甚至完全重叠,这不禁令人遐想,难道秦朝时期徐福东渡日本的传说竟然是真的?

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

位于日本的徐福雕塑

下图中Fst的取值范围为0~1,数值越大代表基因差异越大,数值越小代表基因差异最小,最大值1表示完全分化,最小值0意味着基因结构完全一致。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

各国家fst分布图

上图中,非洲人口和中国人口显示出最大的遗传距离,其中塞拉利昂与中国的Fst=0.15,尼日利亚与中国的Fst=0.15,尼日利亚与中国的Fst=0.149。中国、日本、越南人口的遗传特征非常相似,其中日本与中国的Fst=0.007,越南与中国的Fst=0.005。

另外,研究者在基因成分分析中发现,日本人群与中国北方汉族人群聚类完全重叠,下图中红点部分为日本人基因聚类。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

研究成果4:糖尿病风险评估有据可依

全基因测序结果对糖尿病等代谢性疾病的治疗有指导意义,研究团队对糖尿病的发病特征进行了多基因风险评分,分值、年龄和血糖值之间的分布关系如下面的三维图所示。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

分值、年龄和血糖值之间的分布关系

下图为体重指数、空腹血糖和餐后2小时血糖的多基因风险评分。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

体重指数、空腹血糖和餐后2小时血糖的分布关系

上述研究表面,糖尿病高风险和低风险的个体之间存在非常显著的血糖差异,高风险个体随着年龄的增长,空腹和餐后2小时的血糖含量显著高于中度风险和低风险者。

研究成果5:山东人并非最能喝酒,藏族、蒙古族和彝族酒量最好

基因测序结果表明证实,导致喝酒脸红和酒精代谢能力差的乙醛脱氢酶2基因rs671变异是东亚人特异性的,在中国人群中的携带者(纯合子比例4.50%,杂合子比例34.27%)远高于全球其他人群,这也就是说,中国人的酒量在世界来看属于较低水平

此外,基因测序结果表明北方人比南方人酒精代谢能力更高,也就是说酒量更好,这与人们的传统认知相同。细分省份来看,藏族、蒙古族和彝族地区人们的酒精代谢能力最高,这一举打破了山东人最能喝的传统认知。

中国全基因组测序结果出炉,日本和中国人群聚类完全重合

此外,测序结果表明,广东人和福建人的酒精代谢能力最低、酒量最差,所以如果你的酒桌上有这两个省份的朋友,那就悠着点喝吧!

怎么样,看了这篇文章,你对这份来自中国的全基因组测序报告了解如何呢?你认为国家应该加大对基因检测技术的投入么?欢迎在评论区留言讨论!


这里是科学驿站,一个传播科学、传递价值的小窝,欢迎关注~

上一篇新闻

首例猴痘病毒传入中国台湾,《自然》发文已发现50个突变

下一篇新闻

大黄鱼再生记

评论

订阅每日新闻

订阅每日新闻以免错过最新最热门的新加坡新闻。