生、長、衰、病、老、死,一切都與基因有關(guān)。不同地域和民族的人,其基因也千差萬別。
鑒于此,最大規(guī)模的中國人基因庫研究結(jié)果于近日首次發(fā)表——上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院內(nèi)分泌科聯(lián)合全國 29 家研究機(jī)構(gòu)、醫(yī)院,首次公布了來自 27 個(gè)省、直轄市 8 個(gè)民族的 1 萬余人的高深度全基因組測序數(shù)據(jù)及表型的系統(tǒng)性分析結(jié)果。
2020 年 4 月 30 日,上述團(tuán)隊(duì)題為 The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals(中國代謝解析計(jì)劃對 10588 例樣本的深層全基因組序列的分析)的論文發(fā)表于由中國科學(xué)院主管的國際性學(xué)術(shù)月刊《Cell Research》(細(xì)胞研究)。
中國代謝解析計(jì)劃糖尿病、骨質(zhì)疏松、低血糖、痛風(fēng),這些病癥我們已經(jīng)不陌生了。
本質(zhì)上,它們都屬于「代謝性疾病」。
顧名思義,這是一種因代謝問題引起的疾病。作為世界范圍內(nèi)最常見、發(fā)展最迅速的健康問題,代謝性疾病在很大程度上決定著人類的死亡率,也正在成為一項(xiàng)日益嚴(yán)重的公共衛(wèi)生挑戰(zhàn)。
世界上沒有完全相同的兩片樹葉,而同一種疾病背后也存在個(gè)體差異。想要更好地進(jìn)行個(gè)體風(fēng)險(xiǎn)評估、提升預(yù)防、治療代謝性疾病的效果,關(guān)鍵在于了解代謝性狀的遺傳結(jié)構(gòu)。
實(shí)際上,最簡單粗暴的方法就是對大規(guī)模人群進(jìn)行全面的遺傳分析。
如今,基因庫的概念已經(jīng)并不稀奇了,歐美已經(jīng)有了一些出名的人類基因組學(xué)和生物信息學(xué)數(shù)據(jù)庫,比如 英國生物樣本庫(UKbiobank)、基因組聚集數(shù)據(jù)庫(gnomAD)、千人基因組計(jì)劃(1KGP)、UK 10K 計(jì)劃、dbSNP 和多組學(xué)精準(zhǔn)醫(yī)學(xué)研究計(jì)劃(TOPMed)。
考慮到東亞人和歐洲人在遺傳背景和種群特征方面存在的巨大差異,一項(xiàng)「中國代謝解析計(jì)劃」(China Metabolic Analytics Project,ChinaMAP)應(yīng)運(yùn)而生。
根據(jù)上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院公眾號介紹,該醫(yī)院此前牽頭開展了多項(xiàng)覆蓋全國的隊(duì)列研究,基于相關(guān)研究,國家代謝性疾病臨床醫(yī)學(xué)研究中心(上海)依托了轉(zhuǎn)化醫(yī)學(xué)國家重大科技基礎(chǔ)設(shè)施(上海)和醫(yī)學(xué)基因組學(xué)國家重點(diǎn)實(shí)驗(yàn)室,實(shí)施了這一計(jì)劃。
ChinaMAP 旨在全面囊括漢族及主要少數(shù)民族在不同地理區(qū)域的多樣化遺傳結(jié)構(gòu),并調(diào)查其對代謝疾病的影響以及廣泛的生物醫(yī)學(xué)相關(guān)的定量特征。
ChinaMAP 基于三個(gè)大型隊(duì)列:
2010 年中國非傳染性疾病監(jiān)測:全國范圍內(nèi) 15 萬名參與者的研究;
中國糖尿病患者癌癥風(fēng)險(xiǎn)評估:25 萬名參與者的研究;
上海城市化進(jìn)程中的社區(qū)心血管風(fēng)險(xiǎn):5 萬名參與者的研究。
10588 位參與者的全基因組測序深度數(shù)據(jù)在 ChinaMAP 一期階段,研究團(tuán)隊(duì) 27 個(gè)省的 8 個(gè)民族(漢族,回族,滿族,苗族,蒙古族,彝族,藏族和壯族)中隨機(jī)選擇參與者,毫無偏倚的選擇、過濾,進(jìn)行了 10588 位參與者的全基因組測序深度數(shù)據(jù),最終完成了中國人群遺傳變異數(shù)據(jù)構(gòu)建、中國人群體結(jié)構(gòu)分析、基因組特征比較,及變異頻譜和致病性變異解析。
其中,平均基線年齡為 54 歲,女性占比為 64.8%。
另外雷鋒網(wǎng)了解到,基因在特定的位點(diǎn)上,DNA 序列存在差異,也就是說,基因組中散在的堿基不同,比如點(diǎn)突變、單個(gè)堿基的置換、缺失和插入,這實(shí)際上也就是基因多態(tài)性的一種表現(xiàn),這在生物學(xué)上被稱為 SNP,即 single nucleotide polymorphism,即單核苷酸多態(tài)性。
而在 ChinaMAP 一期數(shù)據(jù)庫中,共有 1.36 億個(gè) SNP 和 1000 萬個(gè)插入或缺失位點(diǎn),其中一半都屬于多個(gè)國際通用的數(shù)據(jù)庫中沒有的新位點(diǎn)。
下圖是與 TOPMed、gnomAD、dbSNP 和 1KGP 數(shù)據(jù)庫相比,ChinaMAP 中識別出的已知和新型 SNP 的數(shù)目和等位基因頻譜。
漢族可分成 7 個(gè)亞群
該研究表明,漢族人群可分成 7 個(gè)亞群,不同地域的變異特征與人口遷徙相關(guān)。
如下圖所示,漢族人群可分成 7 個(gè)亞群:北方漢族(北京、天津、河南、河北、山東、遼寧、吉林、黑龍江、山西),西北漢族(甘肅、陜西),東部漢族(江蘇、浙江、上海、安徽),中部漢族(湖北),南方漢族(貴州、四川、重慶、湖南、云南、江西),東南漢族(福建)和嶺南漢族(廣東、廣西)。
另一方面,藏族、彝族、蒙古族、苗族、壯族有獨(dú)特的人群聚類,滿族和北方漢族相近,回族和西北、北方漢族相近。
值得一提的是,不同地域的變異特征與歷史上的人口遷徙相關(guān)。例如,西北地區(qū)(甘肅?。┖游髯呃鹊貐^(qū)是絲綢之路、古代人口遷徙的重要地區(qū),因此有更多的個(gè)體變異特征。
少數(shù)民族(藏族,蒙古族和回族)的平均個(gè)體變異水平高于平均,而苗族個(gè)體的變異水平總體下降。
不難看出,基因組分析揭示了地理區(qū)域中多民族人口的遺傳特征及其多樣性、復(fù)雜性。
日本與中國北方漢族人群聚類完全重疊就遺傳特征而言,中國人與非洲差距最大,日本與中國北方漢族人群聚類完全重疊。
如下圖所示,中國人的遺傳特征與歐洲、非洲、南亞、拉丁美洲人口之間存在著巨大的差異。Fst 取值范圍為[0,1],最大值 1 表示完全分化;最小值 0 意味著不同地方群體遺傳結(jié)構(gòu)完全一致,沒有分化。
其中,非洲人口和中國人口顯示出最大的遺傳距離(MSL,塞拉利昂,F(xiàn)st = 0.15; ESN,尼日利亞,F(xiàn)st = 0.15; YRI,尼日利亞,F(xiàn)st = 0.149)。
同為東亞血統(tǒng)的中國、日本、越南人口的遺傳特征非常相似(JPT,日本,F(xiàn)st = 0.007;KHV,越南,F(xiàn)st = 0.005)。
另外,研究者在成分分析中發(fā)現(xiàn),日本人群與中國北方漢族人群聚類完全重疊(日本為紅點(diǎn)部分)。
可見,研究成果提供了漢族和少數(shù)民族的精確遺傳結(jié)構(gòu),揭示了中國人口的基因組多樣性和分布。
中國人得糖尿病和肥胖的風(fēng)險(xiǎn)不同于歐美研究人員進(jìn)行了多基因風(fēng)險(xiǎn)評分(PRS),包括個(gè)體遺傳風(fēng)險(xiǎn)估計(jì)、點(diǎn)單變體關(guān)聯(lián)分析和稀有變體關(guān)聯(lián)分析序列內(nèi)核關(guān)聯(lián)檢驗(yàn)(SKAT)。
實(shí)際上,2 型糖尿病和肥胖都是很常見的代謝性疾病,因此團(tuán)隊(duì)也對二者進(jìn)行了多基因風(fēng)險(xiǎn)評分。
在對 2 型糖尿病進(jìn)行的多基因風(fēng)險(xiǎn)評分中,研究團(tuán)隊(duì)將評分、年齡和血糖值以三維的形式進(jìn)行顯示。
多基因風(fēng)險(xiǎn)評分表明,2 型糖尿病高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)的個(gè)體之間存在非常顯著的血糖差異,高風(fēng)險(xiǎn)個(gè)體隨著年齡的增長,空腹(FBG)和餐后 2 小時(shí)血糖(2h-PBG)都顯著高于中風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)者。
而在對體重指數(shù) BMI 進(jìn)行的分析中,研究團(tuán)隊(duì)發(fā)現(xiàn)了東亞人的特異性 CADM2 基因位點(diǎn)。
雷鋒網(wǎng)了解到,CADM2 此前經(jīng)動物研究證實(shí)可參與調(diào)節(jié)體重和能量穩(wěn)態(tài)。
下圖為體重指數(shù)、空腹血糖和餐后 2 小時(shí)血糖的多基因風(fēng)險(xiǎn)評分。
值得一提的是,中國人患 2 型糖尿病和肥胖的風(fēng)險(xiǎn)基因不同于歐美,這也進(jìn)一步證明了建立中國人自己的基因庫的必要性。
藏族、蒙古族和彝族酒量最好此外,研究人員也探究了參與者的營養(yǎng)和藥物代謝的流行病學(xué)和地理特征。
一方面,研究團(tuán)隊(duì)將關(guān)注點(diǎn)放在了酒精代謝能力上面。
從地理上講,北方人比南方人酒精代謝能力更高,也就是說酒量更好;藏族、蒙古族和彝族的酒精代謝能力最高,廣東、福建人該項(xiàng)能力最低。而不同地區(qū)人群對咖啡因的代謝能力相似。
另一方面,研究團(tuán)隊(duì)對華法林(Warfarin)的減量使用、抗血小板藥物氯吡格雷(Simvastatin)的適用人群分類、他汀類降脂藥的副作用風(fēng)險(xiǎn)人群進(jìn)行了分析,這也進(jìn)一步佐證了針對我國人群特征的藥物基因組研究和藥物基因檢測的重要性。
結(jié)合上述研究成果可以看出,這一大規(guī)模中國人基因庫對代謝類疾病的評估、對重大慢性疾病的預(yù)防、對個(gè)體健康的管理和公共衛(wèi)生決策,都具有不小的價(jià)值。
引用來源:
[1]https://mp.weixin.qq.com/s/BIQ6hcO7KFkUOBCY-wC-MQ
[2]https://www.nature.com/articles/s41422-020-0322-9
雷鋒網(wǎng)