我国科学家发布首个中国人群专属的泛基因组参考图谱
今年正值国际人类基因组计划(HGP)完成20周年,人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”。近日,复旦大学、西安交大、中国医学科学院等26家单位联合发布了中国人群泛基因组联盟(CPC)一期研究进展。6月14日,相关成果以《基于36个族群的中国人泛基因组参考图谱》为题发表于《自然》(Nature)主刊。据悉,这是我国学者领导的人群基因组研究首次发表在《自然》主刊。
“中国人群泛基因组联盟”一期36个族群画像集
此次研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及大量潜在功能原件包括至少1367个蛋白质编码基因;并发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA 修复、免疫反应以及寿命等表型或功能相关。
人类参考基因组是广泛用于人类遗传学和医学研究的遗传密码“导航图”,也是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。据了解,目前通用的人类参考基因组均基于欧洲白人为主体样本构建,难以代表非欧裔族群、尤其我国族群的基因组多样性。即便是最新发表的人类泛基因组国际联盟(HPRC)收集了全球范围的46例样本,也仅包含3例中国汉族样本。
CPC一期核心样本地理分布及语系、族群、遗传聚类关系
作为人口大国,我国巨大的人口基数和丰富的人群多样性是发展人类基因组学和精准医学的重要优势。为了构建高质量高精度的中国人群泛基因组参考图谱,复旦大学徐书华教授、西安交通大学叶凯教授联合国内26家单位发起了中国人群泛基因组联盟(Chinese Pangenome Consortium, CPC),旨在建立我国专属参考基因组和泛基因组资源和分析体系,形成我国自主可控的人类基因组资源与核心技术,支撑精准医学发展,服务“健康中国”战略。
徐书华介绍,在第一期研究计划中,中国人群泛基因组联盟对代表中国36个族群的58个样本采用最新的第三代高保真基因组测序技术进行了深度测序,结合最新的单倍型基因组组装方法,获取了116个高质量单倍型基因组,并以图基因组的方式构建了高质量中国人群参考泛基因组。
与人类泛基因组国际联盟(HPRC)的泛基因组图谱相比,中国人群泛基因组联盟(CPC)泛基因组图谱作为首个中国人群专属的泛基因组参考图谱,在中国人群特有的复杂变异解析方面具有显著优势。
研究人员进一步揭示,CPC新发现的一些遗传变异可能与亚洲人群特有的疾病易感性及表型多样性有关。一个典型的例子是α-珠蛋白基因簇,研究人员在该基因区域鉴定出两个中国人群特异性的大规模结构变异,包括一段20 kb的缺失序列和一段10 kb的重复序列,这将为进一步研究中国人群贫血症的遗传机理和致病机制提供新的线索。
中国科学院院士赵国屏认为,在如今的基因组研究态势中,依然不可忽视我国丰富的人类遗传资源(特别是由多民族组成的占世界人口总数20%以上的中华民族群体)是研究人类基因组多样性、人类进化和人类疾病相关基因的宝贵材料;同样,发展中国的医疗事业和生物医药产业必需要拥有中国自己的完整的基因组信息,包括我国专属参考基因组和泛基因组资源和分析体系,形成我国自主可控的人类基因组资源与核心技术。
CPC对我国族群特异的复杂基因组结构变异解析示例
复旦大学校长、中国科学院院士金力表示,近年来,动物、植物、非人灵长类、反刍动物等领域的基因组学研究进展很快,取得了令人瞩目的成绩。相比之下,人类基因组研究显得有所“滞后”。而此次发表的成果,打破了人类基因组学研究的这种“停滞”,也是我国科学家在人类基因组研究领域取得的又一重大进展。
复旦大学徐书华教授、西安交通大学叶凯教授、中国医学科学院褚嘉祐教授和复旦大学陆艳副教授为论文的共同通讯作者。复旦大学博士后高扬,西安交通大学杨晓飞副教授,中国科学院上海营养与健康研究所博士生陈豪、谭昕江,中国医学科学院杨昭庆研究员以及复旦大学邓恋青年研究员为论文的并列第一作者。(光明日报全媒体记者 任鹏 颜维琦)