高通量测序技术为遗传疾病研究开辟新途径
深圳华大基因研究院项目总监,从事生物信息分析工作。2004年毕业于南开大学应用物理系,2008年在南丹麦大学生物化学和分子生物系做访问博士。2010年获中科院博士学位。
随着人类基因组计划的完成,以及“功能基因组学”、“表观基因组”和“蛋白质组学”等一系列被称为“后基因组时代”的项目启动,人类对疾病机制的研究逐步加深,而遗传因素在疾病发生和发展中的作用一直是科学研究的前沿和热点。层出不穷的新发现、新概念和新理论,尤其是日新月异的新技术,对于人们解密揭示遗传性疾病的机制提供了新的思路和工具。在众多的新技术中,高通量组学技术在近几年中得到了蓬勃发展,从而引入了崭新的大科学研究——系统生物学。系统生物学是以整体性研究为特征,研究一个生物系统中所有组成成分(DNA,RNA,蛋白质等)在特定条件下的相互作用关系。本文仅在DNA序列的层次上,介绍最新的高通量基因组测序技术如何应用在遗传疾病研究。
通常来说,遗传性疾病分为5大类:呈现特征性家系传递格局的单基因遗传疾病,起因于遗传和环境双因素且多有家族聚集现象的多基因遗传病,染色体数目或节段异常引起的染色体病,线粒体基因突变导致的线粒体疾病和以体细胞遗传物质突变为直接原因的体细胞遗传病。于是,在遗传疾病的研究中,首先要确定要研究的疾病属于哪一类遗传疾病,然后选择合适的研究方法和技术。 检验地带网
全基因组外显子测序技术的应用
基因组和基因是两个不同的概念,狭义的基因仅仅指能够发生转录并最终编码为蛋白质的DNA序列,而基因组则是对人类全部DNA序列的总称。根据2001年国际人类基因组计划公布的结果,在人类基因组中只有3万~4万个编码蛋白质的基因,仅仅占人类基因组全序列的不足2%。通过高通量基因组测序技术,我们希望找到与遗传疾病相关的基因组序列与结构的异常变化,从而确定致病原因。在基因组学的范畴内,检测DNA的碱基突变替换和DNA的结构变异是基因组技术的两个重要的方向。近两年,新一代测序技术飞速发展,包括Roche GS FLX,Illumina GA和ABI SOLiD。这些新一代测序技术,将基因组序列的测序成本大大降低,从而也引发了新一轮的遗传疾病研究的高潮,其中以探究单基因病发病原因为主要目的的全基因组外显子测序技术应运而生。
全基因组外显子测序技术大致分为两个步骤。首先,将人类基因组中所有已知的编码蛋白质的基因序列进行富集,刚刚已经说过,这些序列仅仅占人类基因组序列中不足2%。这就是说,通过这一步富集,针对每一个患者的待测序的序列总量被大大地降低了,同时,导致单基因疾病的突变信息被最大程度地富集保留下来。然后,使用新一代测序技术对富集保留的DNA序列进行高覆盖深度的测序,高质量高通量地获取所有基因的编码蛋白质区域的碱基突变信息。从遗传学角度来说,基因功能丧失导致的表型,多数是由于某一个基因突变后使其所表达的蛋白质失活。这种突变可以是点突变,也可以是基因紊乱所致。例如人的I型Waarden-burg综合征,就是PAX3基因中的突变引起氨基酸替换、移框突变、剪切突变或整个基因丢失引起的。 检验地带网