人体的构成复杂、奥妙,基本结构虽然相同,每人却是独一无二。
让我们一起探索基因组学,认识人体的奥妙。
什么是DNA?
DNA是Deoxyribonucleic Acid(脱氧核醣核酸)的缩写,存在于人体细胞之中。它的结构由两螺旋长链组成(如下图),长链上有四种像英文字母一样的「代码」,分别是:A、T、C和G。我们的身体,便是依靠这四种DNA代码以不同排序传递遗传讯息,一如在英语中,我们以26个英文字母组成不同的词汇及句子,表达各种意思。
什么是基因(Gene)?
基因是遗传指令的基本单位,影响着每人的身体结构和功能。
四种DNA代码A、T、C和G环环相扣,形成DNA长链。整条长链中只有一部分盛载了特定的遗传指令,便是「基因」。若以英语作比喻的话,基因便有如一段完整的句子或文章段落,用来表达一个完整的讯息。
什么是基因组(Genome)?
「基因组」(Genome)是指生物体内的「所有遗传物质」,而人类的基因组内有超过两万个基因。每人的基因组都是独一无二的,犹如身体的说明书,决定了每人拥有的不同特征,例如肤色、高度及患上不同疾病的潜在风险等等。
如果DNA是英文字母、基因是完整的句子和段落,那么基因组便是整部书,内容包括所有章节、段落、句子、图案以至排版等等。
若比较两位没有血缘关系的人,两者的基因组有99.9%相同,不同之处只占0.1%;然而,这看似微细的0.1%,却已包含数以百万计基因排序上的不同,足以为每人造就不同的身体特征及功能结构。
基因组 | 英语 |
---|---|
DNA 代码:A、T、C和G |
英文字母 |
由A、T、C和G组成DNA长链,带有特定遗传指令的部分,便是基因 |
以英文字母组成的完整句子或段落,用以表达特定讯息 |
基因组是人体内整套DNA,包括每个基因和DNA代码 |
整部书,包含所有章节、段落、句子、图案、排版等 |
要了解每人的基因组,便需进行「全基因组测序」(Whole Genome Sequencing,简称WGS)。进行全基因组测序,主要有以下三个步骤:
1. 测序(Sequencing)
顾名思义,测序便是把人体内超过30亿个DNA代码逐一读取,然后全部排列出来。
2. 数据处理(Data Processing)
从测序得出大量基因组数据后,生物信息学家便要把它们转化成可被解读的资讯。
首先,把已排列的DNA次序,与「人类参照基因组」(Human Reference Genome)比对,找出基因序列上的不同,这些不同称为基因变异。每人的身体均有数百万个基因变异,大部分基因变异是不会致病的,反而是这些变异,令每人的身体特征及功能结构各不相同。
3. 数据分析(Data Analysis)
要在数以百万计的基因变异中,找出有机会导致疾病的基因变异(pathogenic/likely pathogenic variant),不但需要依靠基因组医学和基因组科学的知识及发展,更需要配合大量病例,作长时间分析和研究,方有机会找出可能致病的基因变异。
基因组学 – 由「人类基因组计划」开始
1990年,跨国的科学家开始研究读取人类体内所有的DNA,并展开一个名为「人类基因组计划」(Human Genome Project,简称HGP)的巨型科学探索工程。整个研究历时超过10年,而人类首个基因组蓝图终于在2003年完成。
同时,科学家在该研究中运用了13个匿名基因组捐赠者的数据,组成一个「人类参照基因组」,供全球科研人员在进行基因组测序时,能以此「人类参照基因组」作基准,进行比对并找出基因变异。
「人类基因组计划」完成后,为医学及科学界开启了一道通往崭新领域的大门,发展出基因组学。
从「遗传学」到「基因组学」
以往科学家研究遗传学(Genetics),通常只针对研究每个基因的个别功能和结构。但自「人类基因组计划」完成、「全基因组测序」技术亦渐趋成熟,基因组学(Genomics)便成为科研的新领域。科学家不再只研究个别基因,更强调解读整个基因组,以及基因与基因之间的关系,如何互相影响或合作,以发挥作用。
基因组数据的重要性
从首个人类基因组蓝图完成至今,基因组学的发展一日千里,但科学家仍未能完全了解基因组与疾病之间的关联,因此更多真实案例及基因组数据对研究发展极为重要。
目前, 基因组学的研究大多以西方国家的数据为主。因此香港基因组计划的其中一个目的,便是建立一个属于本地人口的基因组数据库,让科学家可运用更多本地病例及数据作研究,从而找出基因组与疾病及治疗的关系,使病人及其家属得以受惠,同时促进香港基因组学的发展。