人體的構成複雜、奧妙,基本結構雖然相同,每人卻是獨一無二。
讓我們一起探索基因組學,認識人體的奧妙。
甚麼是DNA?
DNA 是Deoxyribonucleic Acid(去氧核醣核酸)的縮寫,存在於人體細胞之中。它的結構由兩螺旋長鏈組成(如下圖),長鏈上有四種像英文字母一樣的「代碼」,分別是:A、T、C和 G。我們的身體,便是依靠這四種DNA代碼以不同排序傳遞遺傳訊息,一如在英語中,我們以26個英文字母組成不同的詞彙及句子,表達各種意思。
甚麼是基因(Gene)?
基因是遺傳指令的基本單位,影響着每人的身體結構和功能。
四種DNA代碼A、T、C和G環環相扣,形成DNA長鏈。整條長鏈中只有一部分盛載了特定的遺傳指令,便是「基因」。若以英語作比喻的話,基因便有如一段完整的句子或文章段落,用來表達一個完整的訊息。
甚麼是基因組(Genome)?
「基因組」(Genome)是指生物體內的「所有遺傳物質」,而人類的基因組内有超過兩萬個基因。每人的基因組都是獨一無二的,猶如身體的說明書,決定了每人擁有的不同特徵,例如膚色、高度及患上不同疾病的潛在風險等等。
如果DNA是英文字母、基因是完整的句子和段落,那麼基因組便是整部書,內容包括所有章節、段落、句子、圖案以至排版等等。
若比較兩位沒有血緣關係的人,兩者的基因組有99.9%相同,不同之處只佔0.1%;然而,這看似微細的0.1%,卻已包含數以百萬計基因排序上的不同,足以為每人造就不同的身體特徵及功能結構。
基因組 | 英語 |
---|---|
DNA 代碼:A、T、C和G |
英文字母 |
由A、T、C和G組成DNA長鏈,帶有特定遺傳指令的部分,便是基因 |
以英文字母組成的完整句子或段落,用以表達特定訊息 |
基因組是人體內整套DNA,包括每個基因和DNA代碼 |
整部書,包含所有章節、段落、句子、圖案、排版等 |
要了解每人的基因組,便需進行「全基因組測序」(Whole Genome Sequencing,簡稱WGS)。進行全基因組測序,主要有以下三個步驟:
1. 測序(Sequencing)
顧名思義,測序便是把人體內超過30億個DNA代碼逐一讀取,然後全部排列出來。
2. 數據處理(Data Processing)
從測序得出大量基因組數據後,生物信息學家便要把它們轉化成可被解讀的資訊。
首先,把已排列的DNA次序,與「人類參照基因組」 (Human Reference Genome)比對,找出基因序列上的不同,這些不同稱為基因變異。每人的身體均有數百萬個基因變異,大部分基因變異是不會致病的,反而是這些變異,令每人的身體特徵及功能結構各不相同。
3. 數據分析(Data Analysis)
要在數以百萬計的基因變異中,找出有機會導致疾病的基因變異(pathogenic/likely pathogenic variant),不但需要依靠基因組醫學和基因組科學的知識及發展,更需要配合大量病例,作長時間分析和研究,方有機會找出可能致病的基因變異。
基因組學 – 由「人類基因組計劃」開始
1990年,跨國的科學家開始研究讀取人類體內所有的DNA,並展開一個名為「人類基因組計劃」(Human Genome Project,簡稱HGP)的巨型科學探索工程。整個研究歷時超過10年,而人類首個基因組藍圖終於在2003年完成。
同時,科學家在該研究中運用了13個匿名基因組捐贈者的數據,組成一個「人類參照基因組」,供全球科研人員在進行基因組測序時,能以此「人類參照基因組」作基準,進行比對並找出基因變異。
「人類基因組計劃」完成後,為醫學及科學界開啟了一道通往嶄新領域的大門,發展出基因組學。
從「遺傳學」到「基因組學」
以往科學家研究遺傳學(Genetics),通常只針對研究每個基因的個別功能和結構。但自「人類基因組計劃」完成、「全基因組測序」技術亦漸趨成熟,基因組學(Genomics)便成為科研的新領域。科學家不再只研究個別基因,更強調解讀整個基因組,以及基因與基因之間的關係,如何互相影響或合作,以發揮作用。
基因組數據的重要性
從首個人類基因組藍圖完成至今,基因組學的發展一日千里,但科學家仍未能完全了解基因組與疾病之間的關聯,因此更多真實案例及基因組數據對研究發展極為重要。
目前, 基因組學的研究大多以西方國家的數據為主。因此香港基因組計劃的其中一個目的,便是建立一個屬於本地人口的基因組數據庫,讓科學家可運用更多本地病例及數據作研究,從而找出基因組與疾病及治療的關係,使病人及其家屬得以受惠,同時促進香港基因組學的發展。