耗廿多年尋最後拼圖 基因「暗物質」終見天日
被譽為生命科學「登月計劃」的人類基因組測序再次取得重大進展,國際科學團隊端粒到端粒聯盟(T2T)前日發表了第一個完整的、無間隙的人類基因組序列,不僅填補先前研究人員努力後仍遺留下的空缺,同時也為全球79億人口尋找有關致病突變、老化和遺傳變異的線索,提供了新的希望。
人類基因組測序是一項已經持續30多年的龐大工程,由6國科學家共同參與的國際人類基因組計劃(HGP)早於1990年已經展開這項工程,並於2001年2月12日首次公布人類基因組圖譜及初步分析結果;2003年4月15日,HGP進一步公布人類基因組序列草圖。然而由於技術限制,當時號稱的「完整序列」實際仍留下了大約8%的「空白」間隙。
這部分未被測序的基因由高度重複、複雜的脫氧核糖核酸(DNA)塊組成,其中包含功能基因以及位於染色體中間和末端的着絲粒和端粒,由於難以跟其他部分相嚙合,難以進行測序。多年來一直參與人類基因組測序工作的華盛頓大學研究員艾希勒說:「一些使我們獨特地成為人類的基因,其實就存在於這些基因組的『暗物質』中,它們完全被遺漏了。花了20多年時間,我們終於完成了。」
較舊版本增2億鹼基對
為了報告這項成就,T2T的研究人員在最新一期《科學》期刊連發6篇論文,並將新的無間隙版本標準人類參考基因組序列命名為「T2T-CHM13」。新序列由30.55億個鹼基對和19,969個蛋白質編碼基因組成,較此前版本增加了近2億個鹼基對的新DNA序列,包括99個可能編碼蛋白質的基因和其中近2,000個需要進一步研究的候選新基因。
這些候選新基因大多數已沒有作用,但其中115個仍然可能有活性。團隊還在人類基因組中發現了大約200萬個額外的遺傳變異,其中622個出現在與醫學相關的基因中。此外,新序列還糾正了此前版本基因組中的數千個結構錯誤。
新細節揭示人類演變
具體而言,新序列填補的空白包括人類5條染色體的整個短臂,並覆蓋了基因組中一些最複雜的區域。其中包括在重要的染色體結構中及其周圍發現的高度重複的DNA序列,如染色體末端的端粒和在細胞分裂過程中協調複製染色體分離的着絲粒。新序列還揭示了以前未被發現的節段重複,即在基因組中複製的長DNA片段,已知其在進化和疾病中發揮重要作用。
新序列還在識別和解釋遺傳變異方面具有重要改進,並揭示了關於着絲粒周圍區域的前所未見的細節。這一區域內的變異性可能為人類祖先如何進化提供新證據。
有望降低個人測序成本
研究人員稱,這一完整的、無間隙的序列對於了解人類基因組變異的全譜和了解某些疾病的遺傳貢獻至關重要。研究人員表示,下一階段的研究將對不同人的基因組進行測序,以充分掌握人類基因的多樣性、作用以及我們與近親、其他靈長類動物的關係。
T2T聯席主席菲利普說,完整的人類基因組序列今後將有助大大降低個人基因組測序的成本和時間,「在不久將來,當某個人想將他的基因測序,我們將可以找到他的所有DNA變異,並利用有關資訊更好地幫助他管理健康。」菲利普形容真正完成人類基因組測序「就像戴上一副新眼鏡」,「我們終於可以看清楚所有東西,離了解他們的意義又前進了一步。」◆綜合報道
評論