谷歌旗下「深層思維」公司29日在英國《自然》雜誌刊發封面文章介紹,該公司推出的AlphaGenome深度學習模型能解碼人類基因組中98%對健康至關重要的「暗基因組」,未來可用於深入了解遺傳疾病、改進基因檢測並為新療法的研發提供信息。
人類基因組由約30億個DNA鹼基對組成,DNA雙螺旋結構由A、T、C、G四種鹼基有序排列而成。其中,負責編碼蛋白質的基因僅佔約2%,而約98%的區域為非編碼區,這些通常被稱為「暗基因組」的區域雖不直接編碼蛋白質,卻能影響基因表達。大量與疾病相關的變異位點正位於這些被科學界知之甚少的非編碼區。
傳統方法往往需要在序列長度和預測精度之間做出權衡,AlphaGenome模型則打破了這一技術瓶頸,實現了對長DNA序列進行高分辨率預測。該模型利用人類和小鼠的基因組進行訓練,並學習了DNA序列如何影響各種生物過程。
研究顯示,AlphaGenome模型可以預測長達100萬個鹼基對的DNA序列的功能。這一工具不僅可以預測基因的位置,還可以預測「暗基因組」對基因表達和基因剪接等產生的影響。值得一提的是,該模型可以預測遺傳密碼中單個「字母」(單鹼基)的變化所帶來的影響。
研究團隊通過26項基準測試對AlphaGenome模型進行了綜合評估,結果顯示,該模型在25項任務中達到或優於現有最先進模型的水平。
「深層思維」公司團隊當天在社交媒體說,這一工具可幫助科研人員了解DNA,預測基因變化的分子影響,並推動新的生物學發現。
AlphaGenome模型已於去年開放給非商業用途,此後已有3000名科學家使用過該工具。雖然開發該模型的研究團隊表示這一模型並不完美,但一些科研人員已將其描述為「一項了不起的成就」和「一個重要的里程碑」。
(來源:新華社)
責任編輯:
之袁
評論成功,請等待管理員審核...

評論(0)
0 / 255