◆ 不同的蛋白質,有不同的形狀。圖為一種從白扁豆中萃取的蛋白質的模型。 資料圖片

人工智能是近日的一個熱話題,不僅已被應用到許多不同的領域,它的能耐更能與人類看齊,面對很多的工作時,人工智能的表現已能達到人類的水平,甚至還能幫助我們處理過去難於應付的問題,其中理解蛋白質的結構,正是這樣的一個例子。今次就跟大家探討一下這個課題。

酵素如積木 聚化學分子

蛋白質是我們身體中一種十分重要的物質,除了是我們肌肉的主要成分,還在身體中擔當許多重要的工作,例如調節各種身體內部運作的荷爾蒙,幫助我們消化食品、加速各種身體生化作用的酵素,都是蛋白質。理解這些蛋白質的形狀十分重要,比如說酵素好像積木一樣,能夠將形狀與它相符的幾個化學分子聚在一起,以加速它們之間的化學作用。正因如此,理解不同蛋白質的形狀,亦是明白我們身體是如何運作的很重要的一步。

由上千個氨基酸組成

現在我們已知道,蛋白質是由不同的氨基酸串連在一起組成,但是如何從一串串、不同排列的氨基酸中,推論出相對應的蛋白質的形狀,卻一直是科學家面對的大難題。一些蛋白質往往由上千個氨基酸組成,而不同的氨基酸之間又有不同的化學反應,會有不同程度的吸引或排斥;所以要仔細分析,這一連串的氨基酸如何因為相互之間的吸引或排斥而造成不同形狀的蛋白質,實在是不容易。

人工智能擅長處理大量數據,從中找出我們不一定留意到的規律。這些特點令人工智能十分適合挑戰蛋白質結構這個難題。AlphaFold及RoseTTAFold就是近年十分成功的利用人工智能推斷蛋白質形狀的平台。這兩個平台利用模仿人腦的神經網絡,將電腦資源連接起來以進行運算。

用已知結構蛋白質來推論

不過,我們也不用把人工智能太神化,因為人工智能也不是憑空就能懂得分析蛋白質結構的,它們還需利用已知的蛋白質結構來進行推論。這些平台的開發人員利用數以十萬計我們已經知道的蛋白質形狀來進行訓練。當訓練以後、這些平台面對新的蛋白質的時候,背後的人工智能就會參看新蛋白質的氨基酸排序,再從已經知道形狀的蛋白質之中,找出擁有相類排序的蛋白質例子。

相類排序造成相類形狀

基於「相類的氨基酸排序也應該會造成相類的形狀」的原理,這些我們已經知道形狀的蛋白質例子,就可以用來推斷新蛋白質的結構。當然,其他相關蛋白質的形狀也能夠幫助人工智能作出推論。

這些平台十分成功,至今已經預測了超過一億種蛋白質的形狀,大概是所有我們知道的蛋白質的一半。這當中不只涵蓋了大部分人體會製造的蛋白質,還包括了其他20種我們經常研究的物種(例如老鼠、大腸桿菌)。這些結果大大地加速了科學家的研究進度。

人工智能亦有它們的不足之處,例如在訓練時沒有充足數據的部分,人工智能自然也不能夠作出太可靠的推論,比如現在的人工智能平台就不太能夠處理突變的蛋白質。這些平台也主力研究蛋白質在隔離狀態下的形狀,但是當有其他生化分子在旁的時候,這些蛋白質會有怎樣的形狀改變?這就需要更多的研究了。

在人工智能的幫助下,許多相關的生物研究都隨之得到迅速的發展,更有不少科學家在開發新的研究方向。希望在不遠的未來能夠看到更多這些方面的突破。

◆ 杜子航 教育工作者

早年學習理工科目,一直致力推動科學教育與科普工作,近年開始關注電腦發展對社會的影響。