港大新招識別細胞 十分鐘處理百萬個影像

◆ 何永基(左)與謝堅文(右)團隊開發嶄新生物信息分析技術VIA。 港大圖片
◆ 何永基(左)與謝堅文(右)團隊開發嶄新生物信息分析技術VIA。 港大圖片

  香港文匯報訊(記者 鍾健文)人體有約37萬億個細胞,若細胞老化或演變過程中出現問題,可導致疾病以至癌症。現時醫療科學專家要進行細胞基因序列和蛋白質成分等生物信息研究,牽涉大量數據分析,光是單細胞的訊息數據量就可多達過千GBytes,對科學界是巨大挑戰。香港大學工程學院電子工程系教授謝堅文率領跨學科研究團隊,開發出名為VIA的新穎生物信息分析技術,能處理數以百萬計細胞的同時,也可以有效識別細胞演化的最佳軌跡,並較以往最快的計算技術提速最少100倍;除了可用於癌症治療外,該技術已被美國和內地科研團隊應用於新冠病毒研究上。

  人體每個細胞都含有大量的生物信息,謝堅文昨介紹指,VIA是新穎的軌跡推理算法,利用「無監督式」機器學習方法模擬人腦的思維過程,發掘數據背後的邏輯規律並作出推算。團隊要廣泛收集單細胞蛋白質組學、基因相關和其他生物訊息的組學數據,以便對各個重要的生物過程作全面的分析研究,「細胞在正常健康和疾病過程中演變成不同的細胞狀態和類型,要準確預測這些演變的軌跡,從而了解身體如何正常發育及如何染病等,我們需有能力測量和分析每個細胞的所有相關特徵。」

  預測病情發展 加速藥物研發

  他舉例,VIA只用10分鐘就能對7種肺癌細胞共110萬個細胞影像自動分類以作細胞集群分析,比舊技術所需多於2小時快120倍;在軌跡推斷方面,VIA可推算出細胞狀態在骨髓造血過程中的微妙且複雜轉變,從而預測癌症病變及病情發展,為治療方案提供病理基礎,並加速製藥行業的藥物研發過程等 ,「這就像下山,只要我們知道下山者的身份、裝備、身體及精神狀況等信息並進行運算,就可以推算出他們不同的下山軌跡、終點、如何應變,以至會否成功等。」

  團隊又利用VIA運算130萬個小鼠胚胎單細胞的基因表現數據,準確將不同器官形成的先後過程展示。

  用於研究新冠 免卻常規程序

  謝堅文表示,現時已將VIA設定為開放使用工具與全球科學家分享,美國和內地科研團隊已將其應用於新冠病毒研究,例如推斷感染後免疫系統的反應,預測重症發生,疫苗產生的抗體量和反應,對療程的反應以及長遠影響等,從而免卻重複抽血檢查等部分常規程序。

  團隊成員、李嘉誠醫學院生物醫學學院副教授何永基指,VIA可大幅加快測序時間,由以往三四小時減至只需10分鐘,同一時間的檢測數量可從數人增加至幾百甚至幾千人,預料將會獲得更廣泛的應用。有關研究成果已於學術期刊《自然通訊》發表。