(香港文匯報記者 曾業俊)數碼港人工智能超算中心於去年12月正式投入服務,特區政府更撥款30億元,通過數碼港推出為期3年的「人工智能資助計劃」,資助本地院校、研發機構及企業等運用超算中心,推動人工智能創新研發及應用。人工智能資助計劃委員會主席冼漢廸昨日表示,資助計劃自去年10月啟動以來,委員會已收到逾20宗申請。截至今年6月底,委員會已批出10項目,來自本地院校及研發機構,研究涵蓋本地大語言模型、新材料、合成生物學、醫學大模型等,總資助額超過3億元。另外,為滿足本港AI發展,超算中心算力總容量今年內將由1,300 PFLOPS提升至3,000 PFLOPS(1個PFLOPS單位代表每秒1千萬億次的浮點運算)。

●人工智能資助計劃委員會主席冼漢廸(左二)指,人工智能資助計劃自去年10月啟動以來,委員會已收到逾20宗申請。旁為數碼港人工智能應用總監霍露明(右二)。 香港文匯報實習記者黃安琪 攝

冼漢廸續指,獲批項目自今年1月起陸續使用超算中心服務,目前已投入服務的算力超過九成,充分反映科研及業界對算力應用的熱切需求。資助計劃除提供算力資助,亦積極加強超算中心的網絡及數據安全,以及透過宣傳推廣和人才培育,匯聚海內外AI企業、專家和研發項目落戶香港,為本港AI發展注入新動力。

預留1億提升中心安全技術

數碼港人工智能應用總監霍露明表示,現時超算中心的算力總容量已達1,300 PFLOPS,今年內會提升至3,000 PFLOPS算力水平,足夠支持本港不同AI發展。10個已獲批項目中,除院校外,亦有研發中心、企業和政府部門,並包括商業機構的項目,相信未來審批項目的趨勢會更快更多。最近亦收到包括國際企業在內的新申請,這些企業表示在香港進行AI研發時無法得到足夠算力,因此積極申請「人工智能資助計劃」。此外,數碼港正積極提升AI的安全領域,坦言「愈多AI,愈難保障安全」。因此在30億元撥款之中,已預留1億元以不斷提升安全方面的技術,增強超算中心的整體安全水平。同時,數碼港又會提升業界對AI安全應用的意識,因此持續舉辦培訓、論壇和經驗分享。

數碼港人工智能資助計劃批出10項目涉資3億元,涵蓋本地大語言模型、新材料等,分享會亦邀請獲批項目的代表分享,包括香港理工大學研發「增強邊緣基礎模型以實現高級推理」,及「基於多模態大語言模型的肝細胞癌精準治療」以及香港生成式人工智能研發中心(HKGAI)研發的「香港音聲基座大模型」。

對於有項目未獲批准,霍露明回應指,評審項目主要根據4個要求,除算力和技術團隊能力外,最主要考慮因素是希望項目與香港相關,促進提升香港的AI能力。由於有申請項目暫時在香港未有研發團隊,或者未必主要在港應用,所以暫時未能獲批。數碼港會不斷調整計劃內容和評核標準,着重項目的廣泛性;強調只要項目本身具價值,並為香港帶來正面影響,無論是數碼港或審批委員會都會大力支持。

問及超算中心的芯片配置,霍露明透露,現時超算中心使用的芯片全是輝達H800芯片,是目前本港性能最高的芯片,最適合做模型訓練。不過,數碼港希望盡快有AI項目可以落地應用,正考慮在下一階段引入推理型芯片。她認為,芯片產地並非最重要,反而會優先考慮芯片性能及性價比是否適合未來的AI項目落地應用,為進行推理的項目提供更好選擇。

數碼港匯聚企業年增逾120間

霍露明又提到,現時數碼港匯聚超過400間AI領先企業和初創企業,在過去1年增加超過120間,更引進多間AI重點企業落戶。數碼港亦與金管局合作推出生成式人工智能(GenA.I.)沙盒,超算中心提供專用平台,助力研發在風險管理、欺詐偵測、客戶互動等方面的生成式AI應用,促進金融創新及金融產業智能化轉型。

借助數碼港高算力設施 理大團隊聚焦腫瘤醫療

(實習記者 黃安琪)香港理工大學計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞昨日在數碼港人工智能超算中心活動上分享指,其團隊正專注於探索大模型技術在高精尖醫療領域的應用,特別聚焦於腫瘤領域。她指,由於醫療數據受隱私保護等限制無法上雲端,遂致力解決大模型落地的「最後一公里」問題,而香港擁有極高的人才密度以及國際化程度,團隊冀借助數碼港的算力,在香港實現世界領先的技術。

●香港理大楊紅霞表示,GPU算力是非常重要的,團隊希望借助數碼港的算力,讓香港也有世界領先的技術。 香港文匯報實習記者黃安琪 攝

去中心化範式助保護隱私

楊紅霞表示,傳統中心化模式需要將所有數據與GPU資源集中處理,而團隊採用去中心化或協作式的範式,降低對GPU資源的需求。在面對數據隱私與去中心化的問題時,楊紅霞說,傳統的中心化模式需要將數據集中到一個地方,這會引發數據隱私問題,合作機構通常不願將數據上傳。因此,團隊採用去中心化的範式,通過本地化部署與模型融合,降低算力需求,提升效率,並保護數據隱私。

楊紅霞昨亦介紹她帶領研發的「增強邊緣基礎模型以實現高級推理」及「基於多模態大語言模型的肝細胞癌精準治療」項目。針對人工智能算力,楊指出,GPU算力是非常重要的,團隊希望借助數碼港的算力,讓香港也有世界領先的技術。

楊紅霞闡述選擇在香港開展項目的原因,首先,香港擁有極高的人才密度,是少數能在一座城市匯聚8所優秀大學的地方。其次,香港作為國際化程度最高的城市之一,能夠幫助大模型面向國際,面向全球。

與多家醫院展開合作測試

在項目的商業化進展方面,她提到,項目已經獲得了盈利,並且吸引了投資,與合作夥伴共同創建實驗室。然而,她強調,商業化並非當前的緊迫問題,而學校最大的優勢「在於能夠沉下心」,專注於解決具有超級技術壁壘的問題。目前,團隊已與內地和香港的多家醫院展開合作或初步測試,旨在提高腫瘤判斷的準確率及實現腫瘤放射的不同能量。

科大針對港人「雙語混雜」 建立多用途三語模型

(記者 曾業俊)「香港音頻基礎模型」是參與數碼港「人工智能資助計劃」的獲批項目之一。該項目旨在建設「多語種音頻語料庫」,現已成功建立一個包含50萬小時高質量粵語、普通話和英語錄音的大規模多語種音頻語料庫,覆蓋香港獨特三語環境中的各種口音,支持自動語音識別(ASR)、文本轉語音(TTS)和對話系統的精準訓練與微調。同時,項目開發了「HKMeeting港會通系統」,是專門應付香港會議場景的解決方案,能自動將會議語音內容轉換為文字紀錄,輸出高度提煉總結,並生成會議紀要。

●香港科大郭毅可教授表示,已成功建立一個包含50萬小時高質量粵語、普通話和英語錄音的大規模多語種音頻語料庫。 香港文匯報實習記者黃安琪 攝

負責上述項目的香港科技大學首席副校長、香港生成式人工智能研發中心主任郭毅可教授昨日表示,該研發項目需要訓練AI模型,為其他模型提供數據,因此「算得多、算得快」是最重要,並「需要很多機器提供算力」,而資助計劃及超算中心正正為項目提供最重要的算力。假如沒有資助項目,相信研發進度可能會延遲至少3個月到半年。

府採「港會通」開會 研增安全性

對於研發項目的成效,郭毅可透露,目前項目語音系統的準確率取決於應用場景,一般大概在88%至95%之間,應用於會議綽綽有餘。目前已有政府部門正在使用「港會通系統」,研發團隊未來會持續提升系統安全性。面對同類的AI語音翻譯系統競爭,郭毅可指出香港的語言場景特色是經常「雙語混雜」,港人對話時雖然主要使用粵語,但經常突然冒出幾句英文,有時更會有粵語、普通話、英文三語混雜,而他團隊研發的系統在這方面做得比同業優勝。他們的模型訓練主要採用香港數據,收集大量專業名詞,在翻譯專業知識方面會比同類系統更為準確。研發團隊未來會繼續為系統注入香港特色,會做得更深入,包括增添更多專有名詞和字詞的特殊用法,作為系統長項。

 

責任編輯: 孫嬌嬌