
AI權威楊紅霞:為下一代高效能技術提供示範 助力國家成人工智能創新高地
生成式人工智能(GenAI)作為一項顛覆性技術,正深刻影響全球經濟與科技格局。然而,由於全球算力短缺、計算資源分布不均等問題,傳統以集中式計算為核心的生成式AI開發模式面臨嚴峻挑戰。目前,主流方法依賴大規模數據中心與高性能計算集群,這種「數據計算集中化」模式經濟上難以持續,並產生兩個關鍵瓶頸:一是人工智能專家因計算資源限制而導致研究受限;二是領域專家與專業知識參與人工智能合作共建受限。
現有生成式AI研究主要聚焦於擴展集中式計算能力,形成少數資源豐富機構主導的「算力霸權」,限制了更廣泛學術界與技術社群的創新能力。同時,由於模型開發局限於電腦科學視角,缺乏領域專家的深度參與,許多行業特定需求和跨學科應用場景未被充分挖掘。
為應對上述問題,我的研究團隊提出一種不同於現有「數據驅動模型」(Model over Data)的新型「模型驅動模型」(Model over Models)機器學習範式,並設計了協作式人工智能框架(Co-GenAI),透過分布式計算架構,將數百個領域專用模型整合為統一的基礎模型,顯著降低對集中式資源的依賴,促進多學科協作與創新。透過「模型驅動模型」的新範式,期望能打破傳統以數據為核心的壟斷模式,突破我國在生成式AI發展中的現實限制,同時探索基於多個模型之間協同交互的動態組合方式,為全球下一代高效能AI技術提供示範案例,助力中國穩步邁向國際領先的人工智能創新高地。
現有的「數據驅動模型」範式,需要模型基於損失函數持續擬合廣域數據,以達到模型能力的提升。對於新的「模型驅動模型」範式,基於不同領域專家模型進行模型驅動與模型融合,須着重解決模型與數據的穩健綜合排名問題,以建立無須額外算力開銷的有效模型篩選機制。
首先,我們團隊深入探索了如何克服現有訓練範式對數據的依賴所帶來對大規模集中化集群的極高需求。獲取跨領域的專家模型需要基於高品質領域數據進行領域適應訓練,其核心在於建構去中心化算力依賴的領域專家模型架構,尤其是在有限資源下實現高效模型更新和領域適配。
其次,基於能有效處理跨領域數據的綜合排名框架,設計演算法以實現數據排名的準確性及公平性,確保排名過程不受基準數據偏差影響,提升數據評估結果的可靠性。
此外,基於上述模型篩選庫,針對不同架構模型的融合挑戰,建構融合策略新範式,突破現有同構模型合併的限制,實現異構模型間的高效融合,以充分利用各模型的差異化能力。
AI的應用領域正迅速擴展,現已涵蓋醫療診斷、金融科技、智慧城市、自動駕駛、智能製造及個性化教育等,未來更可望深入至精準醫療、智慧能源管理與虛實融合(如元宇宙)等創新領域。
發展AI對香港及國家而言意義重大,香港應重點布局智慧金融、智慧物流、醫療科技及智慧城市等領域,加強與內地城市及國際科研機構的合作,推動跨界創新,以發揮香港在基礎研究、高等教育、國際化人才等方面的優勢,促進國家創新體系的融合發展。
籲港加強育才 鼓勵產業落地
儘管香港在人才儲備、全球視野及資金流動性等方面有明顯優勢,但同時面對市場規模較小、產業生態不足及高端技術人才流失等挑戰,需要政府、企業和高等院校協同合作,加強人才培養和政策引導,鼓勵產業落地和創新企業發展,提升AI領域的全球競爭力,為國家乃至世界科技發展作出積極貢獻。
●香港理工大學計算機及數學科學學院副院長 (環球事務)及電子計算學系教授 楊紅霞
評論