當前大模型已成為人工智能(AI)國際競爭的「兵家必爭之地」,中國是全球大模型技術迭代速度最快的國家之一,高性能大模型的數量和質量不斷躍升。昨日在上海召開的「文心Moment」大會上,百度發布並上線原生全模態大模型文心5.0正式版。該模型參數達2.4萬億,採用原生全模態統一建模技術,具備全模態理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出,多項權威評測居全球第一梯隊。市場分析指,文心5.0正式版的上線,意味着原生全模態技術路線逐漸走向成熟與實用,體現了中國模型廠商在多模態大模型底層自主創新能力,有助於進一步提升中國AI在全球AI產業競爭中的技術話語權。
●香港文匯報記者 章蘿蘭 上海報道
去年11月,百度發布文心大模型5.0並上線Preview版本。此後,文心5.0系列模型多次登上LMArena全球大模型競技場。本月15日,文心5.0以1,460分位列LMArena文本榜內地第一、全球第八。據了解,在40餘項權威基準的綜合評測中,文心5.0正式版的語言與多模態理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,穩居全球第一梯隊,圖像與視頻生成能力與垂直領域專精模型相當,整體處於全球領先水平。
統一自回歸架構優化訓練
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜昨在大會上介紹,與業界多數採用「後期融合」的多模態方案不同,文心5.0的技術路線採用統一的自回歸架構,進行原生全模態建模,將文本、圖像、視頻、音頻等多源數據,在同一模型框架中進行聯合訓練,使得多模態特徵於統一架構下,充分融合併協同優化,實現原生的全模態統一理解與生成。此外,其超大規模混合專家結構,具備超稀疏激活參數,在保持模型強大能力的同時,有效提高推理效率。
值得一提的是,得益於原生全模態建模,文心5.0在多模理解、代碼、創意寫作等能力上實現顯著突破。在創意寫作任務中,還能模擬《紅樓夢》中王熙鳳的語言風格,生成融合古典語境與現代商業邏輯的「大觀園資產重組方案」,展現出較強的情境理解與創作能力。
835位各層面專家指導大模型
另據吳甜介紹,「文心導師」隊伍持續壯大,目前已吸納835位來自科技、金融、文化、教育、醫療、能源等十餘個重點行業、以及數理化生文史哲等學科的專家,在知識傳授、鑒賞評價、專業校準方面,對大模型進行指導,幫助模型在邏輯嚴謹性、專業深度、創意質量和價值觀對齊等方面不斷精進。
目前,文心5.0正式版已可在百度千帆平台調用,文心一言官網、百度慧播星及文心助手等其他百度AI產品也已接入。此前,文心助手月活用户數已突破2億,與豆包、千問形成內地三大億級AI入口。文心助手是百度APP推出的依託文心大模型和「百度獵户座」AI引擎的AI智能助手。
官方數據顯示,截至去年7月下旬,中國已發布1,509個大模型,在全球3,755個大模型中位居首位。憑藉在技術創新、落地應用、生態搭建等多個維度協同發展,中國大模型邁入全球第一梯隊,成為引領生產力躍遷式發展的智能底座。美國麻省理工學院與開源社區Hugging Face的聯合報告指,過去一年,中國研發的開源人工智能模型全球下載量佔比達到17.1%,超越美國的15.8%,位居全球第一。

0 / 255