
(香港文匯網記者 毛麗娟)在6月20日下午舉行的華為開發者大會2025(HDC 2025)上,華為常務董事、華為雲計算CEO張平安宣布基於CloudMatrix 384超節點的新一代昇騰AI雲服務全面上線,為大模型應用提供澎湃算力;宣布盤古大模型5.5正式發布,自然語言處理(NLP)、計算機視覺(CV)、多模態、預測、科學計算五大基礎模型全面升級。張平安強調,盤古大模型是基於昇騰雲的全棧軟硬件訓練而成的,這標誌着基於昇騰架構可以打造出世界一流大模型。
新一代昇騰AI雲服務全面打造最適合大模型應用的算力服務
隨着大模型訓練和推理對算力需求的爆炸式增長,傳統計算架構已難以支撐AI技術的代際躍遷。華為雲新一代昇騰AI雲服務基於CloudMatrix 384超節點,首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一台超級「AI服務器」,單卡推理吞吐量躍升到2300 Tokens/s,與非超節點相比提升近4倍。超節點架構能更好地支持混合多專家MoE大模型的推理,可以實現「一卡一專家」,一個超節點可以支持384個專家並行推理,極大提升效率;同時,超節點還可以支持「一卡一算子任務」,靈活分配資源,提升任務並行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
當前,昇騰AI雲服務已經成為AI基礎設施的最優選擇,為科大訊飛、新浪、硅基流動、面壁智能、中科院、360等超過1300家客戶提供澎湃的AI算力,加速千行萬業智能化升級。
盤古大模型5.5全面升級 5分鐘內生成萬字專業調研報告
一直以來,華為雲盤古大模型都堅定地聚焦行業,在解難題、做難事的道路上不斷攻堅克難,重塑千行萬業。本次大會上,華為雲重磅發布盤古大模型5.5,五大基礎模型全面升級,為行業提供全新價值。
盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數據和兩階段漸進訓練,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回覆,複雜問題深度思考,整體模型推理效率提升8倍。盤古深度研究DeepDiver通過長鏈難題合成、漸進式獎勵等關鍵技術,可以在網頁搜索、常識性問答等應用上獲得很高的執行效率,如可以在5分鐘內完成超過10跳的複雜問答、生成萬字以上的專業調研報告等,大幅提升工作效率。
張平安表示,盤古大模型的使命是讓各個行業不必重複「造輪子」,不必從零打造自己的企業大模型。華為雲面向企業提供了盤古基礎及行業大模型、預訓練和後訓練語料、數據工程工具集、模型訓練工具集、行業裁判模型、行業評測平台六大核心能力,通過華為雲ModelArts完備的工具鏈和工程化的方法,將企業自己沉澱的數據資產,進行高質量的增訓、微調和強化學習,讓行業客戶能夠快速打造自己的專業大模型。
中國農業科學院在盤古大模型基礎上,增訓海量專業文獻與跨物種多組學數據,構建了面向育種領域的農業科學發現大模型,實現精準農業專業知識問答、高效基因分析和定向位點設計,縮短了早期研發周期,提升了目標性狀改良精準性。當前,農科院團隊已基於該農業科研智能系統成功地對一種水稻材料進行了株型改良,株高較常規品種降低約25%,抗倒伏能力顯著提升,同時產量不受影響。
會上,張平安發布盤古醫學、金融、政務、工業、汽車五個具備深度思考能力的行業自然語言大模型,加速行業智能化,並將在6月底正式上線。
評論