根據大模型測評榜LiveBench發表最新一期排名,阿里巴巴(9988)開源的新一代通義千問模型Qwen3,成為全球開源模型冠軍。

香港文匯報訊(記者 黎梓田)根據大模型測評榜LiveBench發表最新一期排名,阿里巴巴(9988)開源的新一代通義千問模型Qwen3,成為全球開源模型冠軍。Qwen3亦在指令遵循(Instruction Following)這一關鍵能力上超越OpenAI的o3 High、o4-Mini High及谷歌(Google)旗下Gemini 2.5 pro等頂級閉源模型,位列全球第一。

LiveBench榜單從數學、推理、編程、語言理解等多個複雜維度,全面評估大模型,因其採用動態更新的題庫,被譽為「全球首個無法作弊的模型基準測試」。

阿里開源Qwen3,包括兩個混合專家(MoE)模型及6個密集模型,參數範圍由6億到2350億不等。Qwen3支援119種語言及方言,不但採用混合專家架構,更是阿里首次推出「混合推理模型」,可以花時間「推理」複雜問題,或快速回答更簡單的請求。