香港文匯報訊 阿里巴巴旗下千問發布新一代全模態大模型Qwen3.5-Omni,據悉在文本、圖片、音訊、音視頻理解、推理等215項交互任務中獲得SOTA(性能最佳)成績,超越Google的Gemini-3.1 Pro。
據介紹,模型在海量文本、視覺及超過1億小時音視頻數據上進行原生多模態預訓練,相比Qwen3-Omni,Qwen3.5-Omni多語言能力大大增強,能支持113種語種和方言語音辨識和36種語種和方言的語音生成。目前可通過Offline API和Realtime API進行體驗。其中,通用音訊理解、推理、識別、翻譯及對話全面超越Gemini-3.1 Pro,音視頻理解能力總體達到Gemini-3.1 Pro水平,視覺及文本能力達到同尺寸Qwen3.5模型效果。一般用戶可於Qwen Chat免費體驗,開發者和企業可通過阿里雲百煉平台使用,每百萬Tokens少於0.8元人民幣,比Gemini-3.1 Pro的十分一還低。
評論成功,請等待管理員審核...

評論(0)
0 / 255