(香港文匯網記者趙臣 合肥報道)記者今日(3月4日)從科大訊飛獲悉,科大訊飛星火深度推理模型X1近日完成全面升級,並基於星火X1首發星火醫療大模型X1。

繼今年1月15日訊飛發布首個深度推理模型——訊飛星火X1後,時隔一個半月,星火X1迎來全新升級。此次升級在數學答題方面的表現實現了全面提升,特別是在應對競賽級難題時,提升尤為顯著。同時,星火X1在中小學數學作業的批改、輔導以及題目推薦等任務上也展現出了明顯的優勢。

測試集合來源:中文測試集來自2023/2024年各學段考試真題/模擬題/競賽題,英文測試集來自AIME 2024/2025和MATH 500競賽集。受訪者供圖

1月15日發布的星火X1對思維鏈過程採取了「小標題+摘要」的結構化輸出方式,而本次升級,對X1的輸出格式進行了重新調整,直接原汁原味的輸出了X1的完整思維鏈,以便讓大家更清楚地看到和理解星火X1內部完整的思考過程。

據介紹,本次X1效果的提升得益於兩大技術創新:一是通過高效的領域數據自動化挖掘和多類型數據合成算法,構建了海量的數學領域預訓練數據,從而顯著提升了基座模型的數學專業能力;二是基於評語模型與強化學習算法,實現了大模型長思維鏈的激發,同時評語模型還促使大模型在推理過程中進行反思驗證,進一步提升了模型在推理階段的準確性。

用戶只需在訊飛星火網頁端或App的智能體中搜索「深度推理模型X1數學」,即可體驗其升級後的強大功能。本次星火X1技術升級,也已成功應用於科大訊飛旗下的多個行業大模型的迭代研發和多款產品的全新升級。

面向醫療領域,訊飛醫療首發星火醫療大模型X1。依託訊飛醫療多年來積累的億級權威精品醫學知識庫、億級高質量脫敏診療數據,以及在醫療專業知識增強、醫生的循證思維、長思維鏈過程的評語模型、樹搜索、醫生專家反饋強化學習等方面的聯合技術創新,醫療大模型X1大幅降低了醫療幻覺問題,在回答覆雜問題時,能夠逐步解釋循證過程,提高了醫療複雜場景推理的邏輯正確性、專業性、可解釋性。在診斷推薦、健康諮詢、檢查檢驗報告解讀等推理任務上效果均已大幅超過了GPT-4o以及DeepSeek R1。

數據來源:曉醫、智醫助理、安貞心內科等真實場景測試集。受訪者供圖

目前星火醫療大模型X1正式應用於AI健康助手「訊飛曉醫」,與個人健康檔案的融合更加深入,在用戶健康諮詢時,它能深度洞察用戶健康狀況並思考潛在需求,有效解決了過往AI醫療諮詢中「建議答案寬泛不實用」的痛點,給出的醫療建議更加個性化、更具體實用。例如,用戶在諮詢疾病用藥時,曉醫能夠循證指出該疾病正確的用藥原則,同時結合個人既往健康狀況,給出更適合更詳實的處理意見和注意事項。

此外,在升級後的星火X1加持下,科大訊飛旗下訊飛曉醫、星火教師助手、AI學習機等重要產品也實現了全新升級。