北京時間周六凌晨,OpenAI官宣推出新一代旗艦大模型GPT‑5.6系列。但由於美國政府的阻撓,目前只有獲得美國政府批准的一小撮「受信任合作夥伴」能夠用上這款代表人類AI能力新巔峰的大模型。
據OpenAI介紹,GPT‑5.6系列一共有3款模型:旗艦模型Sol、適合日常工作的均衡型模型Terra,以及快速且經濟的Luna模型。
用更容易理解的角度來解釋,這三個單詞也有太陽、地球和月亮的含義。
其中,GPT‑5.6 Sol能夠引入更高等級的推理強度,讓AI有更多時間進行深入推理;同時,OpenAI還推出利用子智能體加速複雜任務的GPT‑5.6 Sol Ultra模式。
OpenAI聲稱,在檢驗編程工作流的Terminal‑Bench 2.1測試中,GPT‑5.6 Sol的表現略好於主要競爭對手Anthropic的Mythos預覽模型。同時Terra的表現與Mythos模型的首個公開發布版本Fable 5持平。主打輕量化的Luna模型,也能比競品Anthropic目前仍能公開提供服務的旗艦模型Opus 4.8強上一些。
而在名為ExploitBench的網絡安全基準測試中,Sol與Mythos預覽模型表現相當,但僅使用了三分之一的輸出詞元(顯著省錢)。
定價方面,旗艦模型Sol的輸入/輸出價格為每百萬詞元5美元/30美元;均衡模型Terra為2.5美元/15美元;輕量模型Luna為1美元/6美元。
對於資本市場而言,眼下更大的不確定性在於,GPT‑5.6和Mythos/Fable模型均在美國政府的要求下禁止對廣泛公眾開放。
大約在兩周前,Anthropic上線Fable 5僅3天便火速下線,原因是收到美國政府出口管制指令,禁止一切外國國民(含Anthropic外籍員工)訪問Fable 5與Mythos模型。
美國政府也對GPT-5.6採取了類似的措施。據報道,OpenAI掌門山姆·奧爾特曼在周四的內部員工備忘錄中提及,美國政府將在此次GPT‑5.6預覽期間「逐個批准客戶訪問申請」。
OpenAI也在周五的公告中表示,他們不認為「這種政府訪問審批流程應成為長期默認做法」,因為它「剝奪了需要這些最佳工具的用戶、開發者、企業、網絡防禦者和全球合作夥伴的使用權」。
公司同時表示,目前的「短期措施」,是在未來幾周實現更廣泛開放的最有力路徑。OpenAI未來將與政府合作,制定網絡安全行政令框架,以及可重複執行的模型發布流程。
作為「求生欲」的象徵,OpenAI公告中半數以上篇幅都在談論如何保障前沿大模型不被用於網絡攻擊等惡意行為。
公司表示,GPT-5.6被訓練為會拒絕提供被禁止的網絡安全協助。即便這一層防護被惡意行為者通過不斷嘗試提示詞繞過,實時網絡安全和生物學濫用分類器也會在模型生成輸出的過程中進行評估,並對潛在惡意行為進行攔截。
OpenAI同時警告稱,被標記的活動可能觸發對相關對話和風險信號的賬戶級審查。
公司補充稱,GPT‑5.6模型尚未觸及OpenAI所界定的「關鍵網絡安全風險」門檻,該門檻被定義為帶來「前所未有的通向嚴重危害的新途徑」。
(來源:財聯社)

評論(0)
0 / 255