香港文匯報訊(記者 黎梓田)中國DeepSeek引發美股出現「小股災」,Perplexity AI創辦人史里尼瓦斯(Arvin Srinivas)向外媒表示,DeepSeek在資源限制條件下的創新顛覆了傳統AI訓練的「演算力至上」的邏輯。DeepSeek透過優化混合專家模型(MOE),解決了長期困擾產業的數值不穩定性問題,例如損失峰值的頻繁出現,其技術方案無需依賴額外基礎設施即可穩定訓練流程。
此外,該團隊在 GPU 記憶體受限的挑戰下,開創性採用8位元浮點訓練,動態平衡高精度與低精度計算,僅用60天完成模型更新,並支援低成本重複訓練;而美國主流仍停留在16浮點訓練階段。
更令人矚目的是,DeepSeek以極低資源消耗打造出性能相當於GPT-4o的模型,API價格便宜10-15倍,速度達每秒60 tokens,部分基準測試甚至接近或超越頂級閉源模型。這種效率革命不僅驗證了「必要是發明之母」的創新邏輯,更透過開源策略挑戰了「中國僅擅長複製」的刻板印象,其開源的405B模型品質接近GPT-4,遠超美國70B級本地運行模型。
中國的創新都是被逼出來的
DeepSeek的技術透明化,如公開14.8兆tokens訓練資料與開源生態佈局,可能引發全球開發者倒戈,挑戰美國閉源模式的壟斷地位,甚至倒逼Meta等公司調整技術路線,重塑產業競爭格局。
在中美人工智能競賽方面,史里尼瓦斯指出這場競爭的核心是效率創新與生態話語權之爭,而非單純的技術封鎖或演算力比拼。中國受限於低端GPU如H800,被迫透過演算法最佳化、資料品質提升和工程實踐彌補硬體不足,這種「資源約束倒逼創新」的路徑不僅培養出高效研發團隊,更形成「技術透明化—全球協作—生態影響力」的正向循環。
美國將失去技術標準話語權
相較之下,美國過度依賴高階GPU如H100和天價訓練預算,暴露出閉源模式的脆弱性;DeepSeek以500萬美元就達到相似效果,直接衝擊資本密集型路徑的可持續性。更深遠的風險在於,若中國主導開源生態,美國將失去技術標準話語權,同時面臨「價值衝突」。

評論(0)
0 / 255