文匯網經濟財經 AI專家：DeepSeek顛覆AI「演算力至上」邏輯

AI專家：DeepSeek顛覆AI「演算力至上」邏輯

2025-01-27 20:42:12 財經

普通話
廣東話

字號

超大
大
標準
小

中國DeepSeek引發美股出現「小股災」，Perplexity AI創辦人史里尼瓦斯(Arvin Srinivas)向外媒表示，DeepSeek在資源限制條件下的創新顛覆了傳統AI訓練的「演算力至上」邏輯。彭博圖片

香港文匯報訊（記者黎梓田）中國DeepSeek引發美股出現「小股災」，Perplexity AI創辦人史里尼瓦斯(Arvin Srinivas)向外媒表示，DeepSeek在資源限制條件下的創新顛覆了傳統AI訓練的「演算力至上」的邏輯。DeepSeek透過優化混合專家模型(MOE)，解決了長期困擾產業的數值不穩定性問題，例如損失峰值的頻繁出現，其技術方案無需依賴額外基礎設施即可穩定訓練流程。

此外，該團隊在 GPU 記憶體受限的挑戰下，開創性採用8位元浮點訓練，動態平衡高精度與低精度計算，僅用60天完成模型更新，並支援低成本重複訓練；而美國主流仍停留在16浮點訓練階段。

更令人矚目的是，DeepSeek以極低資源消耗打造出性能相當於GPT-4o的模型，API價格便宜10-15倍，速度達每秒60 tokens，部分基準測試甚至接近或超越頂級閉源模型。這種效率革命不僅驗證了「必要是發明之母」的創新邏輯，更透過開源策略挑戰了「中國僅擅長複製」的刻板印象，其開源的405B模型品質接近GPT-4，遠超美國70B級本地運行模型。

中國的創新都是被逼出來的

DeepSeek的技術透明化，如公開14.8兆tokens訓練資料與開源生態佈局，可能引發全球開發者倒戈，挑戰美國閉源模式的壟斷地位，甚至倒逼Meta等公司調整技術路線，重塑產業競爭格局。

在中美人工智能競賽方面，史里尼瓦斯指出這場競爭的核心是效率創新與生態話語權之爭，而非單純的技術封鎖或演算力比拼。中國受限於低端GPU如H800，被迫透過演算法最佳化、資料品質提升和工程實踐彌補硬體不足，這種「資源約束倒逼創新」的路徑不僅培養出高效研發團隊，更形成「技術透明化—全球協作—生態影響力」的正向循環。

美國將失去技術標準話語權

相較之下，美國過度依賴高階GPU如H100和天價訓練預算，暴露出閉源模式的脆弱性；DeepSeek以500萬美元就達到相似效果，直接衝擊資本密集型路徑的可持續性。更深遠的風險在於，若中國主導開源生態，美國將失去技術標準話語權，同時面臨「價值衝突」。

0 已點過讚

評論（0）

0 / 255

熱門搜尋：

AI專家：DeepSeek顛覆AI「演算力至上」邏輯