文匯網神州玉淵譚天 | 沉默的DeepSeek，和不被定義的中國大模型

玉淵譚天 | 沉默的DeepSeek，和不被定義的中國大模型

2026-04-26 09:32:20 神州

不誘於譽，不恐於誹，率道而行，端然正己。

「 01 」

帶着十六個字，DeepSeek新版本，姍姍來遲。

距離上一次更新的V3.2版本，已經過去近5個月。

這期間，安索皮克（Anthropic）的克勞德神話（Claude Mythos）模型在網絡攻擊上展現出前所未有的能力，有機構稱其將網絡攻擊的時代從「手工化」帶到了「工業化」；GPT-Image-2也讓網友驚呼「有圖有真相」的時代已經過去……

在這個國外主流大模型平均91.4天就迭代一個版本的時代，DeepSeek的「靜默」，在很多人眼裏幾乎等同於落後，甚至掉隊。

沉默的DeepSeek，讓人很不習慣——2025年初的橫空出世、用更少的算力實現更優的性能、打破美西方營造的「算力焦慮」。這些標籤，讓它的意義不止於一個公司的一款產品。

因此，幾個月裏，關於DeepSeek-V4的市場傳聞就沒斷過。

當時，國外科技媒體稱V4模型將在今年春節發布，具有強大的編碼能力。

當一家公司最核心產品的動態被匿名信源、外媒報道和券商研報所定義——這本身已偏離了技術討論的軌道。

DeepSeek官方從未對外界的消息做過任何確認，這種沉默，又讓討論升級。

2月26日，事情迎來轉折。

路透社稱，據知情人士透露，DeepSeek發布V4之前，沒有向美國芯片公司英偉達和超微半導體（AMD）提供模型早期訪問權限，而是讓中國企業華為提前數周開展軟件適配優化工作。

路透社在報道中用了一個表述——

breaking from standard industry practice（打破行業慣例）。

這是此前無論中國公司還是外國公司的大模型，都沒有採用過的方式。

顯然，此時討論的已經不只是一個公司能否發布新產品的問題了。

「 02 」

此次DeepSeek與華為昇騰國產芯片體系深度適配，並不令人意外。

去年8月，DeepSeek發布DeepSeek-V3.1時就宣布採用UE8M0 FP8 Scale參數精度，特別表示這一數據格式是針對即將發布的下一代國產芯片設計。

軟件主動適配硬件特性，本質上是在為國產芯片「量體裁衣」。

這背後的難度超乎想像，需要大量改寫調用芯片的軟件代碼，使其與目標系統在各個環節都實現兼容。

依據新款芯片的特點，哪些代碼還能沿用，哪些必須重寫？

原本依賴的算子、通信方式和並行策略，放到國產芯片上還能否成立？

訓練流程中最關鍵的環節，怎樣調整才能既跑得通，又不損失太多性能？

因此，要想一款國產芯片嵌入既有的模型訓練和推理體系，並達到可用、好用、能規模化使用的狀態，往往需要長期摸索。

而當國產芯片開始在具體場景裏能夠接住原本由外國芯片承擔的計算任務，企業就可以不再依賴特定進口型號。

國產芯片，能接得住嗎？DeepSeek的姍姍來遲，似乎給了這個問題一個答案。但很少有人注意到這樣一個細節。

2025年12月31日，國家發展改革委召開了2025年的最後一場新聞發布會。會上，有記者問了這樣一個問題：目前國產算力達到什麼水平？

發言人回應：目前，國產芯片產品在不同場景中加速適配，應用成效可以說非常好。特別是「超節點」等集群互聯技術發展，為國產算力趕上國際領先水平提供了良好機遇，拓展了廣闊發展空間。

不少人都知道，芯片、算力等的國產化，我們回應不多。

就拿發改委來說，2015年以來，發改委的新聞發布會上，提及國產算力寥寥無幾，並且很少對具體發展情況作出說明。

從「回應不多」到「正面回應」，轉變，在持續發生。

科技與戰略風雲學會副會長陳經表示，從去年開始，國產芯片的需求端被真正拉動起來了。

2025年，國產AI芯片的國內市場份額已達到41%左右。

有人用，是商業邏輯的重要一步。

上海財經大學胡延平教授就提到，從去年開始，國產AI芯片企業開始集中上市。

其意義不只在市值水平，企業能夠把更多資源投向下一代AI訓練、推理芯片的研發。

從技術產品，到市場應用，再回到資本支持，一個相對完整的正態循環正在形成。

「 03 」

北京郵電大學人機交互與認知工程實驗室主任劉偉有一個觀點——模型加上芯片，是人工智能競爭更進一步的形態。

未來的AI發展，不僅在於算法的好壞，同樣也要看整個生態是否具有韌性。

主流的英偉達生態，將硬件、軟件和開發者深度綁定，形成了事實上的行業標準，在中國大模型訓練芯片市場的佔比一度高達95%。

可以說，幾乎所有頂級大模型都必須基於CUDA框架運行。

於是，現在國產AI芯片面臨兩個選擇：

一是兼容CUDA生態，降低遷移成本；二是自研軟件棧，重構開發體系。

而中國大模型要想實現真正的自主，就必須形成軟硬件一體化的協同能力。

DeepSeek-V4模型在適配昇騰芯片後，實現了高吞吐、低時延的推理部署。

這是技術上的新探索，也是我們在軟硬件協同領域的一種進步信號。

今年初，智譜GLM-5也宣布完成與7家主流國產芯片平台的深度適配，可以在國產算力集群之上實現穩定運行。

在大模型訓練中，也出現了「純國產」的實踐樣本。

一些企業的大模型，訓練過程基於國產算力體系完成。

陳經分析稱，這意味着一套國產軟硬件協同的AI研發生態正在逐漸完善。

儘管當前中國的製程不佔優、單卡性能有限，但我們也會通過系統設計、集群架構、軟硬件協同、電力能耗等優勢排布，在既有條件下，探索新的發展解法。

當我們討論中國AI企業時，我們討論的其實不只是企業本身，更是一個行業，以及背後代表的一種發展模式。

正如那十六個字的後半句所說：

率道而行，端然正己。

中國AI，更需要活在自己的節奏裏。

（來源：玉淵譚天）

責任編輯：梁存希

0 已點過讚

評論（0）

0 / 255

熱門搜尋：

玉淵譚天 | 沉默的DeepSeek，和不被定義的中國大模型