文匯網國際登頂！這個國產大模型震撼全球

登頂！這個國產大模型震撼全球

2025-01-28 10:05:02 國際

香港文匯報訊綜合路透社、觀察者網及本報記者蘇雨潤、凱雷報道，最近幾日，中國人工智能公司深度求索（DeepSeek）發布的大模型DeepSeek-R1震動業界，該模型使用更低的成本和更小的算力規模，實現了足以匹敵美國頂尖AI模型的效果。北京時間1月27日，蘋果App Store中國區免費榜顯示，近一周全球刷屏的DeepSeek一舉登上首位。同時，DeepSeek在美國區蘋果App Store免費榜從前一日第六位飆升至第一位。

美國媒體的報道稱，DeepSeek-R1的出色表現已經給美國科技行業留下深刻印象，其開源模型成為行業關注與分析焦點。

深度求索在1月20日發布了DeepSeek-R1模型，該公司表示，DeepSeek-R1在後訓練階段大規模使用了強化學習技術，在僅有極少標注數據的情況，極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上，其性能比肩美國OpenAI o1正式版。為促進技術社區的充分交流與創新協作，深度求索還公開了DeepSeek-R1訓練技術。

「令人驚嘆」美企轉用DeepSeek

英偉達高級研究科學家范麟熙（Jim Fan）稱讚DeepSeek取得了突破，他在社交平台X上發文稱，DeepSeek-R1完全由強化學習驅動，「這讓人想起了AlphaZero，從零開始學習圍棋、將棋和國際象棋，而不是先模仿人類大師的動作。」

DeepSeek-R1的表現引起美國科技行業的高度關注。硅谷風險投資家馬克·安德森（Marc Andreessen）表示：「DeepSeek-R1是我見過的最令人驚嘆、最令人印象深刻的突破之一。」

舊金山AI硬件公司Positron的聯合創始人巴雷特·伍德塞德（Barrett Woodside）表示，最近他和同事一直在討論DeepSeek的開源模型，「這太酷了。」

一些美國企業也開始在工作中使用DeepSeek。硅谷一家創業公司的聯合創始人安東尼·普奧（Anthony Poo）告訴《華爾街日報》，他們原先使用Claude模型預測財務回報，但現在已轉向DeepSeek，兩者性能相似，使用DeepSeek的成本僅為Claude的四分之一，「OpenAI的模型有着極佳的性能，但我們不想為我們不需要的能力付費。」

不僅如此，DeepSeek的開發成本和使用的算力規模都遠低於美國頂尖AI公司。先前發布的DeepSeek-V3在僅使用2,048顆英偉達H800 GPU的情況下，完成了6,710億參數模型的訓練，成本約為560萬美元，這遠低於其他頂級模型的訓練成本。美媒指出，H800的算力要弱於英偉達H100等芯片，美國限制對華出口此類高性能芯片。

《華爾街日報》提到，作為對比，美國AI企業、Claude模型開發商Anthropic首席執行官達里奧·阿莫代伊（Dario Amodei）去年曾透露，該公司構建模型的成本約為1億至10億美元。

投行富瑞（Jefferies）分析師指出，DeepSeek開發的開源大語言模型使用極少的計算能力，就達到了與GPT-4o相當的性能。該行認為，對算力需求的重新評估可能導致相關企業2026年AI領域的資本支出下降或不再增長，這也解釋了人工智能相關的半導體股票遭到拋售的原因。「海外人工智能公司一直在不惜一切代價追求模型改進，但DeepSeek的情況可能促使投資者對這些算力投資提出尖銳問題。」富瑞稱。

開源是強心劑專家：未來AI或會更民主化

清華大學新聞學院、人工智能學院教授沈陽接受香港文匯報採訪時指出，在開源的推動下，AI技術不再是少數幾家技術巨頭的專屬領地，它開始向更多參與者開放。「這不僅僅是技術和資源的再分配，更在於全球技術創新的全新生態系統的建立。」

「也許，未來的AI會更加民主化，更多創意和進步會從全球範圍內的無數小型團隊和初創公司中誕生，而非少數大型機構的閉門造車。」沈陽告訴香港文匯報記者，開源同樣是一劑強心劑，技術共享並非止於代碼的開放，它還意味着思想的交匯、智慧的碰撞，開源讓全球的研究人員和開發者能夠站在一個共同的平台上，快速迭代、快速創新。

華爾街憂動搖美科技領導地位美股期貨下挫

DeepSeek推出的AI大模型備受全球關注，市場分析指可能動搖美國的科技領導地位，美股指數期貨周一（1月27日）在亞洲交易時段大幅下滑，納斯達克指數期貨一度急跌逾3%，標普500指數期貨亦跌1%。

美國芯片股普遍下挫，人工智能（AI）芯片巨擘英偉達（Nvidia）在美股夜盤曾跌近一成，AMD亦跌近5%。主導「星際之門」AI基礎設施計劃的日本軟銀集團則跌逾8%，創下去年11月以來最大跌幅。

Meta設「戰情室」應對

美媒《The Information》報道，OpenAI、Meta等美國大型科企的研究人員，正仔細分析DeepSeek模型，以尋找可借鑒之處，包括它何以比一些美國AI模型能以更低成本、更有效率的方式運作。其中Meta已為此籌組4個「戰情室」，兩個小組專注研究如何降低訓練和運作DeepSeek的成本。第3個研究小組正試圖釐清DeepSeek使用了哪些資料來訓練其模型，第4個戰情室則考慮基於DeepSeek模型歸納的特質，重新建構Meta的模型。

據稱Meta正考慮推出一個類似DeepSeek的Llama版本，包含多個AI模型，每個模型專門訓練處理不同的任務。當消費者要求Llama處理某個任務時，只要讓模型的一部分運作，這可能會讓整體模式的運作速度更快，並減少所需的運算資源。

【特稿】專家：中美AI博弈已處戰略相持階段

（綜合香港文匯報記者蘇雨潤、凱雷及路透社報道）近期，美國將智譜AI等中國大模型公司列入「實體清單」，試圖限制中國AI的發展。清華大學新聞學院、人工智能學院教授沈陽27日接受香港文匯報專訪時指出，在技術和政治的交匯點上，每一個行動都可能改變未來的路徑，美國將中國的幾家頂尖AI公司列入「實體清單」，一方面顯示了對技術競爭的強烈意志，另一方面也揭示了對全球科技主導地位的深刻焦慮。看似一場硬碰硬的對抗，但在背後，技術的演化卻正在悄然發生，深刻影響着整個行業的發展方向。「中國在AI領域不斷追趕，中美AI博弈已經進入戰略相持階段。」

「這一輪的技術對抗遠非單純的硬件採購或技術封鎖所能涵蓋，它更深刻地觸及到了國家科技自主的核心。」沈陽認為，從DeepSeek的優化路徑來看，技術創新的本質並不在於單純依賴某一特定技術資源或硬件，而是在有限的資源和環境中，利用技術的進步進行自我修復與適應，這種模式的背後折射出的是產業鏈的重構與自主創新的增強。「技術的創新往往是通過多維度的突破尋求更為高效的產業整合與技術協同，真正的創新往往誕生於限制中，而技術的獨立性將成為未來競爭的終極答案。」

沈陽提出，DeepSeek的技術突破代表了中國在自主創新道路上邁出的重要一步。隨着技術的不斷深入與優化，AI產業的未來將不再是單純的「大算力」競爭，而是「智能化」與「自主化」的全新博弈，如何通過技術創新打破封鎖、打破壁壘，將成為更多科技公司尋求突破的核心戰略。

美媒：美制裁反而助推中國創新

美國的專業行業分析人員亦提出了相同的觀點。OpenAI前高管扎克·卡斯接受路透社採訪時直言，美國的限制未能阻止DeepSeek的進步，「這凸顯了一個深刻的教訓：資源限制反而能激發創造力。」

數字新聞雜誌The Wire China發文稱，DeepSeek-R1的發布將迫使懷疑論者重新評估中國的技術發展。深度求索對開源承諾的堅持也與OpenAI的專有策略形成鮮明對比，深度求索允許全球企業和開發者共同開發和改進技術，OpenAI則限制對其系統的訪問以維護競爭優勢。

該雜誌指出，美國決策者應該反思，通過設置障礙來確保領先地位的方法是否還行得通。美國的出口管制促使中國加速實現技術的自給自足，中美在芯片等領域的技術差距正逐漸縮小，美國的制裁雖然具有破壞性，卻可能反過來助推中國的創新能力。

【新聞鏈接】成立不到兩年低成本訓練引關注

綜合路透社、新華社報道，DeepSeek和幻方量化的共同創始人梁文鋒一直鮮少露面。1月20日他參加國務院總理李強主持召開專家、企業家和教科文衞體等領域代表座談會並發言，此後廣受關注。

座談會當天，DeepSeek正式發布DeepSeek-R1模型，並表示「在數學、代碼、自然語言推理等任務上，該模型性能比肩OpenAI o1正式版」。

2024年同期，獲邀參會的AI企業代表則是百度集團的李彥宏。總理李強去年12月在浙江調研時指出，要大力開展基礎研究和共性關鍵技術研究，加強算力等新型基礎設施布局建設，取得更多原創性引領性成果。

總部位於杭州的幻方量化2023年4月以一篇文章低調宣告DeepSeek的誕生。在成立之初，DeepSeek即標榜將專注於通用人工智能（AGI）的基礎研究，並將其成果盡數「開源」。DeepSeek鮮有公開的融資動作，且商業化腳步亦慢於其他公司。

DeepSeek在去年多次因大模型訓練成本低廉而獲得關注。公司上個月在一篇論文中披露，去年12月發布的DeepSeek-V3使用英偉達的H800芯片進行訓練，花費不到558萬美元。橫向對比，成本是美國AI巨頭的幾十分之一。

《黑神話：悟空》製作人：讓AI逐漸變成生活中的水和電

據澎湃新聞報道，1月26日深夜，遊戲科學創始人、CEO、《黑神話：悟空》製作人馮驥在微博發文稱，DeepSeek是頂級科技成果。這樣震撼的突破，來自一個純粹的中國公司，知識與信息平權，自此又往前邁出了堅實的一步。希望DeepSeek R1會讓你對當前最先進的AI祛魅，讓AI逐漸變成你生活中的水和電。

值得注意的是，遊戲科學和深度求索均為杭州的科技公司。

馮驥在微博中列舉了自己體驗使用後，總結出的DeepSeek的六個優勢，包括強大推理能力、開發成本低、開源、免費使用、聯網和本土。

「如果這都不值得歡呼，還有什麼值得歡呼？」馮驥推薦網友馬上去用這款應用，「使勁用，瘋狂用，嘗試用它基本取代傳統搜索，請想像你已經認識每個領域的頂尖專家，而且他們都是你隨時在線的好朋友，把所有可能需要『請教別人』的問題，都拿去先問它——無論是構建一個複雜函數，搞清楚附近哪個游泳池最好，檢查合同裏的法律陷阱，讓新寫的歌詞再押韻點，或者幫父母確認某個保健品是否真的有效」。

馮驥還建議，去看看別人是怎麼用的，去試試其他大模型，了解AI擅長什麼，不擅長什麼，如何調教，然後繼續解鎖與迭代屬於自己的用法與更多工具。

責任編輯：何雪沫

0 已點過讚

評論（0）

0 / 255

熱門搜尋：

登頂！這個國產大模型震撼全球