
香港文匯報訊(記者 黎梓田)中國內地AI新創企業DeepSeek(深度求索)近期推出低成本、高性能的AI模型DeepSeek-V3與DeepSeek-R1,不僅在技術表現上逼近OpenAI的ChatGPT-4,甚至登上蘋果App Store下載排行榜第一名。今日美國科技股盤前大跌,內地相關概念股則走強,每日互動、華金資本、浙江東方、卓創資訊均漲停,並行科技和拓爾思分別升逾17%。其中DeepSeek創始人梁文鋒的經歷更被曝光,目前更是高達千億規模的私募基金—幻方量化的掌舵人。

美國科技巨頭Meta AI部門陷入恐慌
據外媒報道,DeepSeek的AI模型訊聯成本低廉到相當驚人,其中DeepSeek-V3的製造成本僅558萬美元,而性能更強的DeepSeek-R1則為600萬美元,和世界其他頂尖AI公司的模型訓練成本動輒數十億美元,形成鮮明對比。這匹AI黑馬除了在美國硅谷投下震撼彈,據說已讓美國科技巨頭Meta的AI部門陷入恐慌。
DeepSeek公司於2023年7月杭州成立
DeepSeek模型由同名的杭州初創公司DeepSeek開發,公司於2023年7月成立,其上周一(20日)發布的推理模型DeepSeek-R1,在數學、程式碼及推理基準測試中,可以與硅谷最先進模型OpenAI o1匹敵,但投入研發費用只有558萬美元,只是Meta訓練Llama 3.1的十分之一,更只是Chat-GPT的二十分之一,而且只用2,048張英偉達H100的GPU集群,需時只是53天。
梁文鋒是湛江吳川市一中「高考狀元」
DeepSeek創始人梁文鋒的背景也備受關注,梁文鋒1985年出生於廣東省湛江市。2002年以湛江的吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程專業,並在隨後的幾年裡繼續深造,最終於2010年獲得信息與通信工程碩士學位。在校期間,他對金融市場產生了濃厚的興趣。梁文鋒與浙大同學徐進於2013年共同創立了杭州雅克比投資管理有限公司,2015年成立了幻方量化,致力於透過人工智能進行量化投資。
2016年公司推出了首個基於深度學習的交易模型,並實現了所有量化策略的AI化轉型。2018年幻方正式確立了以AI為核心的發展戰略。2021年幻方的資產管理規模突破千億大關,躋身國內量化私募領域的「四大天王」之列。最後梁文鋒於2023年創辦深度求索DeepSeek,專注於做真正人類級別的人工智能。
評論