文匯網經濟財經截至6月底中國日均Token消耗量突破30萬億

截至6月底中國日均Token消耗量突破30萬億

2025-08-14 16:01:29 財經

普通話
廣東話

字號

超大
大
標準
小

在人工智能時代，Token(即「詞元」)作為處理文本的最小數據單元，如同互聯網時代的「流量」。中國國家數據局局長劉烈宏14日在北京舉行的新聞發布會上介紹，截至今年6月底，中國日均Token消耗量已突破30萬億。

國務院新聞辦公室當天舉行新聞發布會，介紹「十四五」時期數字中國建設發展成就。劉烈宏在會上表示，2024年初，中國日均Token的消耗量為1000億，截至今年6月底，日均Token消耗量已突破30萬億，1年半時間增長了300多倍，這反映了中國人工智能應用規模快速增長。

他指出，人工智能快速發展，與中國高度重視數據工作密不可分。中國是第一個把數據作為生產要素的國家，多措並舉促進數據資源的開發利用。中國強調「人工智能+」行動到哪裏，高質量數據集的建設和推廣就要到哪裏。

近年來，中國大力推動高質量數據供給，出台高質量數據集建設相關文件，多部門聯合推動相關工作。同時，持續推進高質量數據集建設工作。截至今年6月底，中國已建設高質量數據集超過3.5萬個，總體量超400PB。據悉，1PB可存儲約5億張2MB大小的高清照片，400PB相當於中國國家圖書館數字資源總量的140倍左右。

人工智能模型的訓練也推動數據交易需求攀升。劉烈宏介紹，截至今年6月底，中國各地高質量數據集累計交易額近40億元人民幣，數據交易機構掛牌的高質量數據集總規模達246PB。以北京數交所為例，高質量數據集佔交易總量的比例從去年的10%躍升到目前的近80%。

中文數據在國內大模型的訓練性能提升方面發揮着重要作用。劉烈宏說，中國多數模型訓練使用的中文數據佔比已超過60%，有的模型已達80%。中文高質量數據的開發和供給能力持續增強，推動中國人工智能模型性能快速提升。

（來源：中新網）

責任編輯：孫佳藝

0 已點過讚

評論（0）

0 / 255

熱門搜尋：

截至6月底中國日均Token消耗量突破30萬億