大腦皮層表面那層複雜的溝回褶皺,想要在計算機裏實時重建,過去需要昂貴的大型計算設備離線運算良久。如今,這一局面被一顆拇指大小的芯片改寫。北京大學集成電路學院教授楊玉超團隊聯合中國科學院上海微系統與信息技術研究所研究員宋志棠團隊,成功研製出全球首款基於相變憶阻器的神經動力學系統芯片,首次將這類複雜運算的單步時延壓縮至2.12毫秒,在腦皮層重建等任務中較目前先進圖形處理器(GPU)提速達50至478倍,一舉突破了制約神經動力學長達半個世紀的實時計算瓶頸。相關成果3日凌晨發表於《科學》。
楊玉超告訴記者,要讓機器像大腦那樣實時建模和理解物理世界,需要一種將神經網絡與微分方程相結合的「神經動力學系統」。它能在不完整、帶噪聲的數據中重建出平滑精確的三維腦結構,應用潛力巨大。然而,傳統計算架構存在一個核心瓶頸:存儲與計算分離,求解過程中海量的中間變量在內存和處理器之間反覆「奔波」,如同一個龐大的數據工廠,大量時間被浪費在搬運路途中,不僅延遲巨大,功耗也居高不下。
面對這一難題,研究團隊從憶阻器本身的物理特性裏找到了破局答案。他們利用相變存儲器獨特的「電導漂移」現象——在一定時間窗口內,其電導變化是可預測、可精準調控的。基於此,團隊提出「可控存內計算」新範式,通俗地講,原本需要複雜數字電路反覆執行的運算、緩存訪問、數據搬運等工作,現在交給了器件自身的物理規律去「跑」。
更值得關注的是,團隊還將神經網絡權重映射到相變存儲器的多級電導態上,在同一個陣列內同步完成矩陣乘加運算。兩大核心計算任務由此被統一集成在總面積僅0.28平方毫米的存算陣列中。這顆採用40納米工藝的芯片實現了2.12毫秒的單次迭代時延,首次將神經動力學硬件推入毫秒時代。
「性能表現令人振奮。」楊玉超表示,在同等運算下,該芯片較當前最先進的專用加速器速度提升3.82至36.27倍,功耗大幅降低;在腦皮層表面高保真重建任務中,該芯片較國外先進GPU提速達478.18倍。重建出的腦皮層網格平滑、拓撲一致,能精準刻畫複雜的褶皺結構,並有效抑制傳統方法中的偽影和自相交缺陷。
楊玉超說,這一突破為腦機接口和腦疾病診療開啟了全新想像空間。未來,個體化、動態化的腦數字孿生成為可能,術中神經導航、阿爾茨海默病早篩及個性化干預等,將獲得可實時運行的硬件底座。
新知解碼:什麼是「可控存內計算」
如果把傳統計算機比作一間辦公室,處理器是坐在中央的「計算員」,存儲器則是滿牆的「檔案櫃」。每次計算,計算員都得起身取數據,算完再回去——時間都花在了路上。這就是著名的「馮·諾依曼瓶頸」:存儲與計算分離,數據搬運拖垮效率。
「存內計算」思路直接:讓檔案櫃自己學會算賬。數據不再需要搬來搬去,而是在存儲單元內部原地完成計算。這聽起來完美,但實現起來困難重重——存儲單元天生只會「記」,讓它同時「算」,還得算得準、算得穩,已是很大的挑戰。
更大的難題在於「可控」。計算時很多任務需要動態調整、相機判斷。如何讓一堆物理器件具備「臨場應變」能力,是存內計算走向現實的關鍵門檻。
突破口來自一個「反科學直覺」的思路:利用器件電導會規律性漂移這一曾被視作「缺陷」的特性。如果摸清它的變化軌道,這種漂移就能被馴化為計算能力——不再用數字電路反覆讀寫比較,而是讓物理過程本身完成運算。
這便是「可控存內計算」的核心思想:讓存儲單元在「記」的同時,按設計者設定的方式、在可約束的範圍內完成「算」。存儲即計算,且整個過程精準可控。基於這一範式研製的芯片,能將複雜運算壓縮到毫秒級別,能效提升數十甚至數百倍。
(來源:光明日報)

評論(0)
0 / 255