全球首款存算一體處理器誕生 能效比提升高達300倍

來源:快科技

過去70年,計算機一直遵循馮·諾依曼架構(gòu)設計,運行時數(shù)據(jù)需要在處理器和內(nèi)存之間來回傳輸。

隨著時代發(fā)展,這一工作模式面臨較大挑戰(zhàn):在人工智能等高并發(fā)計算場景中,數(shù)據(jù)來回傳輸會產(chǎn)生巨大的功耗;目前內(nèi)存系統(tǒng)的能提升速度大幅落后于處理器的能提升速度,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸。

12月3日,快科技獲悉,達摩院成功研發(fā)新型架構(gòu)芯片。該芯片是全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,可突破馮·諾依曼架構(gòu)的能瓶頸,滿足人工智能等場景對高帶寬、高容量內(nèi)存和極致算力的需求。

在特定AI場景中,該芯片能提升10倍以上,能效比提升高達300倍。

在摩爾定律逐漸放緩的背景下,存算一體成為解決計算機能瓶頸的關鍵技術。

存算一體芯片類似人腦,將數(shù)據(jù)存儲單元和計算單元融合,可大幅減少數(shù)據(jù)搬運,從而極大地提高計算并行度和能效。

這一技術早在上世紀90年代就被提出,但受限于技術的復雜度、高昂的設計成本以及應用場景的匱乏,過去幾十年,業(yè)界對存算一體芯片的研究進展緩慢。

達摩院研發(fā)的存算一體芯片集成了多個創(chuàng)新型技術,是全球首款使用混合鍵合3D堆疊技術實現(xiàn)存算一體的芯片。該芯片內(nèi)存單元采用異質(zhì)集成嵌入式DRAM(SeDRAM),擁有超大帶寬、超大容量等特點;計算單元方面,達摩院研發(fā)設計了流式的定制化加速器架構(gòu),對推薦系統(tǒng)進行“端到端”的加速,包括匹配、粗排序、神經(jīng)網(wǎng)絡計算、細排序等任務。

得益于整體架構(gòu)的創(chuàng)新,該芯片同時實現(xiàn)了高能和低系統(tǒng)功耗。在實際推薦系統(tǒng)應用中,相比傳統(tǒng)CPU計算系統(tǒng),存算一體芯片的能提升10倍以上,能效提升超過300倍。該技術的研究成果已被芯片領域頂級會議ISSCC 2022收錄,未來可應用于VR/AR、無人駕駛、天文數(shù)據(jù)計算、遙感影像數(shù)據(jù)分析等場景。

達摩院計算技術實驗室科學家鄭宏忠表示:“存算一體是顛覆的芯片技術,它天然擁有高能、高帶寬和高能效的優(yōu)勢,可以從底層架構(gòu)上解決后摩爾定律時代的芯片能和能耗問題,達摩院研發(fā)的芯片將這一技術與場景緊密結(jié)合,實現(xiàn)了內(nèi)存、計算以及算法應用的完美融合。”

據(jù)悉,達摩院計算技術實驗室專注研究芯片設計方法學和新型計算機體系結(jié)構(gòu)技術,已擁有多項領先成果,在ISSCC、ISCA、MICRO、HPCA等頂級會議上發(fā)表多篇論文。

標簽: 存算一體 人工智能 3D堆疊技術 計算機體系

推薦

財富更多》

動態(tài)更多》

熱點