芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西8月8日報道,今日,北京AI芯片創(chuàng)企蘋芯科技發(fā)布存算一體NPU“PiMCHIP-N300”和多模態(tài)智能感知SoC芯片“PiMCHIP-S300”。兩款產(chǎn)品是存算一體技術(shù)在28nm及22nm制程節(jié)點上的首次產(chǎn)品化實現(xiàn)。N300已有客戶,S300預(yù)計在今年第四季度推向市場。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

通過將計算和存儲深度融合,PiMCHIP-S300實現(xiàn)了數(shù)據(jù)處理的“零搬運”,在大幅提升計算效率的同時,顯著降低了功耗,可應(yīng)用于智能可穿戴設(shè)備、智能安防、具身智能、AI大模型、健康數(shù)據(jù)分析等領(lǐng)域。

蘋芯科技創(chuàng)立于2021年2月,同年9月其基于SRAM架構(gòu)的存內(nèi)計算加速器S200測試成功,該成果還發(fā)表于素有“固態(tài)電路領(lǐng)域奧林匹克”之稱的芯片頂會ISSCC 2022。今天的新品發(fā)布也是對其過去三年創(chuàng)業(yè)發(fā)展的階段性總結(jié)。

清華大學(xué)電子工程系教授、無問芯穹科技有限公司發(fā)起人汪玉現(xiàn)場發(fā)表致辭,他總結(jié)了蘋芯兩款新品的三個特點:1)在28nm成熟工藝下取得跨代性能提升,實現(xiàn)極致能效比;2)通用性強,能支持不同應(yīng)用;3)是一個平臺架構(gòu)的概念,在大模型、可穿戴、機器人等應(yīng)用領(lǐng)域均能發(fā)揮作用。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

汪玉 回顧道,他與蘋芯的CEO楊越是從高中到大學(xué)的同班同學(xué)。保送清華時,汪玉選擇了電子工程系,楊越則選擇了自動化系。多年來的學(xué)習(xí)和工作中,兩人一直以來保持著非常緊密的溝通和聯(lián)系,是相識28年的老友。

此外,在存算一體技術(shù)方向上,汪玉跟蘋芯團隊算是同行。汪玉大約在2012年、2013年開始研究存算一體并發(fā)表相關(guān)論文。

據(jù)了解,蘋芯科技已與國內(nèi)外電子類頭部企業(yè)、大型企業(yè)集團等客戶展開合作,為其提供存內(nèi)計算技術(shù)的一站式解決方案。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

一、單核算力0.5TOPS,系統(tǒng)功耗毫瓦級,支持自定義算子

PIMCHIP-N300是蘋芯科技自研的新一代存算一體NPU(神經(jīng)網(wǎng)絡(luò)處理單元)IP,專為機器學(xué)習(xí)和AI領(lǐng)域設(shè)計,可內(nèi)嵌到端側(cè)芯片中,能以更高效率、更低能耗承擔(dān)繁重的神經(jīng)網(wǎng)絡(luò)加速任務(wù)。

楊越談到端側(cè)電子產(chǎn)品中出現(xiàn)兩個趨勢,一是智能本地化,二是小型化、輕量化、低功耗化。兩個趨勢都對底層芯片提出了新的設(shè)計要求,低成本、高效能、小面積、低功耗這四個優(yōu)化維度幾乎涵蓋了所有端側(cè)芯片的設(shè)計理念。

PiMCHIP-N300采用軟硬融合架構(gòu),充分考慮可擴展性,單核可提供0.5TOPS算力,系統(tǒng)功耗為25-100mW,典型場景下靜態(tài)功耗僅10μW,支持混合精度計算,涵蓋INT4/INT8/FP16精度,支持12大類超過100種算子,核心計算單元能效比達27TOPS/W,跑YOLO-V3 tiny網(wǎng)絡(luò)的算力資源利用率達89.5%。

在兼容性方面,PiMCHIP-N300支持自定義算子,可滿足不同模型部署需求,并針對人聲監(jiān)聽、眼動追蹤、主動降噪、環(huán)境感知等應(yīng)用場景提供了配置方案和專門優(yōu)化。

在靈活性方面,該NPU有高速任務(wù)調(diào)度加速單元,支持多核或多個計算單元的實時任務(wù)調(diào)度。

為了滿足客戶更自主、靈活的算法移植需求,蘋芯科技根據(jù)客戶定義的場景或數(shù)據(jù),提供一鍵部署的端到端的解決方案,開放NPU中間表示層規(guī)范、模型解析器、模型優(yōu)化器、驅(qū)動等,并提供免費的軟件工具鏈,包括軟件模擬器、調(diào)試器、C編譯器,能夠減少二次開發(fā)的時間。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

蘋芯科技CTO章堯君把存算技術(shù)平臺分為五類:應(yīng)用、工藝、電路、架構(gòu)、算法,每一部分需要相互配合和共同設(shè)計,從應(yīng)用出發(fā),確定需要的算法、工作環(huán)境及設(shè)計要求,進而確定架構(gòu)設(shè)計和工藝選擇,根據(jù)工藝特性設(shè)計電路,最終實現(xiàn)存算芯片方案。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

這是一個密度優(yōu)先、功耗優(yōu)先、速度優(yōu)先的設(shè)計方案?;旌嫌嬎慵軜?gòu)可基于不同的技術(shù)和設(shè)計參數(shù)實現(xiàn),包括不同陣列形狀(存儲容量),SRAM、RRAM等不同的存算單元,不同的存算容量與算力的比例,以及不同輸入/輸出數(shù)量。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

章堯君總結(jié)說,蘋芯科技以高能效加速計算核心為原點開始開發(fā),之后做從定點運算到浮點運算,以及一些面向特殊應(yīng)用的設(shè)計,并在研可靈活實現(xiàn)不同算力部署需求的首款存算編譯器,還將提供混合計算架構(gòu)和異構(gòu)存內(nèi)計算量化映射技術(shù)。

二、多模態(tài)智慧感知芯片:28nm,異構(gòu)架構(gòu),單核能效比27TOPS/W

PIMCHIP-S300多模態(tài)智慧感知芯片是一款基于SRAM的存內(nèi)計算芯片,內(nèi)置自研NPU、數(shù)字PIM單元,單核能效比高達27TOPS/W,具備高能效、小面積、低功耗、低成本等特點,可高效完成數(shù)據(jù)密集型任務(wù)。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

該芯片采用輕量級Cortex-M MCU處理器,實現(xiàn)實時控制與調(diào)度;支持音、視頻及多種傳感器接入,實現(xiàn)多模態(tài)融合感知;支持多路麥克風(fēng)陣列預(yù)處理流程,滿足各級語音場景應(yīng)用?;谧匝挟悩?gòu)架構(gòu),這款A(yù)I芯片可實現(xiàn)超低功耗喚醒、VAD、語音識別、運動監(jiān)測、視覺識別,針對特定計算能節(jié)約90%的耗能。

蘋芯科技副總裁江廣展示了PIMCHIP-S300芯片的諜照。它采用28nm制程、BGA封裝、自研異構(gòu)架構(gòu),12mm * 12mm大小,die做得很小,能滿足更小型化的需求。

這款芯片擁有豐富的外設(shè)接口,單顆芯片既可以接收數(shù)據(jù),也可以本地處理數(shù)據(jù),產(chǎn)生簡單決策,最終產(chǎn)生控制,一顆就能閉環(huán)。

其高度靈活和易集成性,有助于大幅縮短產(chǎn)品開發(fā)周期。蘋芯打造了完整交鑰匙解決方案,底層操作系統(tǒng)、中間件、工具鏈都會開源,提供一鍵AI部署工具、一鍵二進制生成和下載工具。

該存算一體AI芯片提供電池可驅(qū)動的低功耗,未來還能結(jié)合新能源甚至是光伏電池,達到更好的小型化和易部署能力,廣泛支持無人機、具身智能等場景應(yīng)用。

蘋芯挑選了近期參與MLPerf測評的競品,進行綜合比較,圖表顯示,在跑多種AI算法時,蘋芯存算一體AI芯片的能耗和延遲均最低。

同時,蘋芯自研了一套開源的Pstreamer異構(gòu)計算框架,通過管道將不同端側(cè)通用算法和算力模塊連接起來,實現(xiàn)聲光電不同模態(tài)信息的采集、融合、感知等功能,并銜接決策與控制功能,以幫助客戶快速部署產(chǎn)品,快速推向市場。

功耗低至毫瓦級!蘋芯科技發(fā)布存算一體NPU,交付多模態(tài)智能感知芯片

結(jié)語:已申請40余項海內(nèi)外專利,將積極擁抱大模型生態(tài)

蘋芯科技定位自身為智能計算架構(gòu)的革新者,致力于通過創(chuàng)新的存算一體解決方案,為AI的廣泛應(yīng)用鋪設(shè)技術(shù)高速路,推動從智能終端設(shè)備到智慧城市、從智能醫(yī)療到具身智能的全方位變革。目前蘋芯已申請海內(nèi)外專利40余項,相關(guān)知識產(chǎn)權(quán)和工程經(jīng)驗覆蓋從存儲器器件、電路設(shè)計、算法優(yōu)化到體系結(jié)構(gòu)等全技術(shù)棧。

楊越在發(fā)表致辭時談道,展望未來,蘋芯科技將繼續(xù)秉承“創(chuàng)新引領(lǐng)未來,技術(shù)改變世界”的理念,積極擁抱大模型生態(tài),以產(chǎn)品為核心,不斷加大研發(fā)投入,深化與高校、科研機構(gòu)的合作,培養(yǎng)和吸引頂尖人才,共同推動中國集成電路產(chǎn)業(yè)向更高層次邁進。

包括蘋芯兩款新品在內(nèi),隨著相關(guān)技術(shù)和器件的迭代和成熟,越來越多存算一體AI芯片產(chǎn)品走向落地商用,為國內(nèi)AI加速解決方案提供一種兼顧高能效與靈活性的新選擇。