智東西(公眾號:zhidxcom)
作者 | 云鵬
編輯 | 心緣

智東西3月6日報道,今天,高通正式發(fā)布了《通過NPU和異構(gòu)計算開啟終端側(cè)生成式AI》技術(shù)白皮書中文版,并于今天上午的AI技術(shù)溝通會中對白皮書中的相關(guān)技術(shù)和規(guī)劃進(jìn)行了深入解讀。高通技術(shù)公司產(chǎn)品管理高級副總裁Ziad Asghar在會上回答了業(yè)內(nèi)關(guān)心的焦點問題。

高通首次解讀AI技術(shù)白皮書,解密NPU三大殺手锏

如今,生成式AI變革已經(jīng)到來。在高通看來,隨著生成式AI應(yīng)用愈發(fā)多樣化、垂直領(lǐng)域的計算需求也在快速增長,產(chǎn)業(yè)需要專門為AI定制設(shè)計新的計算架構(gòu)。

高通首次解讀AI技術(shù)白皮書,解密NPU三大殺手锏

在他們看來,這個新的計算架構(gòu)需要一個面向生成式AI設(shè)計的神經(jīng)網(wǎng)絡(luò)處理器,也就是我們常說的NPU,同時要利用CPU、GPU在內(nèi)的異構(gòu)處理器組合,進(jìn)而實現(xiàn)更好的性能、能效、續(xù)航。

接下來,高通分別對他們的NPU和異構(gòu)計算兩大優(yōu)勢技術(shù)進(jìn)行了深入解讀。

一、專為低功耗加速AI推理而設(shè)計,高通NPU的核心差異化優(yōu)勢是什么?

NPU是專門為低功耗加速AI推理而設(shè)計的一種處理,也是高通在芯片設(shè)計領(lǐng)域的強(qiáng)項之一,目前市面上的高通旗艦智能手機(jī)芯片中基本上都內(nèi)置了AI算力較高的NPU模塊。

高通高管提到,NPU的架構(gòu)會隨著新AI算法、模型和用例的發(fā)展不斷演進(jìn)。

高通首次解讀AI技術(shù)白皮書,解密NPU三大殺手锏

隨著AI技術(shù)持續(xù)快速演進(jìn),計算平臺必須在性能、功耗、效率、可編程性和面積之間進(jìn)行權(quán)衡取舍。在高通看來,一個專用的定制化設(shè)計NPU可以保持與AI行業(yè)方向一致。

高通重點解讀了他們在NPU方面的技術(shù)優(yōu)勢。我們都非常熟悉的Hexagon NPU就是面向兼顧低功耗和穩(wěn)定性的高性能AI推理設(shè)計的,Ziad Asghar提到,高通NPU的核心差異化優(yōu)勢在于系統(tǒng)級解決方案、定制設(shè)計和快速創(chuàng)新。

具體來說,高通的系統(tǒng)級解決方案會考量每個處理器的架構(gòu)、SoC系統(tǒng)架構(gòu)和軟件基礎(chǔ)設(shè)施,從而優(yōu)化整體AI解決方案。

更進(jìn)一步來看,通過定制設(shè)計NPU并控制指令集架構(gòu),高通可以快速進(jìn)行設(shè)計演進(jìn)和擴(kuò)展,以解決瓶頸問題并優(yōu)化性能。

二、異構(gòu)計算成為AI新時代必需品

有了NPU還不夠,做好異構(gòu)計算同樣重要。異構(gòu)計算可以發(fā)揮每種處理器的優(yōu)勢,比如NPU擅長標(biāo)量、向量和張量數(shù)學(xué)運算,更適用于核心AI工作負(fù)載。

高通AI引擎就是高通的異構(gòu)計算架構(gòu),目前各類驍龍移動芯片中幾乎都搭載了高通AI引擎。高通AI引擎包括前文提到的Hexagon NPU,以及高通Adreno GPU、Kryo或Oryon CPU、傳感器中樞和內(nèi)存子系統(tǒng)。

高通首次解讀AI技術(shù)白皮書,解密NPU三大殺手锏

新一代Hexagon NPU據(jù)稱性能提升了98%、能效提升了40%,此外,微架構(gòu)升級、增強(qiáng)的微切片推理、更低的內(nèi)存帶寬占用,以及專用電源傳輸軌道,都是其關(guān)鍵優(yōu)勢特性。

Adreno GPU支持32位浮點、16位浮點和8位整數(shù)運算。第三代驍龍8中的Adreno GPU有25%的能效提升,根據(jù)高通官方數(shù)據(jù),基于Adreno GPU,Llama 2-7B每秒可生成超過13個token。

CPU方面,在驍龍X Elite計算平臺中,高通Oryon CPU據(jù)稱可以實現(xiàn)兩倍于競品的CPU性能,達(dá)到競品峰值性能所需要的功耗僅為競品的三分之一。

不同的處理器協(xié)同工作,從而實現(xiàn)端側(cè)AI的高效運行。

目前,搭載高通AI引擎的產(chǎn)品出貨量已超過20億,包括智能手機(jī)、XR、平板電腦、PC、安防攝像頭、機(jī)器人和汽車等領(lǐng)域。

結(jié)語:高通軟硬件生態(tài)齊頭并進(jìn),瞄準(zhǔn)端側(cè)生成式AI規(guī)模擴(kuò)展

基于高通的NPU和異構(gòu)計算技術(shù),利用高通AI軟件棧(Qualcomm AI Stack),開發(fā)者現(xiàn)在可以在高通硬件上更快捷高效地創(chuàng)建、優(yōu)化和部署AI應(yīng)用。

高通首次解讀AI技術(shù)白皮書,解密NPU三大殺手锏

目前,高通正通過定制芯片設(shè)計、全棧AI優(yōu)化和生態(tài)系統(tǒng)賦能的結(jié)合,推動端側(cè)生成式AI的開發(fā)和應(yīng)用。對于高通來說,終端側(cè)的生成式AI規(guī)?;瘮U(kuò)展,已經(jīng)成為他們發(fā)力的核心方向之一。