智東西(公眾號(hào):zhidxcom)
作者 |? 云鵬
編輯 |? 漠影

今天,AI正給整個(gè)手機(jī)產(chǎn)業(yè)帶來(lái)巨大影響和變革,從底層芯片到操作系統(tǒng),再到上層應(yīng)用生態(tài),幾乎都在被AI重構(gòu)。

越來(lái)越復(fù)雜的模型、越來(lái)越強(qiáng)大的AI Agent,都對(duì)計(jì)算效率、延遲、功耗、內(nèi)存帶寬等方面提出了新的挑戰(zhàn)。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

從蘋(píng)果到三星、聯(lián)發(fā)科、小米,手機(jī)芯片玩家們都在加速AI能力在芯片端的集成,上周蘋(píng)果剛剛發(fā)布的A19芯片,直接在GPU的每一個(gè)核心中都塞入了一顆神經(jīng)網(wǎng)絡(luò)加速器。

芯片底層技術(shù)創(chuàng)新,是加速端側(cè)AI落地、推動(dòng)AI手機(jī)體驗(yàn)升級(jí)的核心支撐。在這樣的行業(yè)趨勢(shì)下,芯片底層技術(shù)領(lǐng)域的核心玩家Arm再次向行業(yè)拋出一枚AI重磅大招。

近日,Arm在上海正式亮出了旗艦級(jí)Arm Lumex計(jì)算子系統(tǒng)(CSS)平臺(tái),這也是Arm CSS平臺(tái)的一次重要更名和升級(jí)。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

Arm Lumex包括新的CPU、GPU、DSU等模塊,在性能、能效顯著提升的同時(shí),突破性地將第二代可伸縮矩陣擴(kuò)展(SME2)技術(shù)引入到CPU中,這也是這類(lèi)技術(shù)首次在安卓手機(jī)芯片中落地。而據(jù)筆者了解,蘋(píng)果芯片CPU中使用的仍然是第一代SME技術(shù)。

Arm特別強(qiáng)調(diào)稱(chēng),這是一個(gè)完整的“AI優(yōu)先”的平臺(tái)。

今天,AI正成為全行業(yè)瞄準(zhǔn)的核心方向,而面向這一新時(shí)代,Arm的計(jì)算平臺(tái)正成為AI與個(gè)人計(jì)算發(fā)展不可或缺的計(jì)算底座。此次Arm重磅技術(shù)升級(jí)背后有哪些關(guān)鍵思考、對(duì)產(chǎn)業(yè)和消費(fèi)者有哪些價(jià)值和意義?我們將一起深入挖掘。

一、CPU裝上“AI加速器”,攜手支付寶、vivo等企業(yè),讓端側(cè)AI從“能用”到“好用”

AI手機(jī)經(jīng)過(guò)近兩年的迭代,在發(fā)展方向和AI功能種類(lèi)上已經(jīng)基本達(dá)成行業(yè)共識(shí)。今天各家的重點(diǎn)毫無(wú)疑問(wèn)是端側(cè)AI體驗(yàn)的優(yōu)化。在端云結(jié)合的混合AI成為基礎(chǔ)模式之下,如何更高效地在手機(jī)上落地模型、如何在手機(jī)上實(shí)現(xiàn)更佳的AI應(yīng)用體驗(yàn),成為需要行業(yè)共同破解的難題。

縱觀Arm整場(chǎng)發(fā)布會(huì),AI是當(dāng)下Arm技術(shù)迭代圍繞的核心主題,正如Arm高級(jí)副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey所說(shuō),新的Arm Lumex是一個(gè)“AI優(yōu)先”的平臺(tái)。

如何實(shí)現(xiàn)AI優(yōu)先,Arm此次最核心的改進(jìn)是將SME2技術(shù)引入了CPU中。

在5倍性能提升、3倍能效提升這些亮眼數(shù)字的背后,Arm實(shí)際上在做的就是給CPU這一手機(jī)中最核心、通用性最強(qiáng)的模塊配備新的矩陣加速器,讓AI時(shí)代的各類(lèi)復(fù)雜計(jì)算變得更快、更省電,進(jìn)而讓我們能在智能手機(jī)上獲得更好的AI體驗(yàn)。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

目前,SME2這一技術(shù)已經(jīng)獲得了阿里巴巴、支付寶、三星System LSI、騰訊、vivo等科技領(lǐng)域頭部企業(yè)的支持和采用。基于SME2技術(shù),Arm與這些合作伙伴深度合作,已經(jīng)在諸多AI應(yīng)用中實(shí)現(xiàn)了直觀的升級(jí)。

總體來(lái)看,這種AI體驗(yàn)的升級(jí)最突出的特點(diǎn)就是讓AI功能從“能用”到“好用易用”前進(jìn)了一大步。

如何去定義“好用易用”呢?就是要讓設(shè)備“更懂你”,且能“無(wú)縫響應(yīng)”。

手機(jī)行業(yè)的創(chuàng)新與競(jìng)爭(zhēng),是最貼近用戶應(yīng)用場(chǎng)景的領(lǐng)域之一。過(guò)去卷攝影、快充等,是優(yōu)化單點(diǎn)場(chǎng)景痛點(diǎn);如今在AI時(shí)代,生成式AI應(yīng)用以及AI與計(jì)算攝影、通信、性能等各領(lǐng)域的融合成為焦點(diǎn),其本質(zhì)是用AI重構(gòu)各場(chǎng)景價(jià)值,實(shí)現(xiàn)從“被動(dòng)響應(yīng)”到“主動(dòng)服務(wù)”的轉(zhuǎn)變。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

我們?cè)诂F(xiàn)場(chǎng)看到了一項(xiàng)“智能瑜伽教練”的演示,在演示中,AI教練可以快速流暢地將文本轉(zhuǎn)換為語(yǔ)音進(jìn)行輸出,據(jù)稱(chēng)其生成速度提升了2.4倍之多,這樣用戶就可以在健身過(guò)程中即時(shí)獲得姿勢(shì)反饋與指導(dǎo),并且全程都不用擔(dān)心設(shè)備的電池續(xù)航問(wèn)題。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

▲智能瑜伽教練

其實(shí)AI健身教練類(lèi)似功能我們并不陌生,但讓AI真正能夠像真人一樣快速、準(zhǔn)確、高效地與我們進(jìn)行交流、交互,仍是產(chǎn)業(yè)持續(xù)努力的目標(biāo),Arm無(wú)疑將這一愿景向現(xiàn)實(shí)推近了一大步。

在Arm與支付寶和vivo的三方深度合作中,AI手機(jī)體驗(yàn)的升級(jí)給我?guī)?lái)了更多驚喜。

支付寶端側(cè)AI引擎xNN集成了SME2技術(shù),在vivo的旗艦智能手機(jī)上完成了基于Arm SME2技術(shù)的大語(yǔ)言模型推理驗(yàn)證,在預(yù)填充與解碼階段,性能分別實(shí)現(xiàn)了超過(guò)40%和25%的提升,大語(yǔ)言模型交互響應(yīng)時(shí)間縮短了40%。據(jù)稱(chēng),在SME2加持下,vivo手機(jī)實(shí)現(xiàn)了額外20%的性能提升。

從應(yīng)用效果來(lái)看,vivo手機(jī)在一些視覺(jué)、語(yǔ)音、文本等AI計(jì)算任務(wù)中,性能都實(shí)現(xiàn)了顯著加速,比如在全局離線翻譯這樣的真實(shí)場(chǎng)景中,AI響應(yīng)時(shí)間明顯加快,讓整個(gè)翻譯的過(guò)程更加流暢自然。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

▲本地離線實(shí)時(shí)翻譯

可以說(shuō),這些翻倍式的改善,都標(biāo)志著CPU后端能力的重大突破,證明了SME2可為終端設(shè)備帶來(lái)更快的實(shí)時(shí)生成式AI體驗(yàn),端側(cè)AI的各類(lèi)本地功能,都得到了顯著提升。

再來(lái)看看用戶非常看重的計(jì)算攝影。搭載SME2單核心運(yùn)行神經(jīng)攝像頭降噪功能,可以在1080P分辨率下實(shí)現(xiàn)每秒120幀的超高幀率,即使在4K高分辨率下,也能實(shí)現(xiàn)每秒30幀的幀率表現(xiàn)。這意味著,我們?nèi)粘J褂檬謾C(jī)拍照,即使在光線昏暗的場(chǎng)景中,也可以拍出更加清晰、銳利的照片。

縱觀此次發(fā)布的產(chǎn)品和技術(shù),從CPU、GPU到軟件庫(kù)的一系列升級(jí),都讓我們看到了Arm Lumex在AI時(shí)代給廠商、開(kāi)發(fā)者、消費(fèi)者帶來(lái)的價(jià)值。

而對(duì)于開(kāi)發(fā)者而言,從軟件工具到生態(tài)層面的完善支持更能讓他們迅速將這些新技術(shù)與自身的產(chǎn)品相結(jié)合,將AI創(chuàng)新成果更快推向市場(chǎng)。

根據(jù)Arm預(yù)測(cè),到2030年,SME與SME2技術(shù)將為全球超過(guò)30億臺(tái)設(shè)備新增超100億TOPS的計(jì)算能力,端側(cè)AI性能呈現(xiàn)指數(shù)級(jí)提升。

二、深耕計(jì)算數(shù)十年,年均兩位數(shù)IPC提升,用技術(shù)和生態(tài)領(lǐng)跑行業(yè)

今天,我們看到Arm基于底層技術(shù)創(chuàng)新實(shí)現(xiàn)了移動(dòng)設(shè)備端側(cè)AI性能的大幅提升,實(shí)現(xiàn)這一切,一方面源于Arm的技術(shù)硬實(shí)力,另一方面也源于數(shù)十年來(lái)Arm在移動(dòng)技術(shù)和生態(tài)領(lǐng)域的持續(xù)引領(lǐng),在技術(shù)和產(chǎn)業(yè)發(fā)展的關(guān)鍵節(jié)點(diǎn),Arm始終跑在前列。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

從技術(shù)演進(jìn)來(lái)看,Arm對(duì)AI的布局實(shí)際已持續(xù)十余年:Armv8架構(gòu)時(shí)代,通過(guò)優(yōu)化NEON模塊以提升AI效率;Armv9架構(gòu)引入SVE2與SME以適配更多AI場(chǎng)景;到Armv9.3-A架構(gòu)時(shí)代,集成SME2技術(shù),優(yōu)化現(xiàn)代AI工作負(fù)載的吞吐量、延遲與精度。Arm通過(guò)架構(gòu)層面改進(jìn)SoC設(shè)計(jì),為AI應(yīng)用的爆發(fā)提前蓄力。

如今,智能設(shè)備的海量爆發(fā)讓計(jì)算變得無(wú)處不在,從手機(jī)、PC、汽車(chē)到各類(lèi)AIoT設(shè)備,萬(wàn)物智聯(lián)的趨勢(shì)變得愈發(fā)顯著。與此同時(shí),產(chǎn)業(yè)對(duì)能效比的極致追求、對(duì)功耗的死磕、對(duì)大模型的支持優(yōu)化、對(duì)AI算力的需求都成為行業(yè)共同面對(duì)的挑戰(zhàn)——Arm終于等到了AI的東風(fēng)。

回到手機(jī)行業(yè),如果只是架構(gòu)上的革新,還不足以跟上端側(cè)AI應(yīng)用的步伐。ArmLumex計(jì)算子系統(tǒng)(CSS)平臺(tái)給出了新的解題思路,它從系統(tǒng)性層面,集成搭載SME2技術(shù)的最高性能Arm CPU、GPU及系統(tǒng)IP,加速端側(cè)AI的落地和普及。

軟件工具和生態(tài)層面,KleidiAI已經(jīng)集成至所有主流移動(dòng)操作系統(tǒng)及AI框架中。開(kāi)發(fā)者能在各類(lèi)Arm設(shè)備上獲得最佳AI性能,無(wú)需進(jìn)行任何額外操作。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技

縱觀手機(jī)行業(yè)的發(fā)展,Arm一直跑在技術(shù)浪潮的最前沿。每一個(gè)版本更新都為行業(yè)注入新的活力,給行業(yè)玩家提供最堅(jiān)實(shí)的底層技術(shù)“資源池”。Arm及其生態(tài)系統(tǒng)在奠定計(jì)算基礎(chǔ)方面所做的努力,讓行業(yè)能夠時(shí)刻把握新興的機(jī)遇。

三、從手機(jī)PC到全生態(tài),算力產(chǎn)業(yè)激變,模式轉(zhuǎn)型構(gòu)筑“核心基石”

今天,AI新浪潮正在快速席卷整個(gè)科技行業(yè)。

終端大廠們紛紛“All in AI”,從產(chǎn)品到服務(wù)圍繞AI升級(jí);大模型迭代從半年更、月更到今天的周更,競(jìng)爭(zhēng)進(jìn)入白熱化階段;底層芯片層,各路芯片廠商都在產(chǎn)品中密集融入AI新特性。

從手機(jī)、PC、汽車(chē)、物聯(lián)網(wǎng)到數(shù)據(jù)中心,從十億級(jí)、百億級(jí)到萬(wàn)億級(jí)、數(shù)十萬(wàn)億級(jí)模型,AI正在快速重構(gòu)各行業(yè)各領(lǐng)域,同時(shí)也給計(jì)算產(chǎn)業(yè)也帶來(lái)了新的挑戰(zhàn)和機(jī)遇。

30億設(shè)備100億TOPS算力!解密Arm CPU最強(qiáng)AI黑科技Arm顯然是在這股AI浪潮中行動(dòng)頗為積極的一家。作為驅(qū)動(dòng)AI應(yīng)用的技術(shù)基石,不論是要快速上市兌現(xiàn)性能價(jià)值,還是要深度設(shè)計(jì)配置,從高端智能手機(jī)、PC到新興AI智能設(shè)備,Arm總能幫助廠商找到峰值性能、持續(xù)能效與芯片面積之間的靈活平衡“甜點(diǎn)”。

AI浪潮之下,曾深耕幕后的底層技術(shù)廠商正逐步走向臺(tái)前,以核心技術(shù)重塑產(chǎn)業(yè)格局。

全力沖刺AI的Arm,從技術(shù)到生態(tài),從產(chǎn)品到服務(wù),已經(jīng)全面做好了準(zhǔn)備。

結(jié)語(yǔ):打牢AI時(shí)代計(jì)算根技術(shù),端側(cè)AI提速

今天,從安卓到蘋(píng)果生態(tài),端側(cè)AI的快速發(fā)展需要更多底層技術(shù)創(chuàng)新的支撐,AI應(yīng)用體驗(yàn)仍有較大提升空間,Arm Lumex的發(fā)布,給行業(yè)提供了一套扎實(shí)的計(jì)算平臺(tái)基礎(chǔ),讓廠商和開(kāi)發(fā)者們面對(duì)AI這場(chǎng)硬仗有更充足的彈藥。

未來(lái),AI手機(jī)之戰(zhàn)會(huì)愈發(fā)焦灼,芯片層的創(chuàng)新仍然會(huì)長(zhǎng)期是行業(yè)競(jìng)爭(zhēng)的焦點(diǎn)領(lǐng)域。從廠商到開(kāi)發(fā)者,面對(duì)AI時(shí)代的機(jī)遇和挑戰(zhàn),Arm生態(tài)已經(jīng)成為AI創(chuàng)新的肥沃土地。