芯東西(公眾號(hào):aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西5月26日?qǐng)?bào)道,在臺(tái)北國際電腦展COMPUTEX 2025前夕,Arm高級(jí)副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey發(fā)表主題演講,分享Arm生態(tài)系統(tǒng)如何推動(dòng)下一波人工智能(AI)浪潮。目前,基于Arm架構(gòu)的芯片出貨量已累計(jì)超過3100億顆,廣泛應(yīng)用于消費(fèi)電子設(shè)備、AI汽車以及AI優(yōu)先的數(shù)據(jù)中心。

近日,Chris Bergey與芯東西等媒體進(jìn)行深入交流。據(jù)他透露,Arm預(yù)計(jì)今年稍晚將推出新的Armv9旗艦CPU(代號(hào)Travis),同時(shí)下一代GPU(代號(hào)Drage)將提供更強(qiáng)性能。他告訴芯東西,Arm GPU重點(diǎn)聚焦邊緣側(cè),針對(duì)物聯(lián)網(wǎng)和終端市場均有GPU產(chǎn)品,同時(shí)在汽車領(lǐng)域的GPU進(jìn)行投入,目前尚未計(jì)劃對(duì)數(shù)據(jù)中心GPU進(jìn)行投入。

對(duì)話Arm高級(jí)副總裁:今年推新旗艦Travis CPU,帶來雙位數(shù)IPC性能提升

Travis CPU將帶來雙位數(shù)的IPC性能提升,并將是第一代引入Armv9可伸縮矩陣擴(kuò)展(Scalable Matrix Extension,SME)的處理器,可進(jìn)一步加速處理AI工作負(fù)載。Drage GPU將能為長時(shí)間的游戲和更豐富的多媒體內(nèi)容提供持續(xù)的性能支持。這兩款產(chǎn)品的結(jié)合將引入面向移動(dòng)端市場的Arm Lumex CSS解決方案,為未來消費(fèi)電子設(shè)備上的邊緣AI性能奠定基礎(chǔ)。

Arm已被中國生態(tài)系統(tǒng)視為手機(jī)高性能GPU的領(lǐng)先提供商,今年加入了Arm精銳超級(jí)分辨率技術(shù)(Arm ASR),使用戶能夠在移動(dòng)設(shè)備上實(shí)現(xiàn)游戲主機(jī)級(jí)畫質(zhì)和游戲體驗(yàn)。

一、云側(cè):預(yù)計(jì)今年近50%頭部云服務(wù)算力基于Arm架構(gòu)

Arm已轉(zhuǎn)型為計(jì)算平臺(tái)公司,從云端到邊緣側(cè)等各個(gè)應(yīng)用,在計(jì)算能效與能源效率方面展現(xiàn)領(lǐng)導(dǎo)地位。

在云端與數(shù)據(jù)中心方面,亞馬遜云科技(AWS)、谷歌、微軟等科技巨頭均在持續(xù)擴(kuò)展搭載Arm計(jì)算平臺(tái)的自研數(shù)據(jù)中心芯片。

AWS曾分享,其超過90%的重要客戶(不包括亞馬遜)在用Arm先進(jìn)架構(gòu)。過去兩年,AWS新部署的CPU算力中,有超過50%是基于Arm技術(shù)的Graviton芯片。

Arm預(yù)計(jì)在2025年,出貨到頭部超大規(guī)模云服務(wù)提供商的算力中,有近50%是基于Arm架構(gòu)。

這股動(dòng)力,來自業(yè)界對(duì)Arm高效節(jié)能計(jì)算能力的強(qiáng)烈需求。相比其他平臺(tái),頭部云服務(wù)提供商所采用的Arm架構(gòu)芯片可實(shí)現(xiàn)高達(dá)40%的能效提升。

對(duì)話Arm高級(jí)副總裁:今年推新旗艦Travis CPU,帶來雙位數(shù)IPC性能提升

在COMPUTEX期間,NVIDIA也分享了基于Arm架構(gòu)的NVIDIA Grace CPU的進(jìn)展。該CPU在包括??松梨?、Meta等一系列的實(shí)際部署中,為要求苛刻的AI工作負(fù)載提供了性能和效率的提升。

Bergey強(qiáng)調(diào)說,數(shù)據(jù)中心的未來將是Arm計(jì)算與加速器的緊密耦合。這一趨勢在很大程度上建立于Arm生態(tài)系統(tǒng)之上。

二、邊緣側(cè):預(yù)測今年P(guān)C和平板出貨量占比超40%

每瓦性能在邊緣設(shè)備中至關(guān)重要。

在去年的COMPUTEX展會(huì)上,Arm發(fā)布了專為消費(fèi)電子設(shè)備打造的Arm終端計(jì)算子系統(tǒng)(CSS),作為旗艦AI智能手機(jī)與新一代AI PC的計(jì)算平臺(tái)。

Bergey告訴芯東西,Arm的大部分業(yè)務(wù)是向整個(gè)行業(yè)提供標(biāo)準(zhǔn)化產(chǎn)品和平臺(tái)解決方案,當(dāng)前隨著AI快速演進(jìn),芯片設(shè)計(jì)變得越來越具有技術(shù)挑戰(zhàn)性,成本變高,產(chǎn)品上市時(shí)間愈發(fā)關(guān)鍵,此外因摩爾定律放緩,設(shè)計(jì)過程中對(duì)工藝的定制化需求也持續(xù)增長,這些驅(qū)使Arm推出CSS。

CSS仍屬于標(biāo)準(zhǔn)化產(chǎn)品,而非定制化業(yè)務(wù)。Arm可以為從云端、汽車到終端等不同細(xì)分市場的合作伙伴提供CSS,幫助合作伙伴有效提升性能、降低成本,并加快產(chǎn)品上市周期。

除了帶來兩位數(shù)的性能提升之外,終端CSS也為用戶帶來了實(shí)質(zhì)性效益——應(yīng)用程序啟動(dòng)更快速、AI 體驗(yàn)更流暢且更持久。

目前全球99%的智能手機(jī)都采用Arm架構(gòu),對(duì)性能、電池續(xù)航以及“始終在線(Always-on)”的需求也在不斷擴(kuò)展到其他消費(fèi)設(shè)備市場。

在中國手機(jī)市場,Arm正在為聯(lián)發(fā)科技等生態(tài)合作伙伴提供前沿CPU和GPU技術(shù),這些合作伙伴正與眾多一線手機(jī)廠商攜手,將搭載Arm技術(shù)的優(yōu)秀手機(jī)產(chǎn)品推向市場。

Armv9架構(gòu)自四年前推出以來,已被全球多款最新的手機(jī)與PC采用,為這些設(shè)備帶來了更出色的AI性能。

對(duì)于移動(dòng)終端設(shè)備而言,控制功耗是一個(gè)關(guān)鍵考量因素。IPC(每時(shí)鐘周期指令數(shù))與頻率的乘積決定了整個(gè)平臺(tái)的性能。相較于單純依賴提高頻率來提升性能,提升IPC可以更高效地實(shí)現(xiàn)性能的增強(qiáng),同時(shí)還能顯著改善能耗表現(xiàn)。

據(jù)Bergey分享,Arm堅(jiān)信異構(gòu)計(jì)算是未來的發(fā)展方向,目前大多數(shù)第三方應(yīng)用都是在CPU上進(jìn)行AI開發(fā)的,有70%會(huì)始終運(yùn)行在CPU上,而不會(huì)遷移到GPU或NPU,也有不少應(yīng)用借助GPU進(jìn)行加速。

如今AI PC的設(shè)計(jì)正越來越接近現(xiàn)代智能手機(jī)的形態(tài)——輕薄的尺寸、無風(fēng)扇的設(shè)計(jì)、全天候的電池續(xù)航能力、始終在線的效率,以及無論是視頻會(huì)議還是視頻流媒體,都能享受到卓越的多媒體體驗(yàn)。

近年來,Arm架構(gòu)在PC與平板市場的需求大幅成長,預(yù)估在2025年將占整體出貨量的40%以上。全球大多數(shù)主流的應(yīng)用均已推出適用于Windows的Arm原生版本,帶來更快速、更強(qiáng)大的AI PC體驗(yàn),涵蓋聊天機(jī)器人、生產(chǎn)力工具等核心應(yīng)用。

聯(lián)發(fā)科技近期推出的Kompanio Ultra SoC,更進(jìn)一步提升了Chromebook市場的水平,讓新一代 Chromebook Plus 設(shè)備具備先進(jìn)AI與多媒體能力。

此外,NVIDIA推出的DGX Spark個(gè)人AI超級(jí)計(jì)算機(jī),將數(shù)據(jù)中心級(jí)別的計(jì)算能力帶到了桌面級(jí)產(chǎn)品。該產(chǎn)品搭載了基于Armv9架構(gòu)CPU的Grace Blackwell超級(jí)芯片,具備支持2000億參數(shù)模型的AI計(jì)算能力。

在本屆COMPUTEX 上,NVIDIA宣布與宏碁、華碩、戴爾科技、技嘉、惠普、聯(lián)想和微星等全球領(lǐng)先系統(tǒng)制造商共同打造NVIDIA DGX Spark和DGX Station系統(tǒng)。

三、匯聚超2200萬名開發(fā)者,Kleidi軟件庫累計(jì)安裝超80億次

Bergey認(rèn)為,構(gòu)建AI系統(tǒng)有三個(gè)關(guān)鍵因素:

首先,從云端到邊緣打造一個(gè)無處不在的平臺(tái)將具有極大的價(jià)值,因?yàn)楹芏鄷r(shí)候AI是在端側(cè)運(yùn)行的,但在某些情況下,又希望能夠?qū)⒐ぷ髫?fù)載轉(zhuǎn)移到云端。因此,擁有一個(gè)高度且可移植的平臺(tái),對(duì)于推動(dòng)先進(jìn)技術(shù)及產(chǎn)品的實(shí)現(xiàn),以及為現(xiàn)有產(chǎn)品增加新功能,都非常有價(jià)值。

二是電力和每瓦性能。AI極為耗電,數(shù)據(jù)中心能耗從兆瓦級(jí)(MW)躍升至吉瓦(GW)級(jí),其中超過50%實(shí)際上來自于機(jī)架和半導(dǎo)體設(shè)備?!懊客咝阅堋睂⑹顷P(guān)鍵衡量指標(biāo)。

三是軟件。強(qiáng)大的軟件生態(tài)進(jìn)一步催生了更多硬件的發(fā)展機(jī)會(huì)。

在Bergey看來,要在端側(cè)AI中兼顧算力與能效,芯片設(shè)計(jì)也有三個(gè)關(guān)鍵要素:一是內(nèi)存帶寬,二是確保在平臺(tái)中集成強(qiáng)大、靈活性高的硬件,三是軟件。如果沒有成熟的軟件及其生態(tài)系統(tǒng),要跟上所有行業(yè)標(biāo)準(zhǔn)和各種AI框架,將會(huì)是一項(xiàng)非常繁重且具有挑戰(zhàn)性的工作。

目前,Arm已有超過2200萬名開發(fā)者在Arm平臺(tái)上進(jìn)行開發(fā)。Arm持續(xù)大力投資軟件,協(xié)助開發(fā)者在開發(fā)的過程中降低復(fù)雜度、并提高效率。

Bergey補(bǔ)充道,開發(fā)者僅需一次開發(fā),就能在整個(gè)半導(dǎo)體生態(tài)系統(tǒng)中眾多采用Arm?CPU的SoC上運(yùn)行。

在去年的COMPUTEX上,Arm發(fā)布了Arm Kleidi軟件庫,讓開發(fā)者能在各種AI模型與工作負(fù)載上實(shí)時(shí)獲得最佳的性能表現(xiàn)。

Kleidi推出后僅一年,已整合至多個(gè)主流AI框架中,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN以及ONNX Runtime。

迄今為止,Kleidi已在搭載Arm架構(gòu)的設(shè)備上累計(jì)超過80億次安裝,且仍在持續(xù)增長中。

對(duì)話Arm高級(jí)副總裁:今年推新旗艦Travis CPU,帶來雙位數(shù)IPC性能提升

結(jié)語:AI轉(zhuǎn)型依賴持續(xù)創(chuàng)新

Bergey在COMPUTEX主題演講末尾強(qiáng)調(diào),AI時(shí)代是一場千載難逢的機(jī)會(huì),能夠重新定義科技如何影響世界。但要真正實(shí)現(xiàn)這項(xiàng)潛力,仍依賴持續(xù)創(chuàng)新,以及與Arm世界級(jí)生態(tài)系統(tǒng)的深度合作。

過去18個(gè)月內(nèi),有超過150個(gè)涵蓋語音、圖像、文字與視頻生成的基礎(chǔ)模型面世。原本只存在于云端的AI助理,如今也正優(yōu)先在邊緣設(shè)備上開發(fā),推動(dòng)AI推理作業(yè)由云端轉(zhuǎn)向邊緣應(yīng)用。

推理是AI實(shí)際運(yùn)行并創(chuàng)造價(jià)值的環(huán)節(jié),是真正驅(qū)動(dòng)未來創(chuàng)新與商業(yè)價(jià)值的關(guān)鍵。AI agents也正快速增長,這些系統(tǒng)能夠獨(dú)立執(zhí)行復(fù)雜任務(wù)、彼此協(xié)作,并在大規(guī)模下自動(dòng)運(yùn)行。這將成為物理AI的基礎(chǔ),使AI從數(shù)字世界延伸至真實(shí)的物理環(huán)境,例如機(jī)器人。

據(jù)Bergey觀察,AI agents方面已經(jīng)有一些非常有趣的應(yīng)用場景和非常成功的商業(yè)項(xiàng)目或初創(chuàng)公司,兩個(gè)頗受關(guān)注的領(lǐng)域是AI編程和AI客服。物理AI也蘊(yùn)藏著巨大機(jī)遇,一些機(jī)器人技術(shù)已經(jīng)落地應(yīng)用,接下來一到三年,機(jī)器人設(shè)備有望在自主模式下具備媲美人類操作的表現(xiàn)。

具備可擴(kuò)展性且高效率的計(jì)算,在未來會(huì)變得更加重要。

從云端到邊緣,Arm的計(jì)算平臺(tái)正處于AI轉(zhuǎn)型的核心。Arm及其世界級(jí)生態(tài)系統(tǒng)持續(xù)在硬件與軟件領(lǐng)域不斷創(chuàng)新與投入,以實(shí)現(xiàn)下一波即將改變數(shù)十億人生活的AI浪潮。