智東西(公眾號:zhidxcom)
文 | 心緣

手中無劍,勝在芯。8月29日,阿里平頭哥新“劍”出鞘。

這把新“劍”是一站式AIoT芯片設(shè)計平臺,名字意同武學(xué)的至高境界——“無劍”。

現(xiàn)在國內(nèi)造芯公司起名越來越講究引經(jīng)據(jù)典,華為幾乎承包了《山海經(jīng)》,紫光新芯片取名為古代皇帝賜予大臣的第六種禮器“虎賁”,如今阿里平頭哥的“無劍”典出金庸武俠小說。

話說獨(dú)孤求敗40歲前使用玄鐵重劍,40歲后,“草木竹石均可為劍,漸進(jìn)于無劍勝有劍之境?!?/p>

這正是平頭哥對無劍平臺寄予的厚望,沒有芯片,但卻能幫各類芯片設(shè)計企業(yè)鍛就芯片。

阿里平頭哥芯片設(shè)計平臺“無劍”出鞘!成本周期壓縮至50%,解密三大硬核實力

按照平頭哥的介紹,該平臺能幫助芯片設(shè)計企業(yè),將設(shè)計成本和設(shè)計周期壓縮50%,顯著降低定制化芯片的研發(fā)門檻,降低效率、提升質(zhì)量,讓企業(yè)能更加專注于開發(fā)出與應(yīng)用場景更好融合的芯片產(chǎn)品。

同日,基于平頭哥自研玄鐵CPU的無劍視覺AI平臺問世,已應(yīng)用到媒體AI芯片、AI視覺芯片、邊緣AI服務(wù)器芯片等IoT產(chǎn)品中。

發(fā)布會期間,平頭哥發(fā)言人不僅詳細(xì)解讀無劍平臺的三大硬核實力和亮點,解答無劍如何與阿里云實現(xiàn)云端協(xié)同,而且就AI芯片發(fā)展現(xiàn)狀、AIoT時代對芯片研發(fā)的挑戰(zhàn)、阿里平頭哥在未來產(chǎn)業(yè)扮演的角色等問題一一回應(yīng)。

經(jīng)透露,無劍平臺采用的是授權(quán)模式,不排除未來開源的可能。

另外,在云端,平頭哥自研的第一款NPU芯片也將于今年發(fā)布,其性能處于業(yè)界領(lǐng)先定位,主要用于阿里云數(shù)據(jù)中心。

一、無劍的三大硬核能力

無劍平臺由SoC架構(gòu)、處理器、各類IP、操作系統(tǒng)、軟件驅(qū)動和開發(fā)工具等模塊構(gòu)成,支持第三方AI加速引擎,并包含AI必須的基礎(chǔ)軟件體系。

它能提供集芯片架構(gòu)、基礎(chǔ)軟件、算法與開發(fā)工等一體的整體解決方案,能夠承擔(dān)AIoT芯片約80%的通用設(shè)計工作量,讓芯片研發(fā)企業(yè)只需專注于剩余20%的專用設(shè)計工作。

1、硬件:異構(gòu)AI加速引擎框架

為了充分發(fā)揮各種不同硬件的效能,平頭哥打造了一個多場景靈活可配置的異構(gòu)AI加速引擎框架,允許用戶自定義。

平頭哥提供神經(jīng)網(wǎng)絡(luò)加速庫及異構(gòu)編譯器技術(shù),向芯片廠商提供多粒度的硬件抽象接口。

無論是低功耗低成本的語音芯片,還是高性能低時延的視覺芯片,芯片廠商可以根據(jù)各種硬件特征,快速對接到AI加速引擎,高效地發(fā)揮硬件性能。

該引擎支持當(dāng)前所有主流框架,幾乎所有的標(biāo)準(zhǔn)模型都能夠在上面一鍵部署;它也提供一套便捷的自定義層開發(fā)接口,方便開發(fā)者多樣化需求。

2、應(yīng)用開發(fā):標(biāo)準(zhǔn)統(tǒng)一的開發(fā)框架

平頭哥開發(fā)了一套標(biāo)準(zhǔn)統(tǒng)一的應(yīng)用開發(fā)框架,同一個應(yīng)用可以在不同算力的硬件上進(jìn)行無縫遷移。

據(jù)悉,平頭哥集成開發(fā)環(huán)境完美融合該引擎,并添加一鍵部署、圖形化算力分析、異構(gòu)多核聯(lián)合調(diào)試等功能,解決實際開發(fā)過程中最困難的問題。

根據(jù)其實際客戶開發(fā)數(shù)據(jù)的統(tǒng)計,整個軟件框架可為芯片廠商節(jié)省60%的AI基礎(chǔ)軟件開發(fā)成本,縮短方案廠商50%的應(yīng)用開發(fā)時間。

3、基礎(chǔ)軟件:對接豐富資源

軟件工具鏈?zhǔn)腔A(chǔ)軟件,是芯片推廣過程中必不可少的工具,軟件工具鏈的優(yōu)劣很大程度上決定著芯片被使用的概率。

由于基礎(chǔ)軟件商業(yè)變現(xiàn)難,通常不被產(chǎn)品公司重視。

軟件生態(tài)是開發(fā)者能夠獲取資源的一個大環(huán)境,開發(fā)者總是愿意采用生態(tài)好、資源豐富的AI芯片產(chǎn)品。

二、視覺平臺已落地,玄鐵910是主控CPU

此次發(fā)布的無劍視覺AI平臺,主要面向視覺AI場景,會根據(jù)客戶需求持續(xù)升級。

近期發(fā)布的RISC-V處理器玄鐵910,是無劍視覺AI平臺的主控CPU。

玄鐵910與芯片設(shè)計公司自研的AI加速引擎形成高性能異構(gòu)計算的完整方案。

這一視覺平臺的其他性能有:最大存儲帶寬400Gbps,單通道PCIE接口帶寬16Gbps,可支持16TOPS以下的邊緣側(cè)AI計算需求。

據(jù)介紹,該平臺已應(yīng)用到多媒體AI芯片、AI視覺芯片、邊緣AI服務(wù)器芯片等多家IoT廠商的產(chǎn)品中。

無劍平臺同時對IP公司開放,吸納全球最有競爭力的IP產(chǎn)品與無劍平臺進(jìn)行原型流片驗證,已經(jīng)過硅驗證,并且已在阿里內(nèi)部和多家客戶的芯片產(chǎn)品中得到應(yīng)用。

未來,無劍平臺還將面向MCU、工業(yè)、安全、車載、接入等應(yīng)用領(lǐng)域開發(fā)基礎(chǔ)設(shè)施及周邊技術(shù),持續(xù)推出面向領(lǐng)域的SoC平臺。

三、無劍如何將設(shè)計成本和周期各砍一半?

無劍能將設(shè)計成本和周期分別降低50%,主要來源于兩個方面:

第一,平臺化的設(shè)計方法讓IP能夠很快的接入到系統(tǒng),大幅降低IP支持成本,IP的價格將大幅下降。

第二,通過硬件平臺化和軟件平臺化的思路,研發(fā)上面的人力投入大幅降低。綜合來講,設(shè)計成本有望降低50%。

平臺化的思路,是指減少芯片設(shè)計過程中的重復(fù)性的投入,50%以上的設(shè)計驗證工作是可以消除的。

另外,如果平臺的各種模擬IP與代工廠工藝已經(jīng)完成了驗證,可以跳過3個月以上的試生產(chǎn)(MPW)的階段,直接進(jìn)入量產(chǎn),通常芯片從設(shè)計到量產(chǎn)的時間可以達(dá)到9個月以內(nèi)。

“敏捷設(shè)計是下一階段芯片設(shè)計領(lǐng)域發(fā)展的重點方向,”清華大學(xué)微電子所副所長、清微智能創(chuàng)始人尹首一教授表示,“軟硬件深度融合的有行業(yè)特點的芯片平臺讓芯片設(shè)計公司省去很多底層的芯片開發(fā)工作,更加專注于產(chǎn)品定義與核心技術(shù)本身,形成差異化的芯片產(chǎn)品,提升市場競爭力?!?/p>

四、端云協(xié)同,能天然接入阿里云

AIoT在線智能的特點,需要端云協(xié)同來實現(xiàn)。

所謂端云協(xié)同,是指在下一代芯片開發(fā)時,僅要考慮到端上的計算能力,還要考慮云上的能力。

例如,AI芯片的網(wǎng)絡(luò)模型需與云端頻繁互動,需要從芯片底層到操作系統(tǒng)方面的架構(gòu)支持。

平頭哥隸屬于阿里云智能,根據(jù)阿里云業(yè)務(wù)場景進(jìn)行云端一體架構(gòu)的探索與嘗試。

無劍AI芯片平臺的端云一體,是平頭哥軟硬件基礎(chǔ)能力的體現(xiàn),體現(xiàn)在圍繞云計算的場景中,端側(cè)設(shè)備具有實時與云端應(yīng)用互動的能力。

基于平頭哥芯片平臺的產(chǎn)品能天然接入阿里云,與云端應(yīng)用生態(tài)對接后將形成新的產(chǎn)品形態(tài)。

五、“平頭哥”模式與阿里的芯片定位

阿里平頭哥芯片設(shè)計平臺“無劍”出鞘!成本周期壓縮至50%,解密三大硬核實力

平頭哥的長遠(yuǎn)目標(biāo),是做AIoT時代芯片基礎(chǔ)設(shè)施提供者,為了接近這個“小目標(biāo)”,它提出了芯片設(shè)計的“平頭哥模式”:

以無劍平臺為核心,從芯片到應(yīng)用全棧開放集成,實現(xiàn)處理器、算法、操作系統(tǒng)等軟硬件核心技術(shù)的深度融合,打破傳統(tǒng)通用芯片時代IP授權(quán)商用模式成本高、使用難、周期長的局限,為企業(yè)提供從芯片到應(yīng)用的全棧技術(shù)能力。

簡而言之,平頭哥模式具有三大特點:全棧、開放、被集成。

它的優(yōu)勢很明顯:一是IP、系統(tǒng)芯片設(shè)計經(jīng)驗豐富,在處理器領(lǐng)域有充足話語權(quán);二是有錢,也愿意長期砸錢、砸人才;三是整合豐富的生態(tài)資源,通過構(gòu)建平臺,降低芯片設(shè)計門檻。

這與阿里在芯片上的定位一致,即做好芯片行業(yè)的基礎(chǔ)設(shè)施。

處理器是所有高端系統(tǒng)芯片都需要的產(chǎn)品,是最核心的基礎(chǔ)設(shè)施產(chǎn)品,阿里將投入重金打造好技術(shù),同時構(gòu)建應(yīng)用生態(tài)。

除了處理器以外,阿里還將繼續(xù)開發(fā)操作系統(tǒng)、軟硬件融合的算法、核心的IP等,將這些共性的技術(shù)能夠做好、做精、做出競爭力。

當(dāng)然,大目標(biāo)是要形成生態(tài),然后開放給他們的芯片設(shè)計,使之基于高質(zhì)量的基礎(chǔ)設(shè)施打造芯片產(chǎn)品,以提升整體的產(chǎn)業(yè)競爭力。

六、芯片設(shè)計進(jìn)入3.0時代

平頭哥半導(dǎo)體研究員孟建熠認(rèn)為,芯片設(shè)計方法正在進(jìn)入新的3.0時代。

阿里平頭哥芯片設(shè)計平臺“無劍”出鞘!成本周期壓縮至50%,解密三大硬核實力

1.0時代從1990至2000年,芯片設(shè)計基于ASIC流程進(jìn)行,每次研發(fā)新芯片都需從電路開始重新設(shè)計。

2000年后進(jìn)入2.0時代,基于IP的模塊化的設(shè)計方法,降低了芯片的開發(fā)成本和設(shè)計風(fēng)險。

AIoT市場具有強(qiáng)應(yīng)用驅(qū)動、場景碎片化等特征,隨著AIoT應(yīng)用發(fā)展如火如荼,需要更加高效的設(shè)計方法。

由此,芯片設(shè)計進(jìn)入3.0時代,在基礎(chǔ)框架/模板基礎(chǔ)上,定制符合應(yīng)用需求的芯片產(chǎn)品,以最快速度推向精準(zhǔn)市場。

據(jù)國際數(shù)據(jù)公司IDC預(yù)測,到2025年,全球聯(lián)網(wǎng)的IoT設(shè)備將達(dá)到416億臺,這些端上設(shè)備將產(chǎn)生的數(shù)據(jù)量是79.4ZB,相當(dāng)于9萬億部時長2小時的高清電影。

Gartner預(yù)測,其中80%的IoT設(shè)備將由AI加持。

在摩爾定律時代,芯片研發(fā)追求通用性,比工藝、比投入。

在后摩爾定律時代,碎片化的AIoT場景對芯片的要求更多在于市場靈敏度,芯片研發(fā)比的是需求適配和成本。

傳統(tǒng)通用芯片設(shè)計方式往往太重,成本投入高、設(shè)計周期長,很難適應(yīng)未來AIoT市場小批量、定制化的需求。

很多SoC設(shè)計方法雖然效率較ASIC設(shè)計方法有很大提升,但從IP到系統(tǒng)集成驗證、再到軟件調(diào)試過程,依然耗時耗成本。

無劍芯片平臺正是針對這一痛點,試圖提供全新的、更加高效的設(shè)計方法學(xué)。

這只是平頭哥野心的初步成果,平頭哥的雄偉目標(biāo),是以生態(tài)營造者的角色,引領(lǐng)芯片3.0時代。

結(jié)語:AIoT芯片或進(jìn)入更快落地潮

算力是推動AI產(chǎn)業(yè)發(fā)展的重要動力,而在智能應(yīng)用不斷快速裂變的今時今日,所有芯片都面臨著升級。

近年來,傳統(tǒng)芯片公司、互聯(lián)網(wǎng)公司、AI芯片創(chuàng)企和算法公司紛紛投入AI芯片的浪潮之中,開發(fā)出滿足自身或市場需求的AI芯片。

AI芯片的第一波浪潮已經(jīng)過去,很多產(chǎn)品正面臨著市場嚴(yán)酷的考驗,大浪淘沙,缺乏應(yīng)用場景的AI芯片將被市場淘汰。

而隨著像無劍這樣的一體式芯片設(shè)計平臺的普及,很多中小型的設(shè)計公司可以根據(jù)應(yīng)用快速定制出芯片產(chǎn)品,形成“快魚吃慢魚”的格局。

AIoT產(chǎn)業(yè)或許將呈現(xiàn)更欣欣向榮的定制化芯片落地浪潮。