智東西(公眾號:zhidxcom)
作者 | 心緣
編輯 | 漠影
2021年11月,嘉楠科技公布第三季度最新財報,此時距離它作為“中國自主知識產(chǎn)權(quán)AI芯片在美上市第一股”登陸納斯達克,已過去整整兩年。
在新冠疫情等黑天鵝事件影響全球半導(dǎo)體供應(yīng)鏈動蕩的背景下,嘉楠科技的業(yè)績逆勢爆發(fā),最新一季營收逾13億元,同比增長超700%。
嘉楠科技創(chuàng)始人、董事長、CEO張楠賡總結(jié)這一年,嘉楠的業(yè)績已經(jīng)是“出乎意料的好”,在業(yè)界橫向比較、縱向比較都是如此。
這位早期區(qū)塊鏈圈子里的神秘大佬,曾憑“NG Zhang”的名號曾響徹區(qū)塊鏈江湖,過去15年,他一直在折騰:
22歲到航天科工集團做技術(shù)員,25歲讀芯片設(shè)計研究生參與龍芯項目,27歲在讀博期間結(jié)緣比特幣,30歲創(chuàng)業(yè)并交付全球首款區(qū)塊鏈ASIC芯片,36歲站上納斯達克敲鐘……
在區(qū)塊鏈領(lǐng)域揚名立萬后,如今,張楠賡正帶領(lǐng)嘉楠科技全速發(fā)展其第二增長引擎——AI芯片。
知名市場研究機構(gòu)Gartner的數(shù)據(jù)顯示,全球AI芯片市場規(guī)模有望在2021年達343億美元,2025年將逾700億美元。目前,該芯片已落地于仿生機器狗、智能門鎖、智能編程積木等智能硬件產(chǎn)品。
隨著量產(chǎn)落地成為AI芯片的主場,在端側(cè)AI芯片耕耘五年之久的嘉楠科技,已成長為國產(chǎn)AI芯片商用化進程中一個極具代表性的樣本。
在嘉楠科技北京辦公室里,張楠賡向我們講述了這些年嘉楠AI芯片打怪升級的歷程。

▲嘉楠科技創(chuàng)始人、董事長、CEO張楠賡
一、尋找區(qū)塊鏈之外的第二顆芯
某種程度上,張楠賡創(chuàng)業(yè)前的經(jīng)歷,很像熱血漫畫主角的設(shè)定——前期平凡,發(fā)現(xiàn)新世界后被激發(fā)潛能,對戰(zhàn)反派,最終成功拯救世界。
2008年,25歲的張楠賡已經(jīng)作為一位航天技術(shù)員工作三年,經(jīng)??磩勇虬l(fā)時間,如果繼續(xù)留在這里,一眼似乎就能望到退休,他選擇作別這樣平淡的生活,返回北航讀集成電路設(shè)計研究生。
接下來便是在區(qū)塊鏈圈為人津津樂道的經(jīng)典故事。2010年,正在讀博的張楠賡被區(qū)塊鏈吸引,開始以“NG Zhang”的ID活躍于比特幣論壇,孰料2012年6月陡生變故——美國“蝴蝶實驗室”宣稱要研發(fā)能將算力提升數(shù)倍的ASIC礦機。
可怕的是,一旦有人掌握超過半數(shù)的算力,則足以壟斷整個比特幣網(wǎng)絡(luò),這對于區(qū)塊鏈將造成毀滅性的打擊。
為了守護比特幣的秩序,“熱血青年”張楠賡正面迎戰(zhàn),發(fā)起與經(jīng)典日漫Fate中最強防御裝備同名的“阿瓦隆項目”,成功先于蝴蝶實驗室在2013年1月研制出全球首臺ASIC礦機,并將第一批300臺阿瓦隆礦機全部對外銷售,憑一己之力對抗可能出現(xiàn)的壟斷,堅守“算力去中心化”之信仰。
要知道,當(dāng)時阿瓦隆礦機一天能造357個比特幣,按現(xiàn)在的比特幣價格來換算(1比特幣≈5萬美元、32萬人民幣),相當(dāng)于日產(chǎn)逾1億人民幣。
一時間阿瓦隆礦機洛陽紙貴,求機者絡(luò)繹不絕,NG Zhang一戰(zhàn)封神。
在此期間,張楠賡曾向?qū)熖岢霾┦啃輰W(xué)申請,卻遭拒絕,堅信區(qū)塊鏈技術(shù)能夠改變世界的他當(dāng)機立斷:退學(xué),創(chuàng)業(yè)。
2013年4月1日,嘉楠科技正式成立,開始規(guī)?;a(chǎn)礦機。創(chuàng)業(yè)早期,張楠賡下單京東所有電源插件、跑遍北京所有電子批發(fā)市場湊齊零部件,還自己充當(dāng)“快遞小哥”以按時發(fā)貨……隨著訂單越來越多,礦機一度被爆炒至單價二三十萬元,嘉楠科技的芯片研發(fā)也快速迭代。
張楠賡處世非常低調(diào),在很長一段時間,人們都只知NG Zhang,不知張楠賡。這位隱形大佬在生活中不拘小節(jié),全身穿著不超過500元,迪卡儂、優(yōu)衣庫T恤是日常標(biāo)配,甚至曾穿著短褲和拖鞋去參加剪彩儀式,在人群中深藏功與名。
2015年,嘉楠科技研發(fā)出28nm工藝芯片,一腳踏進先進制程的大門。研發(fā)期間,他在桌子和床之間兩點一線,夜以繼日,累了往后一躺,醒了坐起來繼續(xù)干,就這樣帶著團隊將嘉楠干到了國內(nèi)前十實現(xiàn)16nm制程芯片量產(chǎn)的企業(yè)。
沒有誰能永遠停留在巔峰,區(qū)塊鏈的傳奇故事已經(jīng)過去,嘉楠此時也穩(wěn)居礦機老二,張楠賡開始琢磨,能不能將嘉楠積累的芯片設(shè)計和量產(chǎn)經(jīng)驗,發(fā)揮到其他芯片賽道?
人工智能,這個經(jīng)過幾十年理論積累,在2016年前后突然興起的前沿技術(shù)領(lǐng)域,就這樣闖進張楠賡的腦海,并成為嘉楠科技接下來5年重點培育的第二增長曲線。
二、14次流片、100%成功率、明年挺進3nm,嘉楠如何踩準(zhǔn)AI芯片風(fēng)口?
在AlphaGo擊敗世界圍棋冠軍李世石、令人工智能名聲大噪的2016年,嘉楠科技基于RISC-V的AI芯片業(yè)務(wù)正式啟航。
張楠賡將嘉楠定位為一家芯片設(shè)計公司?!爱?dāng)時覺得一個產(chǎn)品基本上做到某一個程度以后,橫向擴展其他產(chǎn)品,這就是水到渠成的事。”他也考慮過手機、基因測序等芯片方向,最終更傾向于“做最后量會比較大的行業(yè)”。
至于為何選擇研發(fā)端側(cè)AI芯片,張楠賡說:“這其實是出于我個人的性格原因。我選擇做什么東西的話,它是有一些原則的,就是說我們做的東西它一定是有兩個選項,一個是要提升社會運行效率和改善人類生活方式,這也是公司的愿景,另一個就是要能盈利?!迸c其做成熟行業(yè)的追隨者,他更想做新興市場的探路人。
而端側(cè)AI芯片,正是一個還未被建立秩序的新賽道,沒有主導(dǎo)行業(yè)的公司,沒有主流產(chǎn)品,更重要的是,望向未來5年,AI芯片行業(yè)方興未艾,相比成熟芯片行業(yè),這里向創(chuàng)業(yè)者敞開了更大的機會空間。
就這樣,嘉楠科技成為一家區(qū)塊鏈芯片和AI芯片兩條腿走路的公司。

張楠賡相信科技發(fā)展速度會短期被高估,長期被低估。在他看來,做芯片最關(guān)鍵的困難,是可能5年都不見得能盈利。而最終用戶對體驗的要求越來越高,需要投入資源、錢和時間去研發(fā),只有實現(xiàn)遠超起初設(shè)定的產(chǎn)品性能、性價比,才能獲得消費者的認(rèn)可。
這使得嘉楠在區(qū)塊鏈芯片領(lǐng)域長期的沉淀,得以轉(zhuǎn)換成其AI芯片業(yè)務(wù)的優(yōu)勢。
一方面,張楠賡認(rèn)為一家健康的芯片公司,需要有掙錢的業(yè)務(wù)、有芯片相關(guān)技術(shù)的積累。嘉楠自家的區(qū)塊鏈業(yè)務(wù)足以持續(xù)造血,不依賴融資便可支撐其AI芯片業(yè)務(wù)的穩(wěn)定前進。
財報顯示,嘉楠科技2021財年第三季度總營收13.2億元,同比增長708.2%,凈利潤4.72億元,這也是其上市以來的最好成績。在去年前三個季度,其研發(fā)投入超過2億元。
另一方面,區(qū)塊鏈芯片與端側(cè)AI芯片的設(shè)計理念有共通之處,均屬計算密集型,對成本、功耗和性能有極致要求,追逐更先進的制程工藝。而嘉楠在量產(chǎn)先進制程工藝芯片方面有深厚的積累。
“區(qū)塊鏈計算芯片在技術(shù)上有一些應(yīng)用特點,現(xiàn)在來看的話,它實際上挖的是比較深的,”張楠賡說,“在和計算相關(guān)的特定領(lǐng)域,還有工藝制程上等等,像做的比較好的區(qū)塊鏈計算芯片,走到后面都是一樣的,都是在優(yōu)化以上這些東西,所以我覺得底層技術(shù)的話完全可以共享?!?/p>
在先進制程方面,嘉楠一直走在市場前列:2015年實現(xiàn)28nm,2016年實現(xiàn)16nm,2018年成為臺積電首批7nm戰(zhàn)略合作伙伴、推出并量產(chǎn)首款7nm ASIC芯片……當(dāng)前嘉楠已實現(xiàn)5nm定制單元和模擬IP的開發(fā),明年將啟動3nm研發(fā)。
截至2020年12月31日,嘉楠共完成14次ASIC芯片流片、保持100%成功率。
在這背后,嘉楠組建了一支能自主實現(xiàn)先進制程芯片前端邏輯和后端物理設(shè)計、覆蓋完整的封裝、散熱和量產(chǎn)工藝的成熟研發(fā)團隊,是區(qū)塊鏈計算領(lǐng)域唯一踐行多晶圓廠策略的廠商。
不同于多數(shù)Fabless公司,嘉楠擁有定制電路模塊設(shè)計團隊及從事物理IP設(shè)計的團隊,并擁有針對先進工藝設(shè)計的FinFET工藝和設(shè)計團隊,在近閾值電路工藝和設(shè)計領(lǐng)域積累了大量工程經(jīng)驗。
嘉楠建立了從FinFET SPICE仿真設(shè)計到post-Si硅后驗證的完整流程,業(yè)務(wù)能力覆蓋前后端和芯片量產(chǎn)的所有環(huán)節(jié)。以SoC設(shè)計為主線,嘉楠科技的芯片研發(fā)流程貫穿指令集架構(gòu)、自研IP核、算法預(yù)研和系統(tǒng)集成,以及后端的物理實現(xiàn)和運營工程,最終實現(xiàn)芯片量產(chǎn)和交付。

三、自研創(chuàng)新計算數(shù)據(jù)流技術(shù),計算效率翻倍提升
創(chuàng)業(yè)是一場沒有顛簸就不精彩的冒險,選擇率先嘗試,必然要經(jīng)歷摸著石頭過河的過程。
2018年9月,嘉楠發(fā)布首款搭載RISC-V架構(gòu)CPU和自研KPU的邊緣AI芯片勘智K210,這是全球最早量產(chǎn)的RISC-V架構(gòu)商用邊緣AI芯片。
在張楠賡拍板確定用RISC-V開源內(nèi)核時,RISC-V還是個冷門而小眾的技術(shù)領(lǐng)域,直到勘智K210推出那年,它才作為有望與x86、Arm齊肩的第三大指令集架構(gòu),開始在國內(nèi)芯片產(chǎn)業(yè)聲名鵲起。
張楠賡說,為驗證概念正確性而生的勘智K210,當(dāng)時投入的資金、人力其實很少。這兩年又遇到行業(yè)產(chǎn)能受限的影響,即便這樣,它依然得到了市場的認(rèn)可。

據(jù)他回憶,剛開始推廣的過程“非常艱險”。一方面,勘智K210推出時,軟件適配基本上處于一片空白的狀態(tài);另一方面,怎么賣、賣給誰等問題令嘉楠團隊焦頭爛額,許多客戶并不清楚AI芯片到底有什么用。
之后兩年間,嘉楠重點實現(xiàn)軟件和算法方面的進步,并開發(fā)了一系列概念驗證產(chǎn)品(POC),將芯片手冊放到開發(fā)者社區(qū)推廣,讓客戶能通過測試直觀感受到嘉楠AI芯片的實際性能。同時,客戶可以直接在嘉楠的網(wǎng)店或百度AI市場等渠道中買到其AI芯片。
張楠賡談到困難時坦言:“我們現(xiàn)在更多的精力其實是在圍著客戶轉(zhuǎn),而且這個圍著客戶轉(zhuǎn)的還非常復(fù)雜,不是說你告訴我就是說你需要跑一些什么具體的東西,然后我就去實現(xiàn)它,這樣作為工程實現(xiàn)就結(jié)束了。現(xiàn)在更多的還是要我們必須去關(guān)注用戶具體的應(yīng)用場景和產(chǎn)品,然后從這個出發(fā)再重新走整個產(chǎn)品低端的整合的過程,然后才能到芯片?!?/p>
“現(xiàn)在芯片軟件硬件結(jié)合得太緊密了,需要密切合作的客戶去看他的場景,所以并沒有一個‘芯片賣的特別好,然后所有的東西都很完美,市場上其他家照著對標(biāo)它就做差不多東西就行了’的這樣一個東西?!?/p>
越早落地,也就意味著越早接觸和磨合用戶的實際需求??敝荎210收集到的用戶反饋,被匯集成經(jīng)驗,融入新一代端側(cè)AI芯片勘智K510中。

▲張楠賡在2021年世界人工智能大會上展示勘智510芯片
勘智K510于2021年7月發(fā)布,主要面向中高端視覺推理市場,搭載了自研RISC-V CPU內(nèi)核及第二代專用神經(jīng)網(wǎng)絡(luò)加速器IP核KPU2.0,并在總線架構(gòu)、存儲空間和視覺子系統(tǒng)等方面進行升級。
得益于嘉楠自研的計算數(shù)據(jù)流技術(shù),KPU2.0的計算效率大幅提升,達到2.5TFLOPS/2.5TOPS,分別支持INT8和BF16數(shù)據(jù)精度運算。相比之下,此前KPU1.0的浮點數(shù)運算能力為1.08TFLOPS。
計算數(shù)據(jù)流技術(shù)的創(chuàng)新在于對3D PE計算陣列和GLB局部訪存技術(shù)的結(jié)合,及多級存儲的使用。
傳統(tǒng)的PE計算陣列通常是2D的,而KPU2.0搭載了動態(tài)3D PE計算陣列,可以動態(tài)開啟或關(guān)閉每一個2D陣列,根據(jù)神經(jīng)網(wǎng)絡(luò)中不同層級的帶寬、計算和存儲需求進行調(diào)整,提高數(shù)據(jù)的復(fù)用率,并降低芯片功耗。
KPU2.0通過可配置的SRAM陣列實現(xiàn)GLB(Global Local Buffer)設(shè)計,能滿足不同數(shù)據(jù)類型在不同層級的帶寬和存儲需求,提升內(nèi)部RAM的利用率。

張楠賡解釋道:“神經(jīng)網(wǎng)絡(luò)相關(guān)計算的話,第一計算特別密集,第二數(shù)據(jù)特別大,量特別大,數(shù)據(jù)傳輸?shù)臅r間開銷和能耗超過了計算本身的開銷,這是特別大的浪費“。
他認(rèn)為,主要的解決方案是通過做多級的緩存和存儲結(jié)構(gòu),讓頻繁使用的數(shù)據(jù)靠近計算單元。模型就擺在那,所以主要問題還是做計算、存儲和帶寬的平衡,盡量減少數(shù)據(jù)的讀取是最基本,也是最重要的。
與此同時,從區(qū)塊鏈芯片到AI芯片,張楠賡都堅持開源的理念。在他看來,無論是開源軟件或硬件,較大發(fā)展的背后都有一些企業(yè)在做無償貢獻?!拔覀円蚕M覀兪情_放性最好的一個平臺?!彼嘈?,這將為嘉楠的長期發(fā)展帶來優(yōu)勢。

▲嘉楠開發(fā)者社區(qū)
四、端側(cè)AI芯片落地機器人、智能門鎖,新一代明年投片
市場調(diào)研數(shù)據(jù)映證了張楠賡5年前的判斷。
根據(jù)市場咨詢公司ABI Research的報告,預(yù)計到2025年,邊緣AI芯片市場的收入將達到122億美元,超過收入為119億美元的云端AI芯片市場。
隨著商業(yè)模式逐漸打磨成形,嘉楠科技的AI芯片商用落地開始加速。
第一代勘智K210芯片是單芯片方案,設(shè)計簡潔,整體成本較低,像RISC-V的官方手冊拿來即可使用,功能和成本都特別適合做開發(fā),因此在教育領(lǐng)域受到歡迎。
例如,在AI STEAM教育領(lǐng)域,嘉楠的合作伙伴有國內(nèi)機器人獨角獸企業(yè)優(yōu)必選、明星機器狗創(chuàng)企陸吾智能等。優(yōu)必選的智能編程積木Ukit2.0、陸吾智能的最新桌面級四足機器人XGO-mini均搭載了勘智K210芯片。

▲陸吾智能仿生四足機器狗XGO-mini
在高校教研方面,依托RISC-V開源架構(gòu)芯片優(yōu)勢,嘉楠科技作為2021全國計算機系統(tǒng)設(shè)計大賽唯一技術(shù)支持方,為大賽提供K210芯片及開發(fā)板,并為參賽隊伍提供技術(shù)培訓(xùn)支持。去年,K210芯片進入上海交大大學(xué)生創(chuàng)新中心的開源硬件實戰(zhàn)課程。
此外,勘智K210及K510在智能家居、AI STEAM智能硬件、智能門禁等場景均有一些成功落地項目。
在智能家居領(lǐng)域,嘉楠科技與廣州昂寶電子合作,其智能人臉貓眼門鎖、智能人臉聯(lián)網(wǎng)門鎖、4G路由器和迎賓機器人等多款產(chǎn)品均搭載了勘智AI芯片。

在海外市場方面,嘉楠科技在疫情期間與美國傳感器廠商VergeSense合作,研發(fā)基于AI芯片的智能傳感器,用于辦公區(qū)域特定人流量及社交距離檢測,依據(jù)人流密集程度進行告警。面向日本市場,嘉楠科技與日本老牌物聯(lián)網(wǎng)廠商Cathay Tri-Tech合作,推動勘智AI芯片及人臉識別模組在日本市場的推廣和銷售。

▲Cathay Tri-Tech網(wǎng)站
據(jù)張楠賡分享,嘉楠科技當(dāng)前的AI芯片產(chǎn)品按算力分為三類,1TOPS級別主打輕量化,4~8TOPS面向較高端的端側(cè)市場,更高算力則主要應(yīng)用于一些更復(fù)雜的邊緣場景。
目前嘉楠AI芯片的迭代周期為每兩年一大代,繼去年推出勘智K510后,其最新的K230芯片研發(fā)工作正在穩(wěn)步推進,擬明年下半年投片。接下來,嘉楠科技可能會往強邊緣AI芯片發(fā)展,這類芯片性能跟云端有一拼,但不會用在服務(wù)器。
他還透露了嘉楠AI芯片下一步重點發(fā)力的方向:一是提高計算效率,支持更多不同的算法和網(wǎng)絡(luò)結(jié)構(gòu),二是優(yōu)化全局緩存,三是維持整體成本基本不變,可能實現(xiàn)售價的進一步下調(diào)。
接下來,張楠賡計劃大幅擴張軟件團隊。為了引入更多客戶、持續(xù)優(yōu)化體驗,他也考慮之后向為客戶提供定制化的方向發(fā)展,交付一些質(zhì)量達到商用demo級的AI模型或功能。
結(jié)語:未來兩三年,端側(cè)AI芯片將加速發(fā)展
創(chuàng)業(yè)8年,從曾經(jīng)的“二次元“少年成長為一家上市公司的董事長,現(xiàn)年38歲的張楠賡已經(jīng)沒有時間再去追番。
聊起創(chuàng)業(yè)這些年的變化,張楠賡很是感慨:“創(chuàng)業(yè)這個事的話,還是不要著急。這跟想好的不一樣?!笨赡艽蠹以鞠胱鲆患也⒉惶蟮墓荆?,企業(yè)發(fā)展就不見得全由你來決定,企業(yè)是順勢而為,勢到哪里,它就要往哪個方向發(fā)展。
“后面能力越大,責(zé)任越大,尤其是像我這種責(zé)任感比較強的人,可能比較累?!彼劦?,現(xiàn)在嘉楠仍處于創(chuàng)業(yè)公司的狀態(tài),因為行業(yè)變化太快了,有太多東西要去處理?!坝腥苏f,7年人就會更新一遍,我已經(jīng)不是那個我了?!?/p>
回顧嘉楠推進AI芯片的5年,AI產(chǎn)業(yè)變了太多,新技術(shù)、應(yīng)用層出不窮,市場也進一步擴容。盡管可以看到歷代端側(cè)AI芯片產(chǎn)品之間明顯的代差,但令他不太開心的是,包括嘉楠在內(nèi),整個行業(yè)還沒有達到讓大多數(shù)客戶非常滿意的程度。
用張楠賡的話講:“目前一些芯片在市場上是不成功的,這并不是說你無法戰(zhàn)勝競爭對手,而是你沒有辦法得到消費者的認(rèn)可。所以其實是一個對我對整個行業(yè)來說,其實要求都越來越高了?!狈催^來,他也認(rèn)為這是好事,說明大家是有需求的,只是需要更好的產(chǎn)品。
“市場還沒有打開,是現(xiàn)在最大的一個問題?!彼X得,現(xiàn)在應(yīng)該更多地去總結(jié)過去5年大家做的事情,思考和判斷為什么有些規(guī)劃沒有達到預(yù)期,然后以一個重新出發(fā)的心態(tài),繼續(xù)前進。
他相信未來兩三年間,端側(cè)AI芯片將呈加速發(fā)展之勢,性能會大踏步地往上走,大家應(yīng)該能看到很不錯的產(chǎn)品?!爸翱赡芨嗍桥谴髟碌卦谑袌鲋忻鞯囊粋€狀態(tài)”,張楠賡說,“但現(xiàn)在還是能看到一些曙光,產(chǎn)品確實越來越好了。”