智東西(公眾號(hào):zhidxcom)
文 | 心緣

架構(gòu)創(chuàng)新正成為新風(fēng)口,而新興勢(shì)力在其中扮演著至關(guān)重要的角色。

傳統(tǒng)芯片遵循馮·諾依曼架構(gòu),處理器和存儲(chǔ)相互分離,在承擔(dān)AI推理運(yùn)算時(shí),數(shù)據(jù)要在硬盤、主存、計(jì)算單元之間搬來(lái)搬去,90%以上的能量損耗于這一過程中。

為了突破傳統(tǒng)架構(gòu)對(duì)算力的掣肘,存算一體這種新興邏輯架構(gòu)應(yīng)運(yùn)而生。其常見實(shí)現(xiàn)方式有兩種,一是在內(nèi)存和固態(tài)硬盤芯片中植入計(jì)算單元,另一種則是在直接用存儲(chǔ)單元完成計(jì)算任務(wù)。

2016年,一對(duì)北大微電子系85后夫妻,在留美期間積累了基于NOR Flash的存算一體AI芯片研發(fā)經(jīng)驗(yàn),并早早定下回國(guó)創(chuàng)業(yè)的想法。

就在今年8月6日,他們所創(chuàng)辦的知存科技宣布了近億元A輪融資。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

▲知存科技創(chuàng)始人兼CEO王紹迪展示知存科技的存算一體AI芯片

近日,智東西同知存科技創(chuàng)始人兼CEO王紹迪聊了聊創(chuàng)業(yè)背后的故事,從創(chuàng)業(yè)想法萌芽階段的無(wú)人問津,到創(chuàng)業(yè)5個(gè)月完成流片,再到即將迎來(lái)第一批產(chǎn)品的落地,他們正在離三年內(nèi)賣出5000萬(wàn)顆芯片的“中期目標(biāo)”越來(lái)越近。

一、從游戲中孵出的芯片情結(jié)

23年前,王紹迪8歲,父母為他買了一臺(tái)搭載英特爾奔騰一代CPU的586電腦。那時(shí)候一臺(tái)586電腦售價(jià)八千多元,花費(fèi)了他父母將近一年的工資。

奔騰(Pentium)這個(gè)跨時(shí)代的產(chǎn)品,不僅開辟了英特爾一統(tǒng)CPU市場(chǎng)的盛世王朝,也在王紹迪心中埋下做芯片的種子。
小學(xué)期間的王紹迪,主要還是用電腦來(lái)玩游戲。在這一過程中,他直觀感受到摩爾定律帶來(lái)的變化,計(jì)算機(jī)變革飛速,CPU速度、光驅(qū)速度、軟盤速度、硬盤內(nèi)存大小等都日新月異。

很快,586電腦已經(jīng)跟不上游戲速度,家里的電腦配置逐漸升級(jí),每隔兩三年換一代。2000年左右,為了玩雷神之錘等3D效果好的游戲,王紹迪開始接觸GPU。漸漸地,王紹迪開始對(duì)芯片非常著迷。

經(jīng)過高中物理競(jìng)賽,高三上半學(xué)期,王紹迪被保送北大。在接受當(dāng)?shù)剡|沈晚報(bào)采訪時(shí),他即堅(jiān)定地表達(dá)了自己的愛好和志向,希望進(jìn)修微電子專業(yè),成為“中國(guó)芯”的研發(fā)人員之一。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

▲遼沈晚報(bào)專訪王紹迪(圖右)

二、結(jié)緣存算一體,師從學(xué)術(shù)大牛

知存科技關(guān)于存算一體芯片技術(shù)的根基,來(lái)源于王紹迪的妻子郭昕婕,她是第一批從事存算一體AI芯片研究的博士生。
盡管王紹迪和郭昕婕都是2011屆信息科學(xué)技術(shù)學(xué)院微電子專業(yè)的應(yīng)屆生,但由于北大教學(xué)很重視基礎(chǔ),前兩年上的都是理論課那種大課,兩人直到大三才相識(shí)。

到大四申請(qǐng)出國(guó)留學(xué)時(shí),兩人關(guān)于學(xué)校的一個(gè)重要篩選標(biāo)準(zhǔn)就三個(gè)字——離得近。
一般同學(xué)申請(qǐng)十幾所學(xué)校,他們則一連申請(qǐng)三十多個(gè)學(xué)校,還特意按著美國(guó)地圖看,就是為了能申請(qǐng)到同一個(gè)或者離得近的學(xué)校。最終,王紹迪申請(qǐng)到的加州大學(xué)洛杉磯分校(UCLA),和郭昕婕申請(qǐng)到的加州大學(xué)圣塔芭芭拉分校(UCSB),相隔不過100英里。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

說起來(lái),郭昕婕此后研究存算一體芯片所跟隨的導(dǎo)師,還是王紹迪在拿到幾個(gè)offer后,幫她向?qū)煂懶派暾?qǐng)的。
郭昕婕的導(dǎo)師Dmitri B.Strukov教授是做存算一體的學(xué)術(shù)大牛。

2008年,惠普實(shí)驗(yàn)室(HP Labs)證實(shí)了37年前的科學(xué)預(yù)言,發(fā)現(xiàn)世界上第四種基本電路元件——憶阻器(memristor),并成功實(shí)現(xiàn)了世界首個(gè)能工作的憶阻器原型,這項(xiàng)研究在《Nature》上發(fā)表《尋獲下落不明的憶阻器》,而Dmitri B.Strukov正是這一團(tuán)隊(duì)的核心成員之一。此后,憶阻器、存算一體這些研究陸續(xù)如火如荼地開展。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

▲HP Labs憶阻器團(tuán)隊(duì),從左到右分別是Dmitri Strukov, Stan Willams, Duncan Stewart, Greg Snider

2011年,即畢業(yè)那年,王紹迪和郭昕婕提交申請(qǐng),同樣在這一年,Dmitri B.Strukov準(zhǔn)備申請(qǐng)存算一體項(xiàng)目,次年郭昕婕就成為了第一批被招收的學(xué)生,被分到基于NOR Flash的存算一體芯片技術(shù)方向。

Dmitri B.Strukov告訴她,這個(gè)方向是最接近產(chǎn)業(yè)化的、實(shí)用的方向,F(xiàn)lash技術(shù)成熟,已經(jīng)商用幾十年,成本很低,但其缺點(diǎn)同樣是因?yàn)镕lash研究起步較早,不好在頂刊上發(fā)文章。

立項(xiàng)初期,深度學(xué)習(xí)還不火,郭昕婕主要將存算一體芯片應(yīng)用在視頻處理矩陣乘法,到2013年,深度學(xué)習(xí)的熱度席卷學(xué)術(shù)界,發(fā)現(xiàn)存算一體芯片運(yùn)算深度學(xué)習(xí)效果好后,在導(dǎo)師的支持下,郭昕婕直接轉(zhuǎn)方向到做深度學(xué)習(xí)芯片。
歷經(jīng)6次流片,耗時(shí)4年,郭昕婕終于在2016年研發(fā)出全球第一個(gè)3層神經(jīng)網(wǎng)絡(luò)的浮柵存算一體深度學(xué)習(xí)芯片技術(shù),并完成技術(shù)驗(yàn)證。一年后,她又再度攻下7層神經(jīng)網(wǎng)絡(luò)的浮柵存算一體深度學(xué)習(xí)芯片。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

▲郭昕婕在IEEE電子器件大會(huì)(IEDM 2017)上發(fā)表的論文

存算一體以存儲(chǔ)器和模擬單元為主,F(xiàn)lash存儲(chǔ)陣列經(jīng)優(yōu)化改造后,既可以容納更多神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),又可以完成和此權(quán)重相關(guān)的模擬計(jì)算。據(jù)王紹迪介紹,理論上,單個(gè)Flash單元可完成8bit乘加法運(yùn)算,假設(shè)有200M個(gè)Flash單元,就能存儲(chǔ)2億個(gè)參數(shù),同時(shí)能并行完成2億次乘加法運(yùn)算。實(shí)際運(yùn)行時(shí),算力約為峰值的10%-50%,由于芯片具備一定通用性,并非完全針對(duì)某一算法定制,AI算法在芯片無(wú)法達(dá)到100%的利用率。

在王紹迪看來(lái),存算一體芯片的核心優(yōu)勢(shì)有三點(diǎn)。

其一,存儲(chǔ)單元可用于計(jì)算,運(yùn)算中無(wú)需數(shù)據(jù)搬運(yùn),運(yùn)算單元數(shù)量可提升多個(gè)數(shù)量級(jí)。

其二,無(wú)需獨(dú)立計(jì)算單元,這樣既節(jié)省了片上并行計(jì)算單元的面積消耗,同時(shí)不用過于追求最先進(jìn)的芯片加工工藝,而是可以使用成熟工藝來(lái)降低成本。

其三,架構(gòu)中無(wú)需考慮內(nèi)存搬運(yùn),大幅降低多核AI芯片的設(shè)計(jì)難度。

三、投石無(wú)路,艱難的創(chuàng)業(yè)起步

從郭昕婕的研究中,王紹迪看到了端側(cè)AI芯片商用落地的價(jià)值,回國(guó)創(chuàng)業(yè)的想法在心中萌芽。然而創(chuàng)業(yè)的熱情燃燒正旺,突然就被現(xiàn)實(shí)的冷水澆熄,他在說服別人投資的路上屢屢碰壁。

2016年年中,王紹迪在中美兩處尋找投資人。

彼時(shí)美國(guó)主流觀點(diǎn)認(rèn)為端側(cè)不需要AI,只有服務(wù)器端深度學(xué)習(xí)做訓(xùn)練的需求才較大。王紹迪因在三星和Arm實(shí)習(xí),便嘗試聯(lián)系這兩家公司做存儲(chǔ)器的相關(guān)負(fù)責(zé)人,但他們認(rèn)為王紹迪提出的方案找不到應(yīng)用場(chǎng)景。

在美國(guó)沒得到正面反饋,王紹迪托人回國(guó)詢問卻也無(wú)果。

當(dāng)時(shí)他看中的市場(chǎng)是缺乏高效端側(cè)算力的AR市場(chǎng),而這一時(shí)期,國(guó)內(nèi)的AR剛走過高速發(fā)展的黃金時(shí)期,市場(chǎng)開始疲軟下滑,王紹迪也沒能建立什么有效的聯(lián)系。

時(shí)機(jī)沒到,就再等等,王紹迪留在美國(guó)繼續(xù)從事博士后研究工作,很快,希望再次來(lái)臨。

2016年9月,英特爾宣布收購(gòu)視覺處理芯片創(chuàng)企Movidius,直接填補(bǔ)其在物聯(lián)網(wǎng)領(lǐng)域的技術(shù)短板。伴隨著這一收購(gòu)案的推進(jìn),終端側(cè)AI芯片逐漸興起。從2017年年中開始,王紹迪每個(gè)月回國(guó)一次找融資,另外一位合伙人也一直在國(guó)內(nèi)幫著找各投資機(jī)構(gòu)去聊。因?yàn)榇嫠阋惑w芯片仍然非常小眾,找融資的歷程進(jìn)行的十分艱難。

終于,在一位北航教授的幫忙聯(lián)系下,啟迪之星、兆易創(chuàng)新的投資人在和王紹迪聊過后伸出了橄欖枝,說可以投資。
得到這一口頭承諾,王紹迪立刻飛往美國(guó)打包行李,把車一賣,提前談好做存算一體芯片所需的知識(shí)產(chǎn)權(quán)授權(quán),不到一個(gè)月就返回祖國(guó),于2017年10月在北京創(chuàng)辦知存科技,王紹迪任CEO,郭昕婕任CTO。

四、創(chuàng)業(yè)初期的摸索

成立初期的知存科技可謂是一窮二白,融資難、缺人才、沒經(jīng)驗(yàn)。

考慮到攜帶資料日后可能有風(fēng)險(xiǎn),王紹迪和妻子郭昕婕回國(guó)時(shí)基本上都兩手空空。

一開始,知存科技只有王紹迪、郭昕婕和他們的合伙人三個(gè)人,租了一個(gè)四人的小辦公室,還多出一個(gè)工位。

三個(gè)人都是學(xué)術(shù)圈出身,余下的那個(gè)工位自然是要留給一個(gè)有做模擬芯片經(jīng)驗(yàn)的專業(yè)人士,后來(lái)他們花了很大精力才請(qǐng)來(lái)一位具有15年模擬芯片研發(fā)經(jīng)驗(yàn)的老兵作為知存科技如今的模擬芯片研發(fā)負(fù)責(zé)人。

于是,到2018年春節(jié),知存的小團(tuán)隊(duì)成功漲到4個(gè)人。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

創(chuàng)業(yè)期間的節(jié)奏比學(xué)術(shù)研究期間快得多,企業(yè)規(guī)劃、運(yùn)營(yíng)管理和產(chǎn)業(yè)經(jīng)驗(yàn)都要經(jīng)持續(xù)學(xué)習(xí)和積累。從創(chuàng)業(yè)至今,王紹迪每周上班時(shí)間超過100小時(shí),有一周甚至只睡了不足28小時(shí)。

因?yàn)樵趯W(xué)術(shù)研究期間,郭昕婕幾乎踩過各種芯片設(shè)計(jì)的坑,這也使得知存在成立后的短短5個(gè)月內(nèi)就快速流片。
2018年初,知存的擴(kuò)張速度堪比“龜速”,3月5個(gè)人,4月6個(gè)人,5月7個(gè)人,流片前才終于突破個(gè)位數(shù),達(dá)到10個(gè)人。熬過缺乏資金的創(chuàng)業(yè)初期,團(tuán)隊(duì)擴(kuò)張速度逐步加快。

當(dāng)前知存已經(jīng)凝聚了一支經(jīng)驗(yàn)和能力兼?zhèn)涞?5人團(tuán)隊(duì),其中,模擬芯片設(shè)計(jì)團(tuán)隊(duì)人數(shù)也增至近11人,團(tuán)隊(duì)平均工作經(jīng)驗(yàn)達(dá)9年。此外,王紹迪還表示,今年知存科技還將再招5人左右。

融資方面,知存科技已于2018年1月獲得啟迪之星等投資的天使輪融資,同年12月獲訊飛領(lǐng)投的天使+輪融資,今年8月獲得近億元A輪融資,由中芯聚源領(lǐng)投,普華資本、招商局創(chuàng)投、三峽鑫泰、科訊創(chuàng)投、燕緣雄芯跟投。

專利方面,知存科技申請(qǐng)了40多項(xiàng)專利,并購(gòu)買了郭昕婕早期在國(guó)外研發(fā)期間所發(fā)明的專利授權(quán)。

顛覆傳統(tǒng)芯片架構(gòu),用閃存做AI推理,這家創(chuàng)企要造不一樣的語(yǔ)音芯片

知存的核心產(chǎn)品MemCore001是基于NOR Flash存算一體架構(gòu)的嵌入式智能語(yǔ)音芯片,主要應(yīng)用于低功耗、低成本的端側(cè)語(yǔ)音識(shí)別,支持8-bit DNN、LSTM、TDNN等多種常用網(wǎng)絡(luò),支持可變運(yùn)算和參數(shù)精度。

據(jù)王紹迪介紹,算力依據(jù)應(yīng)用需求而定,市面上的芯片算力從1Mops到100Gops都有。知存即將發(fā)布3款存算一體芯片產(chǎn)品,功耗和成本和市面上10Mops的芯片相當(dāng),算力為10Gops。

相比當(dāng)下基于馮·諾依曼架構(gòu)的AI芯片,知存科技的存算一體芯片能將運(yùn)算效率提升20-50倍,現(xiàn)有運(yùn)算效率達(dá)15TOPS/W,成本也比常規(guī)AI芯片降低30-90%,針對(duì)不同應(yīng)用的成本在幾十美分到幾美元。

五、泡沫化很正常,落地難只是暫時(shí)現(xiàn)象

隨著AI需求的演進(jìn),知存會(huì)對(duì)芯片內(nèi)部相應(yīng)優(yōu)化,通過調(diào)整設(shè)計(jì)架構(gòu),使其更好地支持現(xiàn)有網(wǎng)絡(luò)支持,可配置性更多,對(duì)新型網(wǎng)絡(luò)效率更高,整體芯片面積也變得更小。

存算一體畢竟是一個(gè)創(chuàng)新芯片架構(gòu),缺乏成熟的EDA工具、測(cè)試工具和應(yīng)用層適配軟件,量產(chǎn)步驟還夠不成熟。不同于傳統(tǒng)芯片直接將量產(chǎn)步驟交由晶圓廠來(lái)完成,存算一體芯片的量產(chǎn)步驟需要芯片設(shè)計(jì)公司和晶圓廠一起來(lái)探索和建立。
在語(yǔ)音芯片落地后,未來(lái),知存還計(jì)劃研發(fā)低成本、低功耗的視覺處理芯片。

而王紹迪他們之所以暫不考慮云端,是因?yàn)檐浖DK開發(fā)的投入太大,這對(duì)一家初創(chuàng)公司來(lái)說將是很大負(fù)擔(dān)。Flash存在讀寫偏慢的缺點(diǎn),如果以后有更出色且成熟的存儲(chǔ)器,他們也會(huì)考慮用其替代Flash。

對(duì)于AI產(chǎn)業(yè)熱議的泡沫化以及AI芯片落地難、量產(chǎn)難等問題,王紹迪也分享了他的觀察和思考。

他認(rèn)為,像大多數(shù)快速發(fā)展的行業(yè)一樣,AI也有泡沫,但這并非因?yàn)锳I沒有價(jià)值,而是因?yàn)檫€沒找到好的商業(yè)模式,當(dāng)前的授權(quán)等商業(yè)模式利潤(rùn)不高。

在他看來(lái),AI芯片落地難只是暫時(shí)的,AI芯片的作用是幫助AI更好的落地。從過去的發(fā)展來(lái)看,提供更高的算力可以幫助更多的算法落地到應(yīng)用,降低成本和功耗可以幫助AI拓展更多的應(yīng)用場(chǎng)景。因此做算力更大的AI芯片和更低成本的AI芯片都可以幫助AI落地。當(dāng)前AI芯片落地難因?yàn)锳I應(yīng)用還不是一個(gè)成熟的市場(chǎng),沒有成熟的產(chǎn)品形態(tài)。AI芯片和AI一樣都在摸索中發(fā)展,逐漸落地更多的應(yīng)用。

而關(guān)于AI芯片量產(chǎn)難的問題,王紹迪認(rèn)為有多個(gè)原因。

一是AI產(chǎn)品新,產(chǎn)品需求和功能一直在變化,沒有成熟的產(chǎn)品形態(tài)。很多芯片做了很長(zhǎng)時(shí)間design in,遇到產(chǎn)品需求突然變化,造成了芯片無(wú)法量產(chǎn)。這也是因?yàn)锳I產(chǎn)品和算法更新?lián)Q代快所導(dǎo)致的,選錯(cuò)了應(yīng)用或者功能設(shè)計(jì)錯(cuò)了的芯片沒法量產(chǎn)。

二是某些大算力AI芯片需要很好的算法適用性,研發(fā)周期長(zhǎng)投入大從業(yè)人才少。

三是新型架構(gòu)的AI芯片,像是存算一體芯片,沒有成熟的方案可以采用,需要開發(fā)新的量產(chǎn)方案。

結(jié)語(yǔ)

相比那些在芯片行業(yè)摸爬滾打多年的老兵,王紹迪等從學(xué)術(shù)圈走出的創(chuàng)業(yè)者們相對(duì)缺乏創(chuàng)業(yè)經(jīng)驗(yàn)和工程經(jīng)驗(yàn)。尤其是在開辟一條蹊徑之時(shí),可能需經(jīng)過各種試錯(cuò)、磨合、迷茫和思路轉(zhuǎn)換。

但同時(shí),他們也擁有更加蓬勃的朝氣,堅(jiān)定而無(wú)畏地追求創(chuàng)新,勇于冒險(xiǎn),敢于跳進(jìn)造芯的洪流之中,注入一抹不一樣的色彩。

誠(chéng)然,云端市場(chǎng)巨頭環(huán)伺,終端市場(chǎng)亦是強(qiáng)手如林,留給創(chuàng)企的機(jī)會(huì)有,真正做到突圍也很難。AI芯片產(chǎn)業(yè)的規(guī)律還需經(jīng)歷漫長(zhǎng)的考驗(yàn),而更多帶著各類創(chuàng)業(yè)者的涌入,勢(shì)必會(huì)為整個(gè)產(chǎn)業(yè)創(chuàng)造更多的可能性。

在政府、投資方、孵化器等機(jī)構(gòu)的幫助下,也許下一個(gè)破局者已經(jīng)在成長(zhǎng)之中。