智東西(公眾號(hào):zhidxcom)
文 | 白鴿
3月9日,由智東西主辦,極果和AWE聯(lián)合舉辦的中國(guó)首場(chǎng)AI芯片峰會(huì)在上海浦東成功舉辦。本次大會(huì)共吸引近萬(wàn)名觀眾參加,到場(chǎng)人數(shù)比預(yù)計(jì)翻了3倍。即使是下午場(chǎng),依然爆滿,有的觀眾寧愿站著也要聽(tīng)完全場(chǎng)。在大會(huì)現(xiàn)場(chǎng),近40位人工智能及AI芯片業(yè)界翹楚共聚一堂,系統(tǒng)地探討了AI芯片在2018年的技術(shù)前景和產(chǎn)業(yè)趨勢(shì)。
在特邀演講嘉賓中,英特爾中國(guó)研究院認(rèn)知計(jì)算實(shí)驗(yàn)室主任陳玉榮博士以《發(fā)掘AI芯片能力 提升認(rèn)知計(jì)算新高度》為主題進(jìn)行演講,系統(tǒng)闡述英特爾在認(rèn)知計(jì)算、情感識(shí)別、人臉?lè)治黾夹g(shù)以及軟硬件結(jié)合等方面的成果。以下是由智東西為您整理的陳玉榮博士大會(huì)演講干貨。
一、認(rèn)知計(jì)算
開(kāi)場(chǎng),陳玉榮博士就詳細(xì)的闡述了何為認(rèn)知計(jì)算。他表示,認(rèn)知計(jì)算是一套計(jì)算機(jī)技術(shù),用以模擬人類(lèi)感知、智能和解決問(wèn)題的能力。
認(rèn)知計(jì)算如金字塔結(jié)構(gòu)一樣,具有多個(gè)層次。其最底層則是用過(guò)各種傳感器進(jìn)行感知,如麥克風(fēng)、攝像頭以及其它傳感器等,然后基于對(duì)感知數(shù)據(jù)的識(shí)別,包括對(duì)聲音、語(yǔ)音等音頻信號(hào)的識(shí)別;對(duì)物體、手勢(shì)、人臉等視覺(jué)的識(shí)別;以及其他的傳感信號(hào),如位置、生物特征等的識(shí)別。
在識(shí)別基礎(chǔ)上就是對(duì)多模態(tài)語(yǔ)義的理解,包括對(duì)各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的理解,如文本、語(yǔ)音、視覺(jué)、情感等。最后,到最頂層才是基于理解的認(rèn)知,包括對(duì)上下文語(yǔ)境的認(rèn)知,以及對(duì)自然人機(jī)交互、計(jì)劃與行動(dòng)、類(lèi)人記憶、適應(yīng)用戶的需求和愿望等的認(rèn)知。
事實(shí)上,認(rèn)知計(jì)算的發(fā)展和應(yīng)用是一個(gè)過(guò)程,它是機(jī)器學(xué)習(xí)算法和傳統(tǒng)知識(shí)工程擴(kuò)展結(jié)合的結(jié)果,其總體目標(biāo)是提高個(gè)人和組織的生產(chǎn)力、創(chuàng)造力。
二、深度學(xué)習(xí)的部署難題及解決方案
近年來(lái),認(rèn)知計(jì)算所取得的突破仍停留在識(shí)別的層次上。得益于深度學(xué)習(xí)的快速發(fā)展,目前計(jì)算機(jī)已經(jīng)能夠在圖像識(shí)別,語(yǔ)音識(shí)別等領(lǐng)域達(dá)到或超過(guò)人的平均水平。
深度學(xué)習(xí)也被廣泛應(yīng)用到其他的領(lǐng)域,如醫(yī)療診斷里的腫瘤監(jiān)測(cè)、投資分析里面的文檔分類(lèi)、智能交互的語(yǔ)音助手、工業(yè)應(yīng)用里的產(chǎn)品缺陷監(jiān)測(cè)、生物工程當(dāng)中的基因測(cè)序等。但深度學(xué)習(xí)也存在挑戰(zhàn),如需要用大量標(biāo)注數(shù)據(jù)、計(jì)算資源來(lái)進(jìn)行訓(xùn)練,這是深度學(xué)習(xí)的訓(xùn)練挑戰(zhàn),但陳玉榮博士所要闡述的則是深度學(xué)習(xí)的部署挑戰(zhàn)。
以視覺(jué)識(shí)別為例,為了提高識(shí)別準(zhǔn)確率,目前主流的設(shè)計(jì)方法有兩種,其一是將卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的越來(lái)越深。其二,卷積神經(jīng)網(wǎng)絡(luò)可以設(shè)計(jì)的不那么深,但一定要足夠?qū)?。使用這兩種方法就會(huì)帶來(lái)一個(gè)問(wèn)題,即目前主流的模型參數(shù)通常是上千萬(wàn)、上億甚至更多,這就導(dǎo)致計(jì)算空間、存儲(chǔ)空間的復(fù)雜性非常大,這樣就很難將其部署在計(jì)算和存儲(chǔ)資源受限的嵌入式、邊緣設(shè)備上。
為了解決上述挑戰(zhàn),除了進(jìn)行有針對(duì)性的高效網(wǎng)絡(luò)設(shè)計(jì)以外,另一個(gè)主要的辦法就是進(jìn)行DNN模型壓縮。
英特爾在此方向上提出了一套低精度的深度壓縮解決方案,它可以將DNN的權(quán)重參數(shù)和激活值表述成低精度的二進(jìn)制表示,并且,可以實(shí)現(xiàn)百倍級(jí)的無(wú)損壓縮,這樣就為深度學(xué)習(xí)推斷在硬件和軟件上的加速奠定了基礎(chǔ)。
該解決方案共包括了三個(gè)關(guān)鍵模塊:
1、優(yōu)化DNN結(jié)構(gòu)的動(dòng)態(tài)網(wǎng)絡(luò)手術(shù)算法DNS。它可以將任意的DNN模型變成疏松的DNN模型,但是不會(huì)損失模型的識(shí)別準(zhǔn)確率。
2.漸進(jìn)網(wǎng)絡(luò)量化技術(shù)INQ,它可以將給定的DNN模型權(quán)重參數(shù)變成低精度的二進(jìn)制表示,同樣保證不會(huì)降低模型的識(shí)別準(zhǔn)確率。
3.多尺度的編碼量化MLQ,它可以把DNN模型的激活值變成給定位框的低精度表示,同樣不會(huì)降低模型的識(shí)別準(zhǔn)確率。
通過(guò)把這三個(gè)技術(shù)結(jié)合起來(lái),就形成了一套完整的、低精度的深度壓縮解決方案。
接下來(lái),陳玉榮博士詳細(xì)闡述了INQ技術(shù)原理。他表示,INQ技術(shù)通過(guò)三個(gè)創(chuàng)新的操作,即參數(shù)劃分、分組量化、重訓(xùn)練,從而使得整個(gè)量化過(guò)程變成一個(gè)漸進(jìn)式的操作過(guò)程,同時(shí)保證不會(huì)降低模型的識(shí)別準(zhǔn)確率。INQ是第一個(gè)無(wú)損的DNN量化壓縮的解決方案,它沒(méi)有對(duì)任何網(wǎng)絡(luò)模型類(lèi)型進(jìn)行假設(shè),這意味著,它不僅可以用在卷積網(wǎng)絡(luò)模型CNN上,也還可以用在其他網(wǎng)絡(luò)模型上。
此外,因其是二進(jìn)制表示,所以通過(guò)INQ技術(shù)與量化的模型可以使大部分的乘法操作變成簡(jiǎn)單的一位操作,同時(shí)采用專門(mén)的硬件就可以實(shí)現(xiàn)很高的加速。另外,量化技術(shù)是基于預(yù)訓(xùn)練模型的,也就是說(shuō)不需要從頭開(kāi)始訓(xùn)練,那么這樣量化的效率很高。
通過(guò)對(duì)主流的DNN模型進(jìn)行實(shí)驗(yàn),在5比特量化的結(jié)果顯示其量化模型的準(zhǔn)確率不但沒(méi)有降低反而有所增加,在超低精度,也就是在2/3比特的量化結(jié)果也顯示其識(shí)別準(zhǔn)確率非常接近全精度的參考模型。
三、促進(jìn)深度學(xué)習(xí)推斷硬件加速
針對(duì)深度學(xué)習(xí),英特爾提供了多種技術(shù)解決方案,涵蓋了從數(shù)據(jù)中心到邊緣端的訓(xùn)練和推斷。
通過(guò)將低精度深度壓縮技術(shù)與英特爾的低功耗硬件結(jié)合,就可以為霧計(jì)算、邊緣計(jì)算提供深度學(xué)習(xí)推斷的硬件加速能力。例如,通過(guò)采用FPGA(現(xiàn)場(chǎng)可編程門(mén)列)友好的DNN設(shè)計(jì),并結(jié)合低精度深度壓縮技術(shù),就可以在霧計(jì)算應(yīng)用場(chǎng)景提供更快的速度、更近的延遲和能耗以及更高的吞吐量。
英特爾最新的Movidius超級(jí)功耗視覺(jué)處理單元Myriad X?VPU已經(jīng)具備了神經(jīng)網(wǎng)絡(luò)計(jì)算加速的引擎——NCE,將來(lái)把它與壓縮技術(shù)結(jié)合,就可以實(shí)現(xiàn)低精度的DNN計(jì)算。這樣,就可以進(jìn)一步提高在邊緣計(jì)算上DNN的計(jì)算速度和吞吐量。
此外,英特爾還研發(fā)出其他芯片,能夠支持?jǐn)?shù)據(jù)中心和邊緣端的各種AI計(jì)算。如英特爾凌動(dòng)、酷睿和至強(qiáng)處理器就可以對(duì)諸如機(jī)器學(xué)習(xí)、認(rèn)知推理等通用AI的算法進(jìn)行計(jì)算,如果算力不夠,還可以用FPGA進(jìn)行靈活加速。
在每種CPU的基礎(chǔ)之上,英特爾還會(huì)提供廣泛的加速器組合,以便滿足不同用戶的需求。如英特爾的Nervana神經(jīng)網(wǎng)絡(luò)處理器,就是專門(mén)針對(duì)深度學(xué)習(xí)設(shè)計(jì),它可以對(duì)高強(qiáng)度的深度學(xué)習(xí)訓(xùn)練和推斷進(jìn)行加速。另外針對(duì)視覺(jué)、語(yǔ)音、音頻以及自動(dòng)駕駛等方面的處理,還有專門(mén)的英特爾的Movidius VPU、GNA以及Mobileye EyeQ芯片來(lái)進(jìn)行專門(mén)加速。
然而,光有芯片是不夠的,為此,英特爾還提供了端到端的AI全棧解決方案。其中包括多種計(jì)算、存儲(chǔ)網(wǎng)絡(luò)硬件平臺(tái);多種軟件工具、函數(shù)庫(kù);優(yōu)化的開(kāi)源框架以及各種人工智能平臺(tái)。
未來(lái),英特爾研究院也在進(jìn)行其他領(lǐng)域的研究,包括先進(jìn)算法、神經(jīng)擬態(tài)芯片、自主系統(tǒng)、量子計(jì)算。在今年的CES上,英特爾研究院發(fā)布了代號(hào)Loihi神經(jīng)擬態(tài)芯片,以及代號(hào)為T(mén)angle Lake的具有49個(gè)量子比特的超導(dǎo)量子測(cè)試芯片。
四、軟硬協(xié)同提升對(duì)“人”的認(rèn)知
英特爾人臉?lè)治鲅芯渴加?011年,其中共經(jīng)歷了三個(gè)階段。早期采用比較傳統(tǒng)的算法實(shí)現(xiàn)了人臉檢測(cè)識(shí)別、微笑檢測(cè)、性別年齡識(shí)別等簡(jiǎn)單功能。之后結(jié)合英特爾架構(gòu)進(jìn)行軟硬件協(xié)同設(shè)計(jì),采用更高效的人臉檢測(cè)識(shí)別算法,實(shí)現(xiàn)更完整的功能,包括人臉關(guān)鍵點(diǎn)檢測(cè)跟蹤、動(dòng)態(tài)人臉表情識(shí)別等。目前,英特爾最新人臉?lè)治黾夹g(shù)則是利用了基于深度學(xué)習(xí)的高效網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。在實(shí)際應(yīng)用場(chǎng)景中,其功耗很低。
此外,英特爾還實(shí)現(xiàn)了三維人臉?lè)治觯ㄈS人臉建模和增強(qiáng)。陳玉榮博士介紹,他們研發(fā)的先進(jìn)的2D人臉技術(shù)已經(jīng)被集成到英特爾軟硬件當(dāng)中,如英特爾的集成顯卡、實(shí)感技術(shù)SDK等,進(jìn)一步提高了英特爾用戶的視覺(jué)體驗(yàn)。
在基于2D人臉?lè)治黾夹g(shù)上,英特爾還開(kāi)發(fā)了一套3D人臉?lè)治黾夹g(shù),通過(guò)該技術(shù),使用普通的筆記本電腦就可以實(shí)現(xiàn)實(shí)時(shí)的三維人臉建模、跟蹤和增強(qiáng)。在會(huì)上,陳玉榮博士演示了用參數(shù)化表示的三維人臉形變模型,它可以用來(lái)模擬任何人的相貌、臉形、表情變化等。這項(xiàng)技術(shù)可以廣泛用在虛擬現(xiàn)實(shí)、游戲場(chǎng)景當(dāng)中,從而進(jìn)一步提升用戶的沉浸式體驗(yàn)。
除對(duì)人臉?lè)治鲋猓瑢?duì)情感的計(jì)算也是認(rèn)知計(jì)算的重要方面。
對(duì)于人類(lèi)來(lái)說(shuō),聲音、表情是表達(dá)情感的最主要的方式。英特爾通過(guò)對(duì)情感識(shí)別算法的研究,在2015年就提出了基于人工定義特征的人臉表情識(shí)別算法,并基于算法研發(fā)出了一套音視頻情感解決方案。該方案在2015年舉辦的非受限的音視頻情感識(shí)別挑戰(zhàn)賽EmotiW2015中獲得第一名。
2016年,英特爾研發(fā)出了全新的深度神經(jīng)網(wǎng)絡(luò)算法HoloNet,其速度很快,在普通的CPU上運(yùn)行速度可達(dá)百幀每秒。這樣可以滿足機(jī)器人、智能家居、在線教育應(yīng)用場(chǎng)景的使用需求。2017年,英特爾又提出了全新聚合監(jiān)督的情感識(shí)別算法,該算法取得了單模型比HoloNet高5.5%的識(shí)別率,通過(guò)多模型的融合在去年比賽當(dāng)中再次獲得第一名。





