智東西(公眾號(hào):zhidxcom)
編輯 | 徐珊

智東西6月11日消息,近日GTIC 2021嵌入式AI創(chuàng)新峰會(huì)在北京圓滿收官!在這場(chǎng)全天座無虛席、全網(wǎng)直播觀看人數(shù)逾150萬次的產(chǎn)業(yè)峰會(huì)上,來自產(chǎn)業(yè)鏈上下游的16位大佬共聚一堂,圍繞嵌入式AI的軟硬件生態(tài)創(chuàng)新、家居AIoT、移動(dòng)機(jī)器人和工業(yè)制造產(chǎn)業(yè)4大版塊地圖,帶來了深入淺出的分享。

成立于2015年的圖漾科技是我國(guó)3D機(jī)器視覺領(lǐng)域的新銳玩家。圖漾科技創(chuàng)始人&CEO費(fèi)浙平以《3D機(jī)器視覺在工業(yè)制造領(lǐng)域的前景與實(shí)踐》為題,分享了圖漾科技在3D機(jī)器視覺發(fā)展的幾點(diǎn)思考。

圖漾科技費(fèi)浙平:解讀3D機(jī)器視覺商用現(xiàn)狀,嵌入式AI成為破壁關(guān)鍵點(diǎn)

▲圖漾科技創(chuàng)始人&CEO費(fèi)浙平

基于過去的技術(shù)積累和市場(chǎng)經(jīng)驗(yàn),費(fèi)浙平對(duì)行業(yè)進(jìn)行了一些分析和展望。從實(shí)際落地來看,他認(rèn)為3D機(jī)器視覺是2D機(jī)器視覺的補(bǔ)充和延伸,更多的價(jià)值在于完成2D機(jī)器視覺做不到或做不好的任務(wù)。

在他看來,3D機(jī)器視覺在消費(fèi)、安防、工業(yè)和商業(yè)領(lǐng)域都有許多應(yīng)用方向,尤其是商業(yè)領(lǐng)域的應(yīng)用潛力巨大。與此同時(shí),費(fèi)浙平還分享了圖漾科技對(duì)當(dāng)下3D機(jī)器視覺市場(chǎng)現(xiàn)狀的內(nèi)部分析數(shù)據(jù),涉及工業(yè)自動(dòng)化、工業(yè)檢測(cè)、物流科技和商業(yè)應(yīng)用四大垂直領(lǐng)域。

其中,工業(yè)檢測(cè)是現(xiàn)階段行業(yè)3D機(jī)器視覺滲透率最高的領(lǐng)域,但也意味著它的增長(zhǎng)空間較少;3D機(jī)器視覺在物流科技領(lǐng)域還有很大發(fā)展?jié)摿?,至少?00倍以上的增長(zhǎng)空間;而在商業(yè)應(yīng)用場(chǎng)景,3D機(jī)器視覺甚至能達(dá)到1000倍的增長(zhǎng)空間。

費(fèi)浙平認(rèn)為,現(xiàn)在3D機(jī)器視覺還處于創(chuàng)新產(chǎn)品的創(chuàng)新應(yīng)用落地階段,擁有100倍的成長(zhǎng)空間,但還面臨著傳感器、算法軟件、算力單元三大方向的發(fā)展挑戰(zhàn),而算力單元的最大挑戰(zhàn)是成本。

以下是費(fèi)浙平演講內(nèi)容整理:

一、從消費(fèi)、安防到工業(yè)領(lǐng)域,3D機(jī)器視覺的應(yīng)用現(xiàn)狀

3D機(jī)器視覺是一個(gè)趨勢(shì)性的技術(shù),是指在2D的信息之外再引入幾何信息,可以用一個(gè)簡(jiǎn)單的表述RGB+XYZ。

費(fèi)浙平認(rèn)為,從真正實(shí)際的價(jià)值或者可以落地的地方來看,3D機(jī)器視覺一定只是2D機(jī)器視覺的延伸和補(bǔ)充。

相比2D機(jī)器視覺的便宜與穩(wěn)定,3D機(jī)器視覺的價(jià)值在于完成2D機(jī)器視覺難以達(dá)到的地方,如更強(qiáng)大的識(shí)別分析能力。3D機(jī)器視覺在消費(fèi)、智能安防、工業(yè)和商業(yè)里面都有大量應(yīng)用方向,商業(yè)領(lǐng)域的3D機(jī)器視覺應(yīng)用甚至能超過工業(yè)市場(chǎng)成為一個(gè)新的巨大藍(lán)海市場(chǎng)。

在消費(fèi)領(lǐng)域里,3D機(jī)器視覺的應(yīng)用的數(shù)量仍是少數(shù),盡管有FaceID這樣單一容量比較大的應(yīng)用,但是從應(yīng)用場(chǎng)景的豐富程度來看并不普及,而FaceID也不屬于機(jī)器視覺的行業(yè),在這里不做討論。

目前在安防領(lǐng)域里面,3D機(jī)器視覺更多停留在概念上,還沒有成為可以大規(guī)模普及化應(yīng)用的場(chǎng)景。從技術(shù)的價(jià)值來看待,3D機(jī)器視覺對(duì)人做一些行為分析動(dòng)作理解,將會(huì)是智能安防技術(shù)領(lǐng)域皇冠上的明珠,是最難且最具有價(jià)值的事情,但是從技術(shù)角度來看,目前的硬件與軟件技術(shù)都不夠成熟。

3D機(jī)器視覺在工業(yè)領(lǐng)域的應(yīng)用,由于工業(yè)的場(chǎng)景非常多且分散,單一的工業(yè)場(chǎng)景體量無法像消費(fèi)領(lǐng)域的單品有幾十萬、上百萬甚至上千萬的數(shù)量。但是,在工業(yè)領(lǐng)域里面,可以找到上萬甚至十萬數(shù)量級(jí)的場(chǎng)景,可應(yīng)用的數(shù)量非常多,總量加起來很可能有上百萬、上千萬。如今,圖漾科技將工業(yè)領(lǐng)域作為重點(diǎn)探索的目標(biāo)場(chǎng)景。

至于商業(yè),很多工業(yè)領(lǐng)域的機(jī)器人技術(shù)和視覺技術(shù)可以走出工廠,商場(chǎng),飯店,酒店甚至家庭應(yīng)用,3D機(jī)器視覺在這個(gè)方向的應(yīng)用具有非常大的想象空間,會(huì)逐漸出現(xiàn)很多新的機(jī)會(huì)與市場(chǎng)。

二、當(dāng)前出貨量達(dá)萬級(jí),物流應(yīng)用增長(zhǎng)空間超百倍

從圖漾的角度,費(fèi)浙平分享了今天3D機(jī)器視覺市場(chǎng)應(yīng)用的情況。

圖漾科技內(nèi)部對(duì)3D機(jī)器視覺市場(chǎng)應(yīng)用的分析,包含了工業(yè)自動(dòng)化、工業(yè)檢測(cè)、物流科技和商業(yè)應(yīng)用。

費(fèi)浙平認(rèn)為,盡管物流科技在功能上是屬于工業(yè)自動(dòng)化,但由于物流科技本身的產(chǎn)品形態(tài)以及巨大的市場(chǎng)空間,它值得從工業(yè)自動(dòng)化劃分出來進(jìn)行特殊考察。

圖漾科技費(fèi)浙平:解讀3D機(jī)器視覺商用現(xiàn)狀,嵌入式AI成為破壁關(guān)鍵點(diǎn)

▲圖漾科技的內(nèi)部市場(chǎng)分析

如圖所示,在3D機(jī)器視覺已有規(guī)?;涞氐墓I(yè)自動(dòng)化、工業(yè)檢測(cè)、物流科技、商業(yè)應(yīng)用四大垂直系統(tǒng)市場(chǎng),圖漾科技統(tǒng)計(jì)了2020年年度出貨量以及市場(chǎng)空間,說明一下,表格中的數(shù)據(jù)做了一定的模糊化取整處理。

圖中的價(jià)值統(tǒng)計(jì)是指核心零部件統(tǒng)計(jì)口徑,只計(jì)算了相機(jī)和核心配套軟件,不包括設(shè)備和系統(tǒng)集成的市場(chǎng)價(jià)值。這個(gè)可能跟市場(chǎng)上有些數(shù)據(jù)的統(tǒng)計(jì)口徑不太一致。

目前3D機(jī)器視覺仍是一個(gè)全新的技術(shù)以及產(chǎn)品在新的場(chǎng)景落地。圖漾科技取得的成果,像在海外市場(chǎng)有較大的出貨量,其價(jià)值并不在于進(jìn)口替代,而是新產(chǎn)品和新技術(shù)在新場(chǎng)景里面的全新落地,是一個(gè)全新的增量市場(chǎng)。

3D機(jī)器視覺的市場(chǎng)空間目前看來是幾十K左右,與2D的工業(yè)相機(jī)大幾百K的出貨量相比,只有5%——10%。費(fèi)浙平認(rèn)為,從增長(zhǎng)潛力和增長(zhǎng)空間來,在五年左右,工業(yè)自動(dòng)化會(huì)有不少于50倍的增長(zhǎng)空間。工業(yè)檢測(cè)是目前在行業(yè)滲透率上來講相對(duì)比較高的一個(gè)機(jī)器視覺落地應(yīng)用,但也意味著它的增長(zhǎng)空間小。3D機(jī)器視覺在物流科技領(lǐng)域是非常創(chuàng)新的應(yīng)用落地,物流具有相當(dāng)大的市場(chǎng),對(duì)3D機(jī)器視覺而言是一個(gè)巨大的金礦,至少有一百倍以上的增長(zhǎng)空間。

在工業(yè)自動(dòng)化領(lǐng)域,與想象中既好看又有用的應(yīng)用場(chǎng)景不同,早期能夠落地的地方,基本是不太好看但具備真正的使用價(jià)值。如機(jī)器人配合3D機(jī)器視覺,對(duì)于重物和大件物體進(jìn)行搬運(yùn)、抓取、分撿這些動(dòng)作。

面對(duì)物理世界里面的對(duì)象物體,可能有不同的形狀、不同的位置,甚至散亂的放置情況,對(duì)于這些物體的分割、定位以及測(cè)量需要用到3D機(jī)器視覺。在3D機(jī)器視覺的引導(dǎo)下,機(jī)器人完成看似簡(jiǎn)單的分撿抓取動(dòng)作,這其中的使用價(jià)值非常大,在食品飲料、汽車配件、工程機(jī)械行業(yè)里具有較多的場(chǎng)景應(yīng)用。

事實(shí)上,看似高大上的智能機(jī)器人,以及有些AI技術(shù)加持的方案真正落地的地方,需要去面對(duì)和服務(wù)的客戶其使用場(chǎng)景有很多是較惡劣的環(huán)境,如煤礦、工程機(jī)械等。

圖漾科技費(fèi)浙平:解讀3D機(jī)器視覺商用現(xiàn)狀,嵌入式AI成為破壁關(guān)鍵點(diǎn)

▲較惡劣的工況條件

如視頻里大家看到的是一個(gè)國(guó)內(nèi)頂尖白色家電的生產(chǎn)線和物流行業(yè)的一個(gè)自動(dòng)化叉車場(chǎng)景。大家可以看到里面的工況條件是比較惡劣的,對(duì)于機(jī)器人和視覺產(chǎn)品的魯棒性要求就特別高,而不是簡(jiǎn)單的視覺和算法識(shí)別能力而已。

再說說物流行業(yè),我國(guó)物流行業(yè)占GDP的比例占到16%、17%、18%左右,物流行業(yè)是占國(guó)家GDP產(chǎn)值最大的行業(yè)。費(fèi)浙平認(rèn)為,自動(dòng)化技術(shù)、智能視覺技術(shù)、AI技術(shù)最大的價(jià)值就在于,能夠幫助行業(yè)降低營(yíng)運(yùn)成本,增加生產(chǎn)效率。

物流行業(yè)的客戶都有一個(gè)共同的目標(biāo)——少人化。他們追求的目標(biāo)并不是是無人化黑燈工廠,而是減少10%的勞動(dòng)力甚至50%的勞動(dòng)力。達(dá)到這樣的目標(biāo),就是一個(gè)典型的雙贏,客戶會(huì)愿意把節(jié)省下來的成本分享給提供相應(yīng)技術(shù)升級(jí)產(chǎn)品的供應(yīng)商。圖漾幫助行業(yè)客戶實(shí)現(xiàn)降本增效,一定能在其中實(shí)現(xiàn)圖漾應(yīng)有的價(jià)值。少人化是圖漾在物流行業(yè)以及工業(yè)場(chǎng)景里面里最大的目標(biāo)和機(jī)會(huì)所在。

機(jī)器人和智能視覺在商業(yè)里面的3D機(jī)器視覺應(yīng)用,是把原來在工廠生產(chǎn)車間里面的設(shè)備或者技術(shù)經(jīng)過跟應(yīng)用場(chǎng)景結(jié)合移植包裝優(yōu)化之后,成為適合商業(yè)化場(chǎng)景應(yīng)用的設(shè)備,典型的例子比如包含像咖啡店、餐館甚至酒店的一些工作任務(wù)。

商業(yè)場(chǎng)景里面的3D機(jī)器視覺應(yīng)用,與工業(yè)場(chǎng)景無論在視覺還是機(jī)器人形態(tài)上面可能會(huì)有所不同,比如機(jī)器人的形態(tài)可能不再是工業(yè)機(jī)器人或人形機(jī)器人。

協(xié)作機(jī)器人可能是早期落地機(jī)器人的一種形態(tài),比如六軸機(jī)器人,雖然工作距離不遠(yuǎn),雖然力氣不大,但是它的動(dòng)作非常靈活,可以替代人工在視覺識(shí)別和引導(dǎo)下面實(shí)現(xiàn)原來需要人來執(zhí)行的一些動(dòng)作。

協(xié)作機(jī)器人的配合需要與之相匹配的3D機(jī)器視覺技術(shù),將來在商業(yè)化的場(chǎng)景里面應(yīng)用空間會(huì)非常非常大,甚至不排除將來每個(gè)家庭里擁有能夠幫助完成一些特定家務(wù)動(dòng)作的機(jī)器人。從餐飲、酒店、商場(chǎng)、一直到家庭都有商業(yè)化的智能視覺加上自動(dòng)化機(jī)器人的應(yīng)用需求。

基于這樣的場(chǎng)景假設(shè),也許可以理解之前提到的商業(yè)3D機(jī)器視覺有一千倍的增長(zhǎng)空間,這個(gè)基數(shù)將來可能會(huì)是每多少人擁有一套機(jī)器人系統(tǒng)。

費(fèi)浙平認(rèn)為,盡管3D機(jī)器視覺還只是一個(gè)小小的蛋糕,但會(huì)有一百倍以上的增長(zhǎng)空間。他提到,今天成熟的技術(shù)和產(chǎn)品,有更多的場(chǎng)景可以復(fù)制,比如工業(yè)自動(dòng)化領(lǐng)域落地最多的目前是食品飲料、工程機(jī)械、汽車配件市場(chǎng),后續(xù)還有大量的白色家電、黑色家電、家具等各行各業(yè)應(yīng)用。這類場(chǎng)景所需的技術(shù)相對(duì)成熟,但是場(chǎng)景需要擴(kuò)展的。

另外一個(gè)緯度,以前面提到的商業(yè)場(chǎng)景和智能安防為例,它們?cè)诩夹g(shù)上還不夠成熟,但是通過技術(shù)持續(xù)不斷進(jìn)步,就能夠解鎖更多的場(chǎng)景產(chǎn)生。

圖漾科技費(fèi)浙平:解讀3D機(jī)器視覺商用現(xiàn)狀,嵌入式AI成為破壁關(guān)鍵點(diǎn)

▲一百倍成長(zhǎng)空間

所以如圖中所示看著兩個(gè)維度,橫向有十倍以上的增長(zhǎng)空間,縱向也有十倍以上的增長(zhǎng)空間,所以,一百倍的成長(zhǎng)空間并不夸張。

三、加速應(yīng)用普及,需重點(diǎn)考察三大挑戰(zhàn)

3D機(jī)器視覺的挑戰(zhàn)重點(diǎn)考察的三個(gè)部分:第一,傳感器,就是圖漾做的3D工業(yè)相機(jī);第二,軟件和算法,3D機(jī)器視覺結(jié)合深度學(xué)習(xí)是較為前沿的領(lǐng)域;第三,算力單元,算力單元要解決的最大問題在于成本,如今的算力單元如果不計(jì)成本地連接云、服務(wù)器、以及獨(dú)立顯卡,3D機(jī)器視覺需要的算力基本能運(yùn)行,但基于現(xiàn)實(shí)出發(fā),這顯然不能支撐3D機(jī)器視覺應(yīng)用大規(guī)模普及化落地。

談及算力單元,費(fèi)浙平首先分析了3D機(jī)器視覺的系統(tǒng)架構(gòu),最前端的傳感器就是2D的圖像傳感器,無論用紅外光作為輸入還是RGB輸入,2D數(shù)據(jù)進(jìn)來結(jié)合一些特定的光學(xué)方法得到特殊的圖像,通過算法計(jì)算得出3D深度數(shù)據(jù)。

由3D相機(jī)完成的從多路2D數(shù)據(jù)算出3D距離和尺寸信息,這部分的計(jì)算和算法實(shí)現(xiàn)是比較標(biāo)準(zhǔn)化的算法套路,它的算力單元基本不會(huì)是GPU,也不會(huì)是CPU,圖漾更加偏向用FPGA。當(dāng)應(yīng)用算法特別前沿,只有少數(shù)特殊客戶愿意支付特別高的成本,不計(jì)成本實(shí)現(xiàn)最高精度的設(shè)備和產(chǎn)品,圖漾才會(huì)用到GPU,做普及化的標(biāo)準(zhǔn)產(chǎn)品的話,F(xiàn)PGA是非常舒服也是性價(jià)比非常高的算力承載單元。

當(dāng)基于3D數(shù)據(jù)和2D數(shù)據(jù)做具體應(yīng)用的時(shí)候,會(huì)涉及很多上層的應(yīng)用算法,其中既有傳統(tǒng)算法,也有大量的機(jī)器人學(xué)習(xí)應(yīng)用,目前很多場(chǎng)景采用機(jī)器學(xué)習(xí)的方法效果很好。這些上層應(yīng)用軟件的算力承載單元一定是通用可編程的,如GPU、CPU,不太可能是FPGA。

圖漾科技費(fèi)浙平:解讀3D機(jī)器視覺商用現(xiàn)狀,嵌入式AI成為破壁關(guān)鍵點(diǎn)

▲數(shù)據(jù)流動(dòng)路徑

通過數(shù)據(jù)流動(dòng)的路徑來看,不同的數(shù)據(jù)轉(zhuǎn)換過程需要不同的芯片。首先,從物理世界得到2D信息,一定是圖像傳感器(Image Sensor),這是2D點(diǎn)數(shù)據(jù)的獲取。

應(yīng)用3D數(shù)據(jù)做應(yīng)用場(chǎng)景一定是應(yīng)用處理器(Application Processors)承擔(dān)的,計(jì)算之后,如果是工業(yè)檢測(cè)類的應(yīng)用,任務(wù)就已完成,部分其他場(chǎng)景如AR/VR或是電視等應(yīng)用,還需要將3D的模型和數(shù)據(jù)在2D顯示平面上輸出。這個(gè)3D轉(zhuǎn)2D的過程是由GPU完成的。

圖漾科技一直致力于實(shí)現(xiàn)從2D數(shù)據(jù)又快又好地算出3D數(shù)據(jù)的任務(wù),也就是Depth Engine這個(gè)環(huán)節(jié),從架構(gòu)上來看,這正好是GPU的一種對(duì)稱。GPU實(shí)現(xiàn)的功能就是3D到2D,Depth Engine做的事情是從2D到3D。從2D到3D的過程,基本是由3D相機(jī)在本地完成,為了達(dá)到低延時(shí)、高幀率和速度的目標(biāo),3D工業(yè)相機(jī)應(yīng)該使用專用硬件計(jì)算單元。

在承載應(yīng)用層算法的應(yīng)用處理器這個(gè)算力單元,3D機(jī)器視覺對(duì)嵌入式的AI有可預(yù)見的強(qiáng)烈需求。圖漾科技從某種程度上更像一個(gè)系統(tǒng)產(chǎn)品設(shè)計(jì)者,希望使用業(yè)界里面性能夠用、性價(jià)比最高的嵌入式芯片,來完成最有競(jìng)爭(zhēng)力和性價(jià)比的3D相機(jī)產(chǎn)品。

目前AI的計(jì)算成本太高是一個(gè)痛點(diǎn)。由于如今的高階算法,尤其跟深度學(xué)習(xí)相關(guān)的算法,太多的軟件資源建立在英偉達(dá)的CUDA生態(tài)上。雖然目前的多數(shù)CPU都有浮點(diǎn)、DSP的向量擴(kuò)展,但是對(duì)支持機(jī)器學(xué)習(xí)算力仍然不夠。

目前圖漾科技并不需要云計(jì)算之類的高要求算力,但很希望能在本地實(shí)現(xiàn)合理規(guī)模的主流NN網(wǎng)絡(luò),這就需要嵌入式AI芯片,這類芯片中應(yīng)該有合適規(guī)模的嵌入式CPU、GPU,有算力合適、價(jià)格合適的NN加速器,以集成的SoC形式呈現(xiàn)。

費(fèi)浙平認(rèn)為,嵌入式AI的出現(xiàn),對(duì)于行業(yè)帶動(dòng),無論工業(yè)自動(dòng)化、工業(yè)測(cè)量、物流科技、商業(yè)場(chǎng)景的3D機(jī)器視覺落地都會(huì)是極大的推動(dòng)。

以上是費(fèi)浙平演講內(nèi)容的完整整理。