智東西(公眾號(hào):zhidxcom)
文 | Lina
在上周結(jié)束的英偉達(dá)2017 GTC(GPU技術(shù)大會(huì))上,毗鄰英偉達(dá)展位的一個(gè)顯眼位置,一個(gè)深藍(lán)色的大盒子與十分搶鏡——這就是國內(nèi)AI企業(yè)商湯科技的展位。商湯科技這次展示的內(nèi)容包括以AI圖像/視頻識(shí)別技術(shù)為主的各項(xiàng)應(yīng)用,包括智能視頻、手機(jī)影像、互聯(lián)網(wǎng)娛樂APP等。其中SensePose單目攝像頭動(dòng)作估計(jì)解決方案是首次跟大眾亮相。
展會(huì)后,智東西與數(shù)家媒體共同對(duì)商湯科技CEO徐立進(jìn)行了詳細(xì)專訪。
一、SensePose人體動(dòng)作分析與姿態(tài)換恢復(fù)
SensePose是一套單目攝像頭解決方案,用戶站在攝像頭前揮揮手臂、動(dòng)動(dòng)腦袋,面前視頻里的皮影戲小人也會(huì)跟著你的動(dòng)作而揮舞。用戶不需要佩戴傳感器就可以實(shí)現(xiàn)動(dòng)作估計(jì),降低了動(dòng)作捕捉設(shè)備的制造成本,將關(guān)鍵點(diǎn)定位在10個(gè)像素以內(nèi)的人體關(guān)節(jié),從而在視頻中實(shí)時(shí)、準(zhǔn)確地識(shí)別人體姿態(tài)。

(體驗(yàn)SensePose)
徐立表示,SensePose的技術(shù)主要還是在于視頻的實(shí)時(shí)處理與分析,傳統(tǒng)的人體動(dòng)作分析與姿態(tài)恢復(fù)需要用紅外光或結(jié)構(gòu)光,而SensePose只需要用普通的RGB攝像頭就能夠完成需求,既降低了成本,又提高了。這套技術(shù)未來可以應(yīng)用在游戲、AR等領(lǐng)域,現(xiàn)在商湯科技已經(jīng)在跟部分游戲互動(dòng)型公司洽談合作。
在去年GTC中國上,商湯還發(fā)布了一款視頻結(jié)構(gòu)化處理系統(tǒng)SenseVideo。應(yīng)用在安防監(jiān)控視頻當(dāng)中可以準(zhǔn)確地檢測(cè)到人、車和非機(jī)動(dòng)車,并且給它們打上所有的屬性和標(biāo)簽,比如人的年齡、性別、穿著等。
二、牽手英偉達(dá),輻射下游企業(yè)
除了在GTC上設(shè)立展位外,商湯科技還是英偉達(dá)的平臺(tái)戰(zhàn)略合作伙伴,兼本次GTC大會(huì)的贊助商之一。
其實(shí),雖然商湯科技目前擁有2千多塊GPU,但是對(duì)于英偉達(dá)來說還不是一個(gè)非常巨大的量級(jí)。徐立表示,商湯與英偉達(dá)更主要的是生態(tài)鏈的合作,通過商湯在英偉達(dá)的底層架構(gòu)上搭建的AI應(yīng)用,可以輻射非常多的下游企業(yè),比如使用商湯產(chǎn)品的安防、金融類客戶,都能漸漸培養(yǎng)成使用GPU的客戶,擴(kuò)大下游生態(tài)鏈。
其中一個(gè)很典型的例子就是:當(dāng)商湯科技的算法入圍中國網(wǎng)信辦視頻審查系統(tǒng)后,原始是用CPU的集群,商湯推薦使用GPU,因此網(wǎng)信辦幾乎完全重構(gòu)了一套GPU系統(tǒng)。另一方面,英偉達(dá)的新產(chǎn)品也會(huì)第一時(shí)間與商湯進(jìn)行對(duì)接,比如現(xiàn)在商湯科技的人臉識(shí)別系統(tǒng)SenseFace就跑在了英偉達(dá)今年3月剛剛推出的Jetson TX2上。(智慧城市背后的心臟 英偉達(dá)人工智能工作站Jetson TX2解讀)
三、創(chuàng)業(yè)公司一定要站在技術(shù)前沿
隨著深度學(xué)習(xí)在應(yīng)用中的顯著突破,近年來一大批人工智能初創(chuàng)企業(yè)開始逐漸涌現(xiàn)。而最近不少大型公司也在逐漸進(jìn)軍這一領(lǐng)域,為客戶提供人工智能解決方案,初創(chuàng)企業(yè)該如何和這類大公司競爭呢?
徐立認(rèn)為,大公司將會(huì)更加專注于其主營業(yè)務(wù),比如谷歌的云技術(shù)也非常優(yōu)秀,但亞馬遜的云服務(wù)仍舊占據(jù)市場主流,就是因?yàn)橹鳡I業(yè)務(wù)的重心側(cè)重不同。對(duì)于創(chuàng)業(yè)公司而言,如果全員專注于局部發(fā)力,在細(xì)分領(lǐng)域其實(shí)是“以多打少”的。
因此,對(duì)于技術(shù)創(chuàng)業(yè)型公司而言,公司一定要沖在該細(xì)分領(lǐng)域的技術(shù)最前沿,才能在市場競爭中占有優(yōu)勢(shì)。舉個(gè)例子,商湯打造了原創(chuàng)的深度學(xué)習(xí)平臺(tái),可以處理1207層的網(wǎng)絡(luò);而目前如Facebook的Caffe2、谷歌的TensorFlow等開源框架在約300多層時(shí)便不足以滿足需求了。
四、人才是第一生產(chǎn)力
然而,人們對(duì)深度學(xué)習(xí)應(yīng)用需求的迅速增強(qiáng)也帶來了一個(gè)問題——人才短缺。2017年以來,以深度學(xué)習(xí)為主的AI人才缺失問題已經(jīng)引起了不少公司的強(qiáng)烈注意,F(xiàn)acebook與谷歌在內(nèi)部打造人工智能學(xué)院,從內(nèi)部工程師中進(jìn)行培養(yǎng)的新聞也陸續(xù)見報(bào)。國內(nèi)方面,從BAT到大大小小的企業(yè)都在進(jìn)行人才的招攬與挖掘,比如微信事業(yè)群在3月時(shí)就曾一舉貼出30個(gè)AI高級(jí)學(xué)霸的招聘信息。針對(duì)這一現(xiàn)狀,智東西也詢問了商湯科技的解法。
徐立表示,商湯科技使用的是內(nèi)生人才培養(yǎng)機(jī)制,由公司內(nèi)部一大批有經(jīng)驗(yàn)的導(dǎo)師來自己培養(yǎng)。國內(nèi)優(yōu)秀且聰明的人才其實(shí)非常多,“大二、大三的學(xué)生真是非常厲害”,因此商湯整個(gè)團(tuán)隊(duì)相對(duì)比較年輕,而且第一更熟悉公司業(yè)務(wù),第二便宜很多。


