智東西(公眾號:zhidxcom
作者 |? 楊暢
編輯 | ?漠影

智東西9月17日報道,第23屆中國光博會正在深圳國際會展中心舉行,本次中國光博會共占據(jù)8個展館,包含6大主題展區(qū)。在智能傳感展區(qū)聚集了眾多3D(三維)視覺領域的代表公司,其中不乏多家新銳創(chuàng)企。

同期舉行的中國國際光電高峰論壇上,主辦方專門設置了3D視覺研討會,其中的盧深視模組方案事業(yè)部總經(jīng)理崔哲以“傳感+AI 3D全棧提升支付安全與體驗”為主題,分享了3D視覺的特點、價值和在一些人們?nèi)粘I钪匾獔鼍爸械膽们闆r。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

▲的盧深視模組方案事業(yè)部總經(jīng)理崔哲

目前,2D照片數(shù)據(jù)已經(jīng)泛濫,且復制和批量修改成本極低,無法作為人像隱私數(shù)據(jù)得到保護,而3D數(shù)據(jù)由于采集門檻更高、沒有批量修改工具,仿制成本高、彩色+深度數(shù)據(jù)需匹配等特點更適合于在一些需要機器視覺的領域應用。

從2017年蘋果公司在iPhone X增加Face ID人臉解鎖應用后,3D視覺逐漸被用戶熟悉,現(xiàn)已廣泛應用于安防、消費電子、機器人等領域,圍繞3D視覺提供各類技術和解決方案的玩家也不斷增多。

作為重要玩家之一的的盧深視不僅在3D視覺的模組方面進行了布局,發(fā)布了智慧樓宇等解決方案,在3D視覺算法上也有所突破。

目前的盧深視產(chǎn)品和解決方案已經(jīng)落地應急防疫、金融支付、海關邊境等多個場景。

作為國內(nèi)較早進入3D視覺領域并且專注于全棧產(chǎn)品解決方案的廠商,的盧深視是如何把握3D視覺發(fā)展趨勢,進而成功實現(xiàn)眾多應用落地的?

智東西通過對話的盧深視模組方案事業(yè)部總經(jīng)理崔哲,對的盧深視在3D視覺領域的技術、產(chǎn)品發(fā)展和布局情況進行深入解讀。

一、3D視覺發(fā)展的三個階段

無論2D視覺傳感器還是3D視覺傳感器,作用都是獲取到現(xiàn)實世界的精確圖像數(shù)據(jù),然后提供給計算機進行分析。

通過提高成熟度,降低成本,憑借更優(yōu)性價比,3D傳感器實現(xiàn)了“降維打擊式替代”2D傳感器,將發(fā)展成為機器標配的“眼睛”。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

從行業(yè)未來發(fā)展角度看,根據(jù)Tractica數(shù)據(jù),全球3D傳感器和硬件子系統(tǒng)市場將從2017年的82億美元增長到2025年的579億美元,3D視覺的未來市場發(fā)展空間巨大。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

因為了解到3D視覺的優(yōu)勢和市場發(fā)展空間,早在2015年,的盧深視就開始進入3D視覺領域。

相比于那些在2017年蘋果公司推出Face ID人臉識別解鎖該典型3D視覺應用之后進入此賽道的企業(yè),的盧深視經(jīng)歷了更多3D視覺的不同發(fā)展階段,也對不同時期行業(yè)里存在的問題或挑戰(zhàn)有較深的感知。

崔哲談道,3D視覺行業(yè)的起步期(2017年之前)重要問題或者說挑戰(zhàn)是,如何將3D視覺的優(yōu)勢和特點介紹給行業(yè)用戶。

因為作為一項新技術,行業(yè)用戶不知道3D視覺能解決機器視覺領域的哪些問題,更不用說3D視覺的價值和優(yōu)勢了。

在中國3D視覺市場起步期,的盧深視是從3D視覺能夠幫助機器獲取更多維度的視覺信息、更多維度的視覺信息可以帶來算法更多的應用這一角度,作為切入點,來突出3D視覺的優(yōu)勢,讓行業(yè)用戶快速了解3D視覺的優(yōu)勢,并決定使用3D視覺的技術和產(chǎn)品。

他舉例說,像的盧深視2015年創(chuàng)立不久就開始做的邊疆全省3D人臉識別卡口項目,的盧深視幫助用戶實現(xiàn)了千萬級別大庫的黑名單報警功能、白名單記錄功能以及對重點監(jiān)控人員的行為分析,這些功能的實現(xiàn),就主要是依托3D視覺收集到的多維度數(shù)據(jù)。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

到了3D視覺市場成長期(2017年之后的一段時期),一些行業(yè)用戶開始認可3D視覺技術和產(chǎn)品,這時如何將3D視覺技術和產(chǎn)品推廣到更大的領域,則成為各3D視覺行業(yè)玩家需要面臨的重要問題。

蘋果在這個階段發(fā)揮了重要的作用,崔哲提到因為當時(2017年)蘋果發(fā)布了新款iPhone(iPhone X),上面配備Face ID功能,其中就用到了結構光3D視覺技術,這讓消費者對3D視覺技術、產(chǎn)品接受和認知程度提高了,相應的無論是終端的應用需求還是開始做上游器件的廠商都開始增多。

目前,3D視覺行業(yè)的主要挑戰(zhàn)是如何通過降低成本、功耗和體積,將3D視覺的產(chǎn)品做到真正的消費級。

他說,在大概2017年之前,3D傳感器專業(yè)級的價格可能要10萬左右,民用級的精度略好的都需要兩三千?,F(xiàn)在3D傳感器的價格已經(jīng)逐漸接近二維視覺傳感器的價格區(qū)間了,下一步就是將3D傳感器的價格降到和2D傳感器一樣的程度。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

▲的盧深視總結的3D視覺智能架構及技術演進路徑

3D視覺不斷發(fā)展,的盧深視認為3D視覺可分為兩種未來的發(fā)展方向:偏專業(yè)方向和偏民用方向,這兩個方向對于3D視覺傳感器的要求會不同。

崔哲談道,偏專業(yè)方向的3D視覺傳感器或者技術的下一步是向更高的數(shù)據(jù)精度、更好的圖像質量、更遠的探測距離方向發(fā)展。

例如安防領域,用戶可能會要求傳感器,實現(xiàn)在露天環(huán)境下,對幾十米范圍內(nèi)的空間進行高精度的探測。

而偏民用方向,他認為3D視覺首先就要解決消費者的體驗問題,首先是成本,3D視覺廠商要將3D視覺成本降到更低;其次就是要將3D視覺傳感器等產(chǎn)品做到集成化、小型化和低功耗,因為消費者使用手機、可穿戴設備等時,對于上面裝有的傳感器體積是有要求的。

的盧深視也是朝這兩個方向在不斷探索的。

二、的盧深視的兩大主攻方向,深度匹配應用特性

3D視覺行業(yè)是一個較新的賽道,除了跟上整個行業(yè)的發(fā)展方向和發(fā)展速度之外,各玩家會采取不同策略,來實現(xiàn)擴大市場占有率等目標。

崔哲談道,從產(chǎn)業(yè)角度,3D視覺廠商想要推進3D識別技術和產(chǎn)品落地,核心點在于這個產(chǎn)品或技術可以幫行業(yè)用戶所在的產(chǎn)業(yè)解決實際問題。

例如刷臉門鎖和刷臉支付,對3D傳感器的需求是不同的。

像刷臉門鎖大部分是電池驅動,如果功耗過高,消費者就需要經(jīng)常更換門鎖上面的電池,這樣帶給消費者的體驗就會變差。所以對智能門鎖來說,視覺傳感器的功耗高低是相當關鍵的。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

但對于刷臉支付產(chǎn)品來說,可能功耗就不那么重要了,因為很多刷臉支付設備都是供電的。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

因為了解到每個行業(yè)對視覺傳感器的需求特點是存在差異的,所以的盧深視會基于行業(yè)給出更定制化的解決方案。

如針對刷臉支付等應用,的盧深視推出高精度RGBD相機青鸞。這種結構緊湊的結構光RGBD相機,支持HDR(高動態(tài)范圍成像)功能,以保證逆光場景下的清晰度;同時支持多種安裝方式,易于集成,也可做尺寸的快速匹配,并且視場設計成豎直視場,更適合于刷臉場景。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

▲的盧深視3D-FaceID智能模組重明和高精度RGBD相機青鸞

而針對智能門鎖等相關應用,的盧深視則研發(fā)出另一種模組:3D-FaceID智能模組重明,這種模組的優(yōu)勢就是體積小,其體積只有46.9mm(寬)*12.3mm(厚)*20.8mm(高)大?。还牡?,內(nèi)置鋰電池單次充電最高使用時間可達1年;有休眠狀態(tài)、可支撐長期工作;還可以在夜晚正常使用。

的盧深視還在這兩種產(chǎn)品上增加了算法開發(fā)模塊或算法升級模塊,行業(yè)用戶可以根據(jù)具體的細分應用場景再做優(yōu)化和調(diào)整。

總的來說,的盧深視的技術研發(fā)路徑就是,第一步是找場景,第二步是基于場景進行分析、調(diào)優(yōu)。

這個過程中需要對行業(yè)用戶在不同場景下的需求進行分析。

而如何去獲取行業(yè)用戶在某一場景下的需求或某一行業(yè)的需求,的盧深視選擇從大客戶切入,然后了解該行業(yè)對視覺傳感器的共性需求,并復制這些經(jīng)驗,進而設計出適合于這個行業(yè)的較通用型產(chǎn)品。

的盧深視不僅技術研發(fā)上基于場景、基于行業(yè)來進行,在探索3D視覺評價指標和行業(yè)標準過程中也是從具體的應用入手的。

目前,3D視覺領域的產(chǎn)品或技術的評價指標,以及相關的行業(yè)標準還在探索或起草階段,行業(yè)里并沒有成熟或較統(tǒng)一的認知。

例如,如何評價一個傳感器是否適合于某個3D人臉識別算法等問題,有一些更寬泛的評價指標可用來評價,像圖像質量,更具體來說是數(shù)據(jù)精度、分辨率等指標。

在實際研發(fā)中,的盧深視發(fā)現(xiàn)這些普適性高的指標可能不足以滿足其評價自身產(chǎn)品如傳感器等的需求,所以的盧深視會從應用角度反推相關的評價指標,進而探索出一套更符合實際生產(chǎn)、應用的指標體系。

三、的盧深視的五大核心技術方向

的盧深視一共有3D人臉識別、3D視覺傳感器、3D目標重建測量、3D人像動態(tài)捕捉分析、交互與虛擬數(shù)字人這五類核心技術方向。

現(xiàn)在可能3D人臉識別技術的相關產(chǎn)品落地更多一些,比如,的盧深視從2015年成立后進行的邊疆全省3D人臉識別卡口,到2017年中標的港珠澳大橋人臉識別安檢項目,再到2020年開始建設的國內(nèi)一線城市地鐵AFC刷臉進站項目。

解構3D視覺技術風向,的盧深視用定制化破局落地挑戰(zhàn)

▲某城市地鐵AFC刷臉進站項目中應用到的的盧深視產(chǎn)品、技術

除了參與重要3D視覺應用項目,的盧深視也參加到一些3D人臉識別相關的國家標準和行業(yè)標準的起草制定過程中,例如公安部《安防人臉抓拍設備技術要求標準》、中國銀聯(lián)《中國銀聯(lián)刷臉付3D識別數(shù)據(jù)技術指南》等。

同時,像最近熱度很高的元宇宙、AR等領域相關的3D視覺技術,的盧深視也有布局。

早在2016年,的盧深視就開始進行在沉浸式人機交互與虛擬數(shù)字人相關研究工作。智東西了解到,目前的盧深視在該方向上是以底層核心技術研究為主。

像3D人臉識別之外的3D生物識別信息認證如瞳孔識別、掌紋識別等,以及3D人像動態(tài)捕捉分析等可以預判用戶行為的相關技術,的盧深視也都有涉及。的盧深視的3D視覺技術布局已經(jīng)覆蓋了3D視覺大部分的分支技術。

結語:三維視覺應用范圍廣,或成機器標配

無論是去年的中國光博會還是本屆中國光博會,展會上都出現(xiàn)了3D視覺相關的展臺或體驗區(qū),這背后是3D視覺技術發(fā)展多年,尤其是近5年蓬勃發(fā)展的結果。

在眾多3D視覺行業(yè)玩家中,的盧深視發(fā)揮前瞻性策略,提前預判到了3D視覺是機器視覺的必然發(fā)展趨勢,同時的盧深視專注利用實際應用樣本去進行優(yōu)化設計,并且進行了技術布局,這些行動讓的盧深視在3D視覺行業(yè)競爭愈發(fā)激烈的現(xiàn)在,自身的價值得到顯現(xiàn)。

的盧深視的切入方向基本上是和人們?nèi)粘I钕⑾⑾嚓P,例如安檢、支付等,也是希望通過3D視覺的優(yōu)勢,給人們帶來生活便利。

隨著AR、VR、和機器人等發(fā)展,3D視覺這種符合人類特性的機器視覺技術,將發(fā)揮更大作用,3D視覺技術可能成為每個機器必配的一雙“眼睛”。