智東西(公眾號:zhidxcom)
文 | 寓揚

一年一度的MWC上海已經(jīng)落下帷幕,在為期3天的展覽中,我們發(fā)現(xiàn)今年的主題仍然圍繞5G、物聯(lián)網(wǎng)、AI展開。

5G將提供更大的帶寬,推動通信、車聯(lián)網(wǎng)、無人機、VR、智慧城市等進一步發(fā)展。物聯(lián)網(wǎng)則進一步落地場景應用,以NB-IoT(窄帶物聯(lián)網(wǎng))為代表的連接技術(shù)已真正實現(xiàn)落地商用。AI開始“潤物細無聲”,融入各個場景。

MWC上海期間,智東西走訪了眾多企業(yè),并與聯(lián)發(fā)科技副總經(jīng)理暨智能設備事業(yè)群總經(jīng)理游人杰進行溝通,對于智能語音的發(fā)展、下一個家庭消費爆品在哪里、語音創(chuàng)業(yè)公司做芯片等問題有了更深的認知與判斷。

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!

(聯(lián)發(fā)科技副總經(jīng)理暨智能設備事業(yè)群總經(jīng)理游人杰)

過去聯(lián)發(fā)科為人所知的更多是手機芯片,這也其在移動互聯(lián)網(wǎng)時代的主戰(zhàn)場。而游人杰所負責的智能設備事業(yè)群可以稱為聯(lián)發(fā)科的“第二戰(zhàn)場”,其領導的事業(yè)群也是物聯(lián)網(wǎng)領域的重要力量之一。典型的就是,盡管智能音箱保持著爆炸式的增長,聯(lián)發(fā)科依然占據(jù)這個市場60%~70%的市場份額。

一、智慧家庭走向語音與視覺的融合

游人杰談到家庭終端設備的演變。十年前我們想要看電影,那時電視沒有網(wǎng)絡,需要使用DVD播放器,去租碟片才能觀看。這是階段可以稱為isolated(孤立的),沒有網(wǎng)絡連接。

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!

大概5年前,我們的家庭進入到第二個階段connected(連接),通過影像串流服務,我們可以將視頻通過高速帶寬網(wǎng)絡傳送到電視上,來看電影。

一直到去年,智能音箱的盛行,家庭也進入到第三階段AI integrated,AI融入家庭。隨著AI算法的成熟,智能音箱依托AI在云端做語義的辨識,聽懂用戶的意圖,AI+語音就誕生了。

他認為,AI+語音只是AI落地智慧家庭的第一步,“相信不久的將來,或許是今年,AI+vision(AI+視覺)會開始盛行”。

“未來的趨勢無外乎就是,AI+voice/vision(語音或者視覺)的組合”,游人杰進一步對智慧家庭的未來預測道。

他認為結(jié)合AI的技術(shù),未來家用機器人會進入家庭,但它要具備三個因素:第一要能夠用語音做人機交互的界面;第二要可以做影像識別,比如通過攝像頭等傳感器,它就可以知道你家庭的樣子(掃地機器人);第三在具備了語音、影像的功能后,機器人還要有智慧的學習,變得更加智能化。

“這是未來家庭會發(fā)生的改變,去年是(家用)機器人的元年”,他預測到。

考慮到聯(lián)發(fā)科的語音芯片在智能音箱中占有60%~70%的市場份額,全球超50%的智能家庭聯(lián)網(wǎng)設備由聯(lián)發(fā)科WiFi芯片驅(qū)動,可見聯(lián)發(fā)科在物聯(lián)網(wǎng)芯片尤其是家庭市場扮演著重要角色。而游人杰此言也指明了,語音交互下一階段會積極擁抱視覺AI能力,語音與視覺的融合才是語音交互或者說人機交互的未來,而家庭場景中承載這一載體的則是家用機器人。

二、VR兩三年內(nèi)走向爆發(fā)

基于這樣的認知和思考,圍繞家庭的智能終端產(chǎn)品要給用戶帶來什么樣的體驗呢?游人杰認為,無外乎這三點,舒適、安全、娛樂,聯(lián)發(fā)科也將基于這三點來布局家庭產(chǎn)品線。

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!

這幾點并不難理解,所謂舒適就是生活更加智能化、便捷化,當你回到家打開門的那一刻起,溫度、濕度、燈光等都是你想要的,而這離不開對家庭各種智能設備的控制。

“智能音箱就扮演了智能家庭的控制中心”,顯然相對于家庭場景的中心到底是誰這一問題,在他看來就是智能音箱。

而安全核心的一塊就是通過攝像機去做識別,比如通過攝像頭來進行家庭成員的情緒識別,判斷心情狀態(tài)。這意味著芯片需要具備更加強大的算力。

家庭同時也是一個娛樂的中心。當智東西問道家庭的下一個爆品會是什么時,游人杰稱會是VR/AR。他認為,“目前來看是VR/AR,是AI+視覺”。

當智東西問道這一現(xiàn)象多久才會到來,他稱未來2~3年VR/AR會大量爆發(fā)甚至普及。他舉例到,“以前VR眼鏡帶個15分鐘就會頭暈,但是現(xiàn)在可以帶1~2個小時,已經(jīng)可以看一部電影了?!?/p>

而智東西在MWC上海期間,也深刻感受到VR設備的火熱,從芯片公司、運營商到硬件設備廠商的站臺上都會展示其產(chǎn)品或技術(shù)在VR設備上的應用。展會上HTC vive用一個龐大的站臺展示自身的VR設備,其中還包括多人對戰(zhàn)游戲,據(jù)員工介紹目前VR設備已支持2V2對戰(zhàn),支持3K高清視頻。似乎VR的發(fā)展也到了一個臨界點,將要破土而出。

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!

游人杰近一步指出,5G時代或者AI時代的來臨,這些都即將發(fā)生,聯(lián)發(fā)科會針對VR推出專門設計的芯片,并且芯片本身特別強調(diào)低延遲,同時讓電池的使用時間多兩倍以上,讓用戶的體驗更好。

三、今年國內(nèi)智能音箱市場規(guī)模2000萬臺

智能音箱迅猛的發(fā)展使之成為一個熱議的話題。今年年初,游人杰告訴智東西,最初他預測今年智能音箱市場規(guī)模應該會在5000萬左右,但隨著亞馬遜與谷歌市場的競爭以及海外市場的開拓,他指出從當時的局勢來看市場達到6000萬臺不是問題。

而在年中這樣一個時間節(jié)點,當智東西再次問及他對全球智能音箱市場的預期時,“全球至少6000萬以上”,他回答到。從“不是問題”到“至少”,盡管6000萬臺的大數(shù)字沒變,但也呈現(xiàn)他對這一市場預期更加看好。

今年年初,他針對國內(nèi)市場預測到,國內(nèi)市場規(guī)模預計至少10倍增長,市場規(guī)模將超過1000萬。而此次再問及時,他稱國內(nèi)市場規(guī)模將會達到1500萬~2000萬。這意味著國內(nèi)智能音箱市場的強勁爆發(fā)。

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!

當談到智能語音/語音芯片接下來的具體走勢時,他認為當智能音箱作為一個最基本的產(chǎn)品普及時,會呈現(xiàn)兩個趨勢:

第一是產(chǎn)品會朝兩個方向走,一個是產(chǎn)品往更低價、功能更簡單走;另外一個是產(chǎn)品往高階走,會加入屏幕、攝像頭等,會有更強的AI能力。

第二是語音演變成一個人機交互的界面,進入各種家庭設備,都可以用語音來連接和控制。

這兩點可以看做智能音箱或者智能語音在縱向與橫向兩個方向的發(fā)展趨勢,縱向就是智能音箱產(chǎn)品本身品類的多元化,根據(jù)不同的場景與定位主打不同的產(chǎn)品;橫向就是智能語音交互能力從智能音箱擴散到其他家居產(chǎn)品中,比如今年電視的語音化就是一個很好的例證。

此外,他的話中也暗示,帶屏智能音箱也會是今年或者接下來的一個重點產(chǎn)品。聯(lián)發(fā)科目前已經(jīng)有一款針對帶屏音箱的芯片方案,游人杰透露道,明年會推出下一代芯片解決方案MT8168,它會提供更強的AI能力。

四、語音公司做芯片背后的算盤

近期短短2個月間,云知聲、Rokid、思必馳三家語音公司或發(fā)布語音芯片,或公布語音芯片進展,語音技術(shù)創(chuàng)業(yè)公司做芯片已形成一股熱潮。前有云知聲CEO黃偉“語音公司不做芯片必死無疑”,后有Rokid CEO 祝銘明“語音公司做芯片毋庸置疑”,而思必馳CEO高始興則稱是“順勢而為”。

有趣的是,思必馳也是聯(lián)發(fā)科投資的一家公司。此前智東西就將這一問題拋給思必馳CEO高始興,為何有聯(lián)發(fā)科的語音芯片可以使用的情況下,還有推自有芯片。他稱,“思必馳打造語音芯片跟聯(lián)發(fā)科并不沖突”,主要為了產(chǎn)品在功耗、性能、成本上更具優(yōu)勢。

而今天智東西又將這一問題拋給了游人杰,如何看待語音創(chuàng)業(yè)公司做芯片?

在他看來,每一家語音公司的算法都不同,需要對芯片硬件架構(gòu)做耦合,才能夠產(chǎn)生更好的效果與效能,這是語音創(chuàng)業(yè)公司做AI芯片的一個主要原因。

他進一步指出,像科大訊飛、思必馳做語音芯片更主要在于做DSP(數(shù)字信號處理)。目前用CPU、AP芯片(應用處理器芯片)來做的方案,功耗比較高。

在語音芯片上,聯(lián)發(fā)科也與思必馳搭配,使用思必馳的算法?!捌鋵嵲谑袌鍪窍嗷ズ献鞯摹?,他近一步解釋道,當思必馳把基于DSP的部分做好后,就可以減輕MCU(微控制單元)的算力,聯(lián)發(fā)科就可以用MCU來做更多的服務。

他又以聯(lián)發(fā)科投資的匯頂科技為例談到,最初聯(lián)發(fā)科投資了匯頂科技,當匯頂科技在手機指紋識別芯片做的很好的時候,聯(lián)發(fā)科就不再做這塊,“當合作伙伴有競爭力時,為什么要自己做”,他風趣地打比方道,聯(lián)發(fā)科就像一只母雞,可以用投資的方式,帶動更多小雞的發(fā)展。

而在物聯(lián)網(wǎng)這個市場,隨著語音交互的爆發(fā),這會是一個很廣闊的市場。游人杰談到,目前智能音箱是基于AP芯片來打造的, 未來帶屏后需要更強的計算力,就需要GPU的支持。再擴展到IoT設備,則主要用的是基于MCU芯片打造的。

“物聯(lián)網(wǎng)市場是很廣泛的,基本很難找到一家去主導,聯(lián)發(fā)科技也不會像智能音箱市場擁有60%以上的市場份額”,游人杰此言意味著在物聯(lián)網(wǎng)這個廣闊的市場,創(chuàng)業(yè)公司也會存在很多機遇,物聯(lián)網(wǎng)這個市場也不可能一家獨大。

聯(lián)發(fā)科可以用投資的方式來覆蓋更多的應用場景,并于合作伙伴形成合力,占領更多市場。

結(jié)語:智慧家庭兩個爆發(fā)點

通過MWC上海展會上的觀察與游人杰的溝通,我們也更加清晰地看到,家庭智能終端以及智能語音未來可能的發(fā)展趨勢。一方面智能語音以及智能音箱會進一步爆發(fā),另一方面VR也可能會在未來兩三年內(nèi)實現(xiàn)爆發(fā)。

正如游人杰結(jié)合上游芯片端所作出的預測,一方面全球智能音箱至少6000萬臺銷量,國內(nèi)智能音箱將達到2000萬左右的市場規(guī)模,智能音箱將進一步快速增長,并實現(xiàn)AI+語音/視覺的融合。

此外,我們可以更加深刻的感受到AI在芯片與終端設備的融合,而這些交織在一起,無論是當下的智能音箱,還是即將走向爆發(fā)的VR眼鏡,都推動我們生活的變革。


每日一頭條

趨勢·深度·犀利·干貨,最專業(yè)的行業(yè)解讀

深喉爆料、投稿:guoren@zhidx.com

深度:2000萬智能音箱戰(zhàn)火不滅,VR第二春要爆發(fā)!