智東西(公眾號(hào):zhidxcom)
作者 | 韋世瑋
編輯 | 漠影

思必馳在AI智慧辦公賽道上正不斷玩出新花樣!

兩個(gè)月前的上海AWE(中國(guó)家電及消費(fèi)電子博覽會(huì))上,思必馳首次亮相了面向智慧辦公場(chǎng)景的新產(chǎn)品——會(huì)議魔方M1,具有藍(lán)牙和USB兩種連接方式、360°全向麥克風(fēng)拾音、智能降噪和錄音轉(zhuǎn)文字等功能,大大滿足了各類辦公場(chǎng)景的會(huì)議需求。

作為我國(guó)人工智能語(yǔ)音行業(yè)的獨(dú)角獸,思必馳在這條賽道上已布局多年,構(gòu)建了語(yǔ)音識(shí)別、聲紋識(shí)別、口語(yǔ)對(duì)話系統(tǒng)等一系列核心技術(shù),其自然語(yǔ)言交互解決方案已落地車聯(lián)網(wǎng)、IoT及政務(wù)、金融等行業(yè)場(chǎng)景。

與此同時(shí),思必馳長(zhǎng)期以來(lái)也為許多合作伙伴提供了會(huì)議場(chǎng)景下,聲音采集和處理的軟硬件解決方案。而會(huì)議魔方M1推出,也是思必馳將這部分智能語(yǔ)音技術(shù)向更加專業(yè)的方向集成拓展。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

作為思必馳智能語(yǔ)音技術(shù)的集大成產(chǎn)品之一,會(huì)議魔方M1背后的技術(shù)城池是如何構(gòu)建的?能解決哪些行業(yè)及用戶的痛點(diǎn)需求?未來(lái)產(chǎn)品迭代路徑是如何規(guī)劃的?

為此,智東西與思必馳智慧辦公業(yè)務(wù)負(fù)責(zé)人進(jìn)行了深入交流,在嘗試尋找上述答案的同時(shí),也看到了不少思必馳打磨會(huì)議魔方系列背后的思路和閃光點(diǎn)。

一、三大核心技術(shù)加持,會(huì)議魔方的技術(shù)護(hù)城河

在深入交流之前,我們也親自體驗(yàn)了一下會(huì)議魔方M1,看看使用它來(lái)進(jìn)行遠(yuǎn)程會(huì)議是不是真的那么方便。

剛拿到會(huì)議魔方M1,我們感覺(jué)它比一臺(tái)iPhone 12要重一些,形狀是一個(gè)塔尖被削平的倒金字塔形立方體,重量只有260g,方便攜帶。

在一次業(yè)務(wù)周會(huì)中,我們體驗(yàn)了一下它在多人遠(yuǎn)程會(huì)議場(chǎng)景下的使用效果,并和手機(jī)進(jìn)行了對(duì)比。參加遠(yuǎn)程會(huì)議的異地同事反饋,會(huì)議魔方的拾音效果明顯優(yōu)于手機(jī),對(duì)環(huán)境噪音的抑制能力很強(qiáng),以往在遠(yuǎn)程會(huì)議中不可避免的鍵盤(pán)敲擊聲、開(kāi)關(guān)門(mén)聲、以及空調(diào)運(yùn)轉(zhuǎn)聲等,在使用會(huì)議魔方時(shí),都沒(méi)有聽(tīng)見(jiàn)。與會(huì)發(fā)言者們的聲音也始終非常清晰,無(wú)論遠(yuǎn)近,聽(tīng)到的音量都幾乎一致,沒(méi)有忽高忽低現(xiàn)象出現(xiàn)。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

如果要使用會(huì)議魔方的錄音以及語(yǔ)音轉(zhuǎn)寫(xiě)功能,在初次使用時(shí),首先要下一個(gè)名為曉語(yǔ)聽(tīng)聽(tīng)APP,打開(kāi)后根據(jù)軟件提示進(jìn)行綁定。綁定成功后,直接點(diǎn)擊軟件下方的藍(lán)色加號(hào)開(kāi)啟錄音,會(huì)議魔方M1就會(huì)同步開(kāi)啟錄音,記錄會(huì)議內(nèi)容。

開(kāi)始錄音一秒后,手機(jī)端的錄音工作界面就會(huì)開(kāi)始出現(xiàn)實(shí)時(shí)轉(zhuǎn)文字的內(nèi)容。遇到想要重點(diǎn)記住的內(nèi)容時(shí),我們只需要點(diǎn)擊APP錄音界面的“M一下,轉(zhuǎn)寫(xiě)界面就會(huì)出現(xiàn)高亮部分,能更好地一眼區(qū)分哪里是用戶關(guān)注的會(huì)議重點(diǎn)。會(huì)議結(jié)束后,我們只需點(diǎn)擊會(huì)議魔方M1上方的結(jié)束錄音,手機(jī)端的轉(zhuǎn)寫(xiě)工作也能很快結(jié)束。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

從結(jié)果上來(lái)看,在我們長(zhǎng)達(dá)3個(gè)小時(shí)的會(huì)議中,會(huì)議魔方M1除了口語(yǔ)交流中的少數(shù)同音詞、多意詞沒(méi)有識(shí)別準(zhǔn)確外,其他大部分的對(duì)話內(nèi)容都能準(zhǔn)確且流暢地轉(zhuǎn)寫(xiě)完成。還可以快速生成會(huì)議記錄,一鍵分享給參會(huì)的同事。

之后,智東西在和思必馳智慧辦公業(yè)務(wù)負(fù)責(zé)人的溝通中了解到,會(huì)議魔方M1流暢的遠(yuǎn)程會(huì)議體驗(yàn)背后有三大核心算法技術(shù),一是拾音,包括遠(yuǎn)距離拾音;二是智能降噪;三是對(duì)語(yǔ)音進(jìn)行識(shí)別和轉(zhuǎn)寫(xiě),整個(gè)過(guò)程也是溝通信息被數(shù)字化和智能化處理的過(guò)程。

1、拾音:5米內(nèi)全方位清晰拾音

用戶所處的空間環(huán)境不同,給會(huì)議魔方M1帶來(lái)的拾音挑戰(zhàn)也不同。目前,會(huì)議魔方能夠做到在75分貝條件下,清晰拾取5米內(nèi)的任何語(yǔ)音。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

2、降噪:3項(xiàng)智能降噪核心

拾音后的降噪工作是一個(gè)大工程,涉及到噪聲抑制、回聲消除、增益放大等技術(shù)。

一方面,通常會(huì)議場(chǎng)景中也會(huì)存在許多噪音,包括會(huì)議室外有人說(shuō)話、走動(dòng)、敲鍵盤(pán),或是室內(nèi)空調(diào)、風(fēng)扇的聲音,會(huì)議魔方M1則需要對(duì)這部分噪音進(jìn)行噪聲抑制,把會(huì)議中的人聲清晰地呈現(xiàn)出來(lái)。

另一方面,由于設(shè)備的揚(yáng)聲器和麥克風(fēng)連接得很近,當(dāng)人們?cè)谥v話過(guò)程中很容易出現(xiàn)回音,這也會(huì)影響到用戶的通話效果,這時(shí)就需要對(duì)拾音內(nèi)容進(jìn)行回聲消除。

同時(shí)在遠(yuǎn)距離拾音過(guò)程中,有些說(shuō)話人離麥克風(fēng)較遠(yuǎn),會(huì)議魔方M1也需要對(duì)這部分聲音進(jìn)行增益放大處理。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

3、轉(zhuǎn)寫(xiě):實(shí)際會(huì)議場(chǎng)景中準(zhǔn)確率達(dá)95%

正如前面的體驗(yàn),目前會(huì)議魔方M1在轉(zhuǎn)寫(xiě)方面有兩項(xiàng)核心功能,一是區(qū)分說(shuō)話人,根據(jù)聲紋和音色的不同,讓轉(zhuǎn)寫(xiě)文字能按不同說(shuō)話人段落顯示;二是文本智能校正,識(shí)別口語(yǔ)中常出現(xiàn)的反復(fù)、停頓等表達(dá),讓轉(zhuǎn)寫(xiě)文本更加流暢。

此外,會(huì)議魔方M1通用的轉(zhuǎn)寫(xiě)準(zhǔn)確率約95%,還支持中英文混合識(shí)別、離線轉(zhuǎn)寫(xiě)分析等功能。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

二、遠(yuǎn)程會(huì)議需求爆發(fā)背后,溝通的數(shù)字化與智能化

實(shí)際上,會(huì)議魔方M1的誕生,離不開(kāi)思必馳對(duì)智慧辦公場(chǎng)景深刻觀察。

思必馳發(fā)現(xiàn),現(xiàn)在的企業(yè)會(huì)議場(chǎng)景中經(jīng)常會(huì)遇到一個(gè)尷尬情況,那就是常常聽(tīng)不清會(huì)議內(nèi)容或是需要喊話交流,一定程度上影響了會(huì)議的質(zhì)量和效率。

另一方面,企業(yè)日常中有許多會(huì)議或面對(duì)面的溝通,都沒(méi)有被進(jìn)一步的數(shù)字化或智能化處理,難以對(duì)會(huì)議中的一些價(jià)值內(nèi)容進(jìn)行深入挖掘。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

“那思必馳作為專業(yè)語(yǔ)音和語(yǔ)義技術(shù)的企業(yè),能夠解決其中的一些關(guān)鍵點(diǎn)。”負(fù)責(zé)人解釋,這也是思必馳做會(huì)議魔方M1的優(yōu)勢(shì)所在。

首先是思必馳的拾音和智能降噪技術(shù),能夠幫助企業(yè)解決聲音的質(zhì)量問(wèn)題,讓用戶不管是在小型還是大型會(huì)議場(chǎng)景下都能清晰交流。其次是思必馳的語(yǔ)音識(shí)別和轉(zhuǎn)寫(xiě)技術(shù),能夠?qū)崿F(xiàn)溝通的數(shù)字化。

同時(shí),將一場(chǎng)會(huì)議面對(duì)面溝通的所有語(yǔ)音轉(zhuǎn)成文字,能讓用戶快速去獲得整個(gè)會(huì)議的信息,再通過(guò)機(jī)器學(xué)習(xí)技術(shù)對(duì)信息進(jìn)行結(jié)構(gòu)化處理,從而實(shí)現(xiàn)會(huì)議效率和內(nèi)容價(jià)值的進(jìn)一步提升。

“我們外部環(huán)境的變化,疫情的變化也導(dǎo)致越來(lái)越多人需要遠(yuǎn)程或在家辦公?!必?fù)責(zé)人補(bǔ)充,在這個(gè)環(huán)境下還有另一個(gè)細(xì)分場(chǎng)景,那就是家里或咖啡廳場(chǎng)景下的個(gè)人設(shè)備需求,能夠讓用戶的遠(yuǎn)程溝通更加清晰,并且還能實(shí)時(shí)記錄交流內(nèi)容。

而這些都是思必馳決定研發(fā)會(huì)議魔方M1的重要出發(fā)點(diǎn)。

三、千億規(guī)模藍(lán)海市場(chǎng)下,智能會(huì)議業(yè)務(wù)的創(chuàng)新邏輯

目前思必馳面對(duì)整個(gè)會(huì)議場(chǎng)景的思路是構(gòu)建一個(gè)終端設(shè)備+云服務(wù)的生態(tài)模式,這也是發(fā)展的核心,具體到產(chǎn)品業(yè)務(wù)的拓展大致有三類方向。

一是思必馳在錄音采集方面已經(jīng)做了單款采集設(shè)備,但適合小型、中型和大型等各類會(huì)議場(chǎng)景的采集設(shè)備也存在不同區(qū)別,而這個(gè)方面思必馳會(huì)繼續(xù)做縱深拓展,做得更專業(yè)。

二是從橫向來(lái)看,為了給用戶帶來(lái)更豐富便捷的智能會(huì)議體驗(yàn),思必馳也將選擇通過(guò)深度合作的方式,補(bǔ)全多模態(tài)交互的產(chǎn)品組合。

三是所有傳統(tǒng)的會(huì)議設(shè)備都能和思必馳的語(yǔ)音轉(zhuǎn)寫(xiě)終端做配合,將傳統(tǒng)設(shè)備變成一個(gè)也能智能語(yǔ)音轉(zhuǎn)寫(xiě)的會(huì)議設(shè)備。

思必馳會(huì)議魔方背后有何黑科技?三大算法核心技術(shù)加持!

除此之外,未來(lái)會(huì)議魔方M1還需繼續(xù)打磨和優(yōu)化,這主要體現(xiàn)在算法和軟件兩個(gè)層面。

算法方面,會(huì)議魔方的智能降噪算法技術(shù)將實(shí)現(xiàn)更大突破和提升。軟件的安全性、易用性和可擴(kuò)展性也是思必馳接下來(lái)重點(diǎn)優(yōu)化的方向。尤其是會(huì)議魔方主要面向企業(yè)用戶,對(duì)產(chǎn)品的安全性要求更為嚴(yán)格。

在可拓展性方面,思必馳在未來(lái)也將推出針對(duì)大型會(huì)議的產(chǎn)品,實(shí)現(xiàn)多個(gè)設(shè)備的互聯(lián)互通,從而拓展產(chǎn)品的使用空間。而在信息化上,思必馳表示也將面向多人協(xié)作場(chǎng)景提供更多軟件服務(wù),特別是利用到語(yǔ)義識(shí)別或關(guān)鍵信息提取等技術(shù),與企業(yè)化流程相結(jié)合,目標(biāo)是降低企業(yè)的運(yùn)營(yíng)成本。

結(jié)語(yǔ):遠(yuǎn)程辦公浪潮爆發(fā),AI語(yǔ)音賽道的機(jī)遇和挑戰(zhàn)

過(guò)去一年的疫情影響下,云辦公、語(yǔ)音視頻會(huì)議等辦公方式逐漸成為大多數(shù)人的常態(tài),徹底點(diǎn)燃了智能辦公行業(yè)的發(fā)展浪潮。

盡管在后疫情時(shí)代下,人們的辦公方式也有所轉(zhuǎn)變,但企業(yè)對(duì)辦公效率智能化、數(shù)字化的需求已成行業(yè)的一大趨勢(shì),越來(lái)越多的玩家也抓住機(jī)會(huì)入局,想著要分一杯羹。在這一市場(chǎng)浪潮下,思必馳也為行業(yè)的創(chuàng)新發(fā)展提供了一個(gè)重要思路。

歸根結(jié)底,這也是一場(chǎng)技術(shù)與企業(yè)實(shí)現(xiàn)更深入結(jié)合的關(guān)鍵階段。相信在未來(lái),隨著人們利用語(yǔ)音技術(shù)提取和挖掘信息價(jià)值形成一個(gè)成熟方法論,也將能廣泛地拓展到政務(wù)、醫(yī)療等更多細(xì)分場(chǎng)景,讓各行各業(yè)都能更好地實(shí)現(xiàn)降本增效。