智東西(公眾號(hào):zhidxcom)
作者 | 韋世瑋
編輯 | 漠影

經(jīng)歷過一年的新冠疫情影響,線上辦公和在線學(xué)習(xí)成為不少人的生活新常態(tài),這大大刺激了K12在線教培行業(yè),線上教育火了,不少科技公司則瞄準(zhǔn)兒童及學(xué)生的學(xué)習(xí)剛需,推出各式各樣的軟硬件學(xué)習(xí)工具。

擁有17年AI教育布局經(jīng)驗(yàn)的科大訊飛,就是這股浪潮中的重要參與者之一。

目前,訊飛已推出了訊飛智能學(xué)習(xí)機(jī)、訊飛口袋打印機(jī)等人工智能學(xué)習(xí)輔助產(chǎn)品,因材施教地幫助孩子高效掌握知識(shí),節(jié)省家長(zhǎng)和老師大量輔導(dǎo)時(shí)間。

基于系統(tǒng)化的AI教育布局,在2020年財(cái)年中,訊飛的教育教學(xué)業(yè)務(wù)實(shí)現(xiàn)1.67億人民幣營(yíng)收,同比增長(zhǎng)16.77%。但學(xué)無止境,訊飛在AI教育中的布局也不止于此。

去年10月,訊飛針對(duì)學(xué)生在英語生詞學(xué)習(xí)中的聽、說、讀、記全學(xué)習(xí)場(chǎng)景,推出了訊飛掃描詞典筆,只需筆頭在紙面上輕輕一掃,0.5秒就能查閱英文生詞,掃描識(shí)別準(zhǔn)確率達(dá)99%,還能進(jìn)行模擬真人對(duì)話練習(xí)。

據(jù)悉,這款訊飛掃描詞典筆一經(jīng)首銷就售罄,足以見消費(fèi)者對(duì)它的喜愛,而這個(gè)成績(jī)的背后與訊飛在AI語音及圖像技術(shù)領(lǐng)域的長(zhǎng)期積累息息相關(guān)。

為此,智東西與科大訊飛消費(fèi)者AI學(xué)習(xí)業(yè)務(wù)部總經(jīng)理翟吉博進(jìn)行了深入交流,在更好地了解訊飛掃描詞典筆背后的核心技術(shù)亮點(diǎn)的同時(shí),也進(jìn)一步揭開訊飛在AI教育賽道布局的思考與邏輯。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

▲科大訊飛消費(fèi)者AI學(xué)習(xí)業(yè)務(wù)部總經(jīng)理翟吉博

一、AI語音技術(shù)城池的構(gòu)建,中英文識(shí)別正確率達(dá)99%

訊飛掃描詞典筆的背后,涵蓋了訊飛從語音到視覺,從NLP(自然語言處理)到醫(yī)學(xué)影像、手勢(shì)識(shí)別等領(lǐng)域的豐富AI技術(shù)。

“從用戶使用過程到后臺(tái)處理的邏輯來看,訊飛掃描詞典筆的工作本質(zhì)上是一個(gè)信息輸入輸出處理的過程。”翟吉博談到,詞典掃描筆的技術(shù)鏈條是呈衰減關(guān)系,需要一個(gè)端到端的完整良好體驗(yàn),每一步環(huán)節(jié)都處理好才能達(dá)到符合用戶預(yù)期的效果。

我們也親自體驗(yàn)了一下訊飛掃描詞典筆,看看它的英文識(shí)別翻譯是不是真的那么牛。一上手,訊飛詞典筆的體積雖然比一般手寫筆大了些,但握起來手感也不錯(cuò)。

當(dāng)我握住筆頭輕輕在紙面上一摁,筆頭的識(shí)別燈就會(huì)亮起,接著我就像平常做高亮記號(hào)一樣勻速滑過想要識(shí)別的英文段落,在我持續(xù)滑過文字的同時(shí),掃描筆屏幕上也會(huì)陸續(xù)跳躍出我識(shí)別的英文內(nèi)容。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

接著在我掃描結(jié)束1秒不到,屏幕就已經(jīng)完整顯示我掃描的英文段落及中文翻譯,同時(shí)還會(huì)有機(jī)器語音朗讀一遍,可自由選擇英美發(fā)音,從掃描到翻譯完畢的整個(gè)過程僅需短短幾秒。

之后我在和翟吉博溝通過程中才發(fā)現(xiàn),這短短幾秒的識(shí)別過程背后,其實(shí)是許多AI技術(shù)環(huán)環(huán)相扣,才將紙面上的文字呈現(xiàn)在小小的掃描筆屏幕上。通俗來講,這一過程大致要經(jīng)歷4個(gè)步驟:

1、當(dāng)我掃描英文時(shí),訊飛掃描詞典筆會(huì)利用圖像高速掃描技術(shù),將紙面上的打印或手寫文字快速拍成圖片。但這和手機(jī)的一次性成像不同,前者是基于用戶“掃描”的動(dòng)作過程,通過前端的圖像拼接算法將一幀幀的圖片拼接起來。

2、圖像拼接完畢后,就進(jìn)入轉(zhuǎn)文字識(shí)別過程,需利用到OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù),將圖像中的信息全部識(shí)別轉(zhuǎn)換成文字。

翟吉博稱,在這個(gè)過程中,訊飛OCR技術(shù)的中英文識(shí)別率準(zhǔn)確率均能達(dá)到99%以上,對(duì)中文生僻字或形近字的識(shí)別準(zhǔn)確率約95%以上。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

3、轉(zhuǎn)換成文本后,設(shè)備就通過機(jī)器翻譯技術(shù)將英文單詞或句子翻譯為中文,其中對(duì)整個(gè)文本的翻譯也涉及到了機(jī)器閱讀理解技術(shù),中英翻譯效果能堪比專業(yè)八級(jí)水平。

4、完成文本翻譯并不意味著結(jié)束,訊飛掃描詞典筆還需進(jìn)行一些拓展功能。例如,它需要進(jìn)一步學(xué)習(xí)單詞,除了中文意思外還需掌握單詞的發(fā)音,并基于這個(gè)單詞拓展更多的相關(guān)知識(shí)點(diǎn)推薦給用戶,或者幫助用戶糾正單詞讀音。

這個(gè)過程既應(yīng)用到了常識(shí)推理和知識(shí)發(fā)現(xiàn)技術(shù),也運(yùn)用到了機(jī)器口語評(píng)測(cè)、聲音定位與檢測(cè)等技術(shù)。而一個(gè)單詞從掃描到結(jié)果的呈現(xiàn),整個(gè)響應(yīng)過程只需0.5秒,速度是翻閱紙質(zhì)詞典的20倍以上。如果像我一樣掃描英文段落,完成掃描后的響應(yīng)過程則穩(wěn)定在1秒之內(nèi)。

與此同時(shí),訊飛掃描詞典筆還能實(shí)現(xiàn)離線查詞翻譯,用戶無需聯(lián)網(wǎng)也能使用掃描查詞、語音翻譯、跟讀評(píng)測(cè)、例句朗讀等功能。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

實(shí)際上,訊飛掃描詞典筆與訊飛其他硬件產(chǎn)品的底層技術(shù)是具有通用性的,不少核心技術(shù)的研發(fā)都復(fù)用了訊飛的核心研發(fā)平臺(tái),即便如此,訊飛僅專注于訊飛掃描詞典筆軟硬件研發(fā)的團(tuán)隊(duì),也已達(dá)百人規(guī)模。

但由于訊飛掃描詞典筆交互形態(tài)的不同,訊飛研發(fā)團(tuán)隊(duì)也還需根據(jù)設(shè)備及使用場(chǎng)景的特點(diǎn)進(jìn)行技術(shù)定制,包括前端圖片處理的掃描和拼接、拼接圖片的OCR識(shí)別技術(shù)。

其中,用戶在不同的光照環(huán)境、掃描握持姿勢(shì)、掃描速度/軌跡等條件下,掃描出來的圖片也容易產(chǎn)生畸變,這些都會(huì)給OCR技術(shù)帶來新的挑戰(zhàn)。

另一方面,訊飛掃描詞典筆的純離線處理功能也對(duì)設(shè)備芯片提出更高要求,需要在性能不及手機(jī)芯片的條件下,在本地進(jìn)行快速識(shí)別翻譯并保證良好效果。因此,研發(fā)團(tuán)隊(duì)也對(duì)芯片的部分算子層面和指令層面做了深度優(yōu)化。

不難看出,從底層硬件到算法各個(gè)環(huán)節(jié),訊飛掃描詞典筆已逐步構(gòu)建起了一座屬于自己的AI技術(shù)城池。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

二、17年AI教育市場(chǎng)積累,詞典筆的誕生和軟硬件生態(tài)

“其實(shí)在教育方向,訊飛有著原來B端市場(chǎng)十余年的積累?!钡约┱劦?,從最初開發(fā)訊飛輸入法等互聯(lián)網(wǎng)產(chǎn)品,到2017年起瞄準(zhǔn)智能硬件方向并推出翻譯機(jī)、錄音筆等C端產(chǎn)品,訊飛已積累了不少從硬件研發(fā)到供應(yīng)鏈布局的經(jīng)驗(yàn),以及在B端教育積累的營(yíng)銷和渠道資源。

在翟吉博看來,如果說翻譯機(jī)、錄音筆這些垂直類產(chǎn)品是藍(lán)海市場(chǎng),那么當(dāng)下訊飛正在往競(jìng)爭(zhēng)更激烈的黃海市場(chǎng)遷移,爭(zhēng)取更大的市場(chǎng)空間,而遷移的路徑訊飛選擇了AI技術(shù)與教育的結(jié)合。

之前訊飛在做主打跨語言溝通的翻譯機(jī)產(chǎn)品時(shí)發(fā)現(xiàn),翻譯機(jī)的應(yīng)用還存在一定的場(chǎng)景限制,例如在個(gè)人語言學(xué)習(xí)的場(chǎng)景中,不少用戶仍依賴傳統(tǒng)紙質(zhì)詞典或手機(jī)端翻譯APP來進(jìn)行單詞學(xué)習(xí)和查詢翻譯,而這個(gè)過程需要進(jìn)行跨設(shè)備解決,在一定程度上也影響了自身的學(xué)習(xí)效率。

尤其在K12行業(yè),大多數(shù)孩子還無法隨時(shí)使用手機(jī)APP來查詞翻譯,更需要一個(gè)專用的智能硬件來解決。

因此在2020年疫情影響下,隨著在線學(xué)習(xí)導(dǎo)致電子設(shè)備在家庭自主學(xué)習(xí)場(chǎng)景中的普及,以及家長(zhǎng)對(duì)電子設(shè)備接受度提高,消費(fèi)觀念和使用觀念得到轉(zhuǎn)變,訊飛抓住機(jī)會(huì)推出了訊飛掃描詞典筆,為孩子提供更高效、更低成本的查詞翻譯工具,從而大大提升學(xué)習(xí)效率。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

與此同時(shí),針對(duì)孩子學(xué)習(xí)的復(fù)習(xí)鞏固和課外拓展等需求,訊飛掃描詞典筆在硬件連接和內(nèi)容生態(tài)方面也下了不少功夫。

目前,訊飛掃描詞典筆支持生詞本云端同步,并已和訊飛旗下的學(xué)習(xí)機(jī)、打印機(jī)等設(shè)備打通,方便孩子將積累的生詞本同步到手機(jī)端,或與便攜打印機(jī)等設(shè)備連接,隨時(shí)隨地復(fù)習(xí)和打印。

內(nèi)容方面,訊飛掃描詞典筆覆蓋了朗文詞典等權(quán)威漢英/英漢詞典,還加入了不少課外拓展的聽力內(nèi)容,即便是K12課程也能同步跟上學(xué)習(xí)進(jìn)度。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

三、積極開拓藍(lán)海市場(chǎng),訊飛掃描詞典筆的創(chuàng)新邏輯

在翟吉博看來,目前掃描詞典筆市場(chǎng)本質(zhì)上是對(duì)原來電子詞典品類的一次升級(jí)和替換。

“我們小時(shí)候使用文曲星、快易典等電子詞典上的基礎(chǔ)功能,現(xiàn)在的詞典筆都能實(shí)現(xiàn)。原來電子詞典在便攜性、AI能力、課本輸入效率和成本等方面的不足,在詞典筆上也得到了很好的解決和升級(jí)。”翟吉博談到。

從數(shù)據(jù)層面上看,原來電子詞典市場(chǎng)能實(shí)現(xiàn)千萬級(jí)的年出貨量,但隨著智能手機(jī)的普及,電子詞典的市場(chǎng)規(guī)模逐年衰減,如今年出貨量估計(jì)為百萬級(jí)。

但翟吉博認(rèn)為,詞典筆的誕生一方面能將如今電子詞典的小幾百萬級(jí)市場(chǎng)進(jìn)行替換,另一方面也將吸引更多新用戶接受智能詞典筆這一新品類?!艾F(xiàn)在市場(chǎng)還處于初期階段,但如果再發(fā)展兩、三年,估計(jì)也能達(dá)到大幾百萬、千萬的級(jí)別?!彼f。

盡管詞典筆市場(chǎng)比翻譯機(jī)、錄音筆等市場(chǎng)空間更大,但布局的玩家也相對(duì)更多?!斑@個(gè)市場(chǎng)的特點(diǎn)是消費(fèi)者還處在接受、認(rèn)知和教育的過程,市場(chǎng)也還未出現(xiàn)明顯巨頭,各個(gè)玩家也在并跑階段?!钡约┱J(rèn)為,如何快速普及更多用戶并形成口碑,這一循環(huán)也是掃描詞典筆早期開拓市場(chǎng)的一個(gè)路徑。

那么,相比文曲星、漢王、有道等也在積極布局詞典筆市場(chǎng)的公司,訊飛的差異化優(yōu)勢(shì)在哪?

翟吉博談到,從公司層面看,訊飛多年積累的軟硬一體核心技術(shù),能對(duì)智能錄音筆、翻譯機(jī)等效率工具的體驗(yàn)帶來很大提升,有能力在市場(chǎng)中打造標(biāo)桿性產(chǎn)品。

從產(chǎn)品層面看,訊飛已擁有了自己的一套學(xué)習(xí)產(chǎn)品矩陣,能夠圍繞不同學(xué)習(xí)屬性進(jìn)行產(chǎn)品組合,同時(shí)產(chǎn)品營(yíng)銷上也有不少渠道與合作資源,相比文曲星、漢王更有優(yōu)勢(shì),與有道也能形成相互啟發(fā)的競(jìng)爭(zhēng)關(guān)系。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

除此之外,翟吉博認(rèn)為詞典筆的識(shí)別準(zhǔn)確率和響應(yīng)速度是當(dāng)下市場(chǎng)競(jìng)爭(zhēng)的兩大技術(shù)焦點(diǎn)。

“這兩個(gè)技術(shù)就像蹺蹺板,想要效率又高又快是比較難的?!彼劦剑R(shí)別準(zhǔn)確率高需要更大的存儲(chǔ)和處理器,但成本就上去了,甚至響應(yīng)速度也會(huì)下降。

因此,如何平衡詞典筆的識(shí)別準(zhǔn)確率和響應(yīng)速度,實(shí)現(xiàn)降本增效的同時(shí)達(dá)到最佳綜合體驗(yàn),也是包括訊飛在內(nèi)的每一個(gè)玩家都在思考的問題。

在翟吉博看來,未來訊飛掃描詞典筆的技術(shù)也會(huì)沿著這個(gè)思路迭代,一是單點(diǎn)技術(shù)的針對(duì)性優(yōu)化,包括語音識(shí)別、OCR識(shí)別、語音合成、機(jī)器翻譯等技術(shù);二是各環(huán)節(jié)技術(shù)之間的聯(lián)動(dòng)優(yōu)化,形成端到端的體驗(yàn)提升。

“從核心能力上看,未來我們也會(huì)重點(diǎn)精進(jìn)知識(shí)推薦功能,探索知識(shí)圖譜技術(shù)能否連接詞典筆輸入輸出的交互,以及后續(xù)深度有價(jià)值的內(nèi)容信息推薦。”翟吉博說。同時(shí),面向國際市場(chǎng)的多語言識(shí)別功能和特定行業(yè)人群的專業(yè)領(lǐng)域查詢需求,也將是訊飛持續(xù)探索的方向。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

作為一家在AI語音領(lǐng)域深耕20多年的科技公司,訊飛已構(gòu)建了覆蓋教、學(xué)、考、評(píng)、管五大主場(chǎng)景的智慧教育全棧產(chǎn)品體系,智慧教育產(chǎn)品也已廣泛落地國內(nèi)31個(gè)省級(jí)行政區(qū),與全國超3.8萬所學(xué)校達(dá)成深度合作,幫助學(xué)生更好地提升學(xué)習(xí)效率,實(shí)現(xiàn)因材施教。

“教育本身是挺復(fù)雜的,盡管以學(xué)生為主體,但教育的完整體系包含了多種環(huán)境和角色,如何打通不同環(huán)境之間的學(xué)習(xí)場(chǎng)景,為孩子提供智能個(gè)性化的學(xué)習(xí)方式和建議,形成完整的學(xué)習(xí)閉環(huán),也是我們一直以來的暢想?!钡约┱f。

他認(rèn)為,AI教育的核心涉及了大量的教育資源和內(nèi)容,行業(yè)必須形成一個(gè)完整的產(chǎn)業(yè)鏈,在B端市場(chǎng)中才能更好地針對(duì)不同學(xué)校教學(xué)特點(diǎn)、管理模式做適配,C端市場(chǎng)中也才能根據(jù)不同家長(zhǎng)訴求和孩子體驗(yàn)特點(diǎn)做提升。

一支詞典筆撬起的AI教育革命!0.5秒實(shí)現(xiàn)99%識(shí)別率,訊飛到底牛在哪?

結(jié)語:K12浪潮爆發(fā)下,AI+教育融合打開創(chuàng)新思路

誰能想到一支小小的詞典筆背后,也蘊(yùn)含了大量的AI技術(shù),從AI語音到AI圖像,從識(shí)別、翻譯再到機(jī)器閱讀理解和知識(shí)推薦,每一個(gè)技術(shù)細(xì)節(jié)都能看到訊飛對(duì)科技賦能教育的專注和用心。

但也正是這支詞典筆,引得大量玩家積極涌入,在讓傳統(tǒng)電子詞典市場(chǎng)以新品類、新形態(tài)煥發(fā)生機(jī)的同時(shí),也給AI教育市場(chǎng)的每一位玩家?guī)砀嗵魬?zhàn)。尤其是隨著產(chǎn)品功能的同質(zhì)化發(fā)展,如何讓用戶更低成本地獲得更高效、更完整的產(chǎn)品體驗(yàn),也是每個(gè)企業(yè)不斷提升的方向。

未來,在這場(chǎng)越來越激烈的AI教育競(jìng)賽中,AI賦能的下一個(gè)傳統(tǒng)品類市場(chǎng)會(huì)是什么?誰最終能成功脫穎而出,成為真正引領(lǐng)行業(yè)的風(fēng)向標(biāo)?我們拭目以待。