AI應(yīng)用風(fēng)向標(biāo)(公眾號(hào):ZhidxcomAI)
作者|江宇
編輯|漠影

智東西1月29日?qǐng)?bào)道,前日,騰訊搜狗輸入法正式宣布全面AI化,升級(jí)發(fā)布20.0 AI大版本,AI語(yǔ)音、AI翻譯、AI打字三大模型全面升級(jí)。

這是搜狗輸入法20年來(lái)超大幅度的一次版本更新:

在語(yǔ)音方面,主打“更快、更準(zhǔn)、更輕聲可用”,新增“口語(yǔ)轉(zhuǎn)書面語(yǔ)”能力,支持將散亂口語(yǔ)內(nèi)容自動(dòng)轉(zhuǎn)為規(guī)范書面語(yǔ),優(yōu)化“的地得”“他她它”等常見(jiàn)混淆字詞的候選替換

在翻譯方面,引入騰訊混元翻譯大模型,支持30多種語(yǔ)言實(shí)時(shí)“輸入即譯”。

在AI打字方面,模型升級(jí)增強(qiáng)語(yǔ)境理解,詞庫(kù)實(shí)現(xiàn)天級(jí)更新,支持多個(gè)垂類場(chǎng)景高效補(bǔ)詞。

而對(duì)于困擾用戶的廣告問(wèn)題,移動(dòng)端新增“一鍵關(guān)閉鍵盤廣告”功能,PC端該功能預(yù)計(jì)于2月上線。

此前版本的搜狗輸入法,已陸續(xù)上線AI幫寫、AI搜索、AI合成表情、圖文識(shí)別、混元圖搜等功能,其中圖搜請(qǐng)求量已達(dá)數(shù)億次。

目前,搜狗輸入法的AI用戶規(guī)模破億,日均語(yǔ)音使用次數(shù)近20億,現(xiàn)居輸入法行業(yè)第一。

那么,這個(gè)“最強(qiáng)AI大版本”到底升級(jí)了什么?我們實(shí)際體驗(yàn)了一遍。

一、語(yǔ)音打字:輕聲能用,口語(yǔ)能潤(rùn)色,但長(zhǎng)段與粵語(yǔ)還有明顯短板

在辦公室午休場(chǎng)景下,我們輕觸鍵盤上方的麥克風(fēng),用明顯低于正常說(shuō)話音量的方式輸入“會(huì)議總結(jié)需要明天早上發(fā)”。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

在這種輕聲輸入條件下,搜狗輸入法可以穩(wěn)定完成識(shí)別,文本無(wú)需二次校對(duì),確實(shí)可用,適合在安靜環(huán)境中臨時(shí)處理消息。

隨后,我們刻意測(cè)試了一段結(jié)構(gòu)混亂、表達(dá)跳躍的口語(yǔ)內(nèi)容:“那個(gè)誰(shuí)就說(shuō)要不你別去了我也不去了那你去嗎?!?/p>

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

在“口語(yǔ)轉(zhuǎn)書面語(yǔ)”自動(dòng)功能下,系統(tǒng)會(huì)對(duì)原句進(jìn)行整體整理,補(bǔ)全標(biāo)點(diǎn)并調(diào)整語(yǔ)序,輸出一段相對(duì)通順的書面表達(dá)。

與此同時(shí),搜狗輸入法的問(wèn)題主要出現(xiàn)在長(zhǎng)語(yǔ)音與方言場(chǎng)景。

我們嘗試連續(xù)朗讀幾十秒《甄嬛傳》原文臺(tái)詞,系統(tǒng)在斷句、用詞和人名識(shí)別上出現(xiàn)多處錯(cuò)誤,整體穩(wěn)定性不足。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

在粵語(yǔ)測(cè)試中,即便在語(yǔ)音設(shè)置中切換至粵語(yǔ)模式,并且設(shè)置為語(yǔ)音輸入不限時(shí)長(zhǎng),最終輸出內(nèi)容僅為一兩句,且準(zhǔn)確率不高。多次調(diào)整后,體驗(yàn)并未明顯改善。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

整體來(lái)看,搜狗輸入法此次語(yǔ)音升級(jí)在輕聲輸入、短句口語(yǔ)整理方面確實(shí)有進(jìn)步,但在長(zhǎng)段連續(xù)語(yǔ)音和粵語(yǔ)等方言識(shí)別上仍存在明顯提升空間。

二、翻譯模塊:打字、語(yǔ)音、復(fù)制都能譯,但操作鏈仍偏長(zhǎng)、流程有待打磨

外語(yǔ)聊天場(chǎng)景中,我們點(diǎn)擊鍵盤上的翻譯入口,開(kāi)啟“快捷翻譯”功能,直接在輸入框內(nèi)輸入“你是全世界最耀眼的星星!”。

此時(shí),輸入的中文內(nèi)容會(huì)在輸入過(guò)程中實(shí)時(shí)轉(zhuǎn)為韓語(yǔ),翻譯結(jié)果與打字幾乎同步出現(xiàn),整體體驗(yàn)接近“邊打邊譯”,適合在聊天軟件中直接發(fā)送外語(yǔ)內(nèi)容。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

在海外出行的模擬場(chǎng)景中,我們嘗試通過(guò)語(yǔ)音完成實(shí)時(shí)翻譯,對(duì)著手機(jī)說(shuō)出“150泰銖可以嗎?可以的話,我多買一條!”。

系統(tǒng)會(huì)先進(jìn)行語(yǔ)音識(shí)別,再輸出對(duì)應(yīng)的泰語(yǔ)文本,理論上可以完成“現(xiàn)場(chǎng)同傳”。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

但實(shí)際體驗(yàn)中,這一流程并不算順暢:需要先在“快捷翻譯”中手動(dòng)選擇“中泰互譯”,再點(diǎn)擊麥克風(fēng)開(kāi)始輸入,過(guò)程中偶爾會(huì)出現(xiàn)語(yǔ)言模式被重置、需要重新選擇的情況,連續(xù)使用時(shí)穩(wěn)定性一般。

在閱讀外文內(nèi)容場(chǎng)景下,我們測(cè)試了“剪切板翻譯”這一功能。

以法語(yǔ)原文《小王子》中的句子 “C’est le temps que tu as perdu” 為例,復(fù)制文本后,搜狗輸入法可以識(shí)別到剪切板內(nèi)容,但并不會(huì)直接給出翻譯結(jié)果。

用戶需要先點(diǎn)擊文本右側(cè)的“拆”字按鈕,對(duì)句子進(jìn)行涂抹選擇,再點(diǎn)擊右上角的“譯”,系統(tǒng)才會(huì)跳轉(zhuǎn)至搜狗翻譯頁(yè)面顯示中文釋義,最終還需要手動(dòng)復(fù)制譯文返回原文界面。

騰訊搜狗輸入法全面AI化!一手體驗(yàn)來(lái)了

從結(jié)果來(lái)看,翻譯質(zhì)量本身沒(méi)有明顯問(wèn)題,句意準(zhǔn)確、語(yǔ)氣自然,但在操作路徑上,不同翻譯方式之間的入口較為分散:邊打邊譯、語(yǔ)音翻譯、剪切板翻譯各自獨(dú)立,且部分步驟需要多次確認(rèn)或跳轉(zhuǎn),對(duì)使用來(lái)說(shuō)略顯繁瑣。

整體而言,搜狗輸入法當(dāng)前的AI翻譯更像是能力已經(jīng)就位,但交互仍在功能拼裝階段,距離“隨手用”的狀態(tài),還有一定優(yōu)化空間。

寫在最后:

搜狗輸入法的這次更新中,我們也能對(duì)AI打字功能進(jìn)行了完整的體驗(yàn)。

在這3天中,我們將其作為主力輸入法使用,以實(shí)際效果來(lái)看,AI模型對(duì)拼音縮寫的識(shí)別能力,還是較為依賴個(gè)人輸入習(xí)慣,聯(lián)想效果存在一定波動(dòng),不過(guò)整體表現(xiàn)穩(wěn)定、比較“跟手”。

整體來(lái)看,本次體驗(yàn)中,語(yǔ)音輸入在“輕聲說(shuō)話”和“短句轉(zhuǎn)書面語(yǔ)”方面表現(xiàn)出色,但在長(zhǎng)語(yǔ)音轉(zhuǎn)寫、方言識(shí)別上的能力尚不成熟。

翻譯功能雖然覆蓋方式多樣,但多個(gè)入口較為割裂,部分流程還依賴手動(dòng)跳轉(zhuǎn)和復(fù)制,不夠一體化。

需要說(shuō)明的是,本次測(cè)試基于iOS端,而在安卓端,搜狗輸入法已上線包括“易混音智能替換”等更多AI新功能,實(shí)際體驗(yàn)或會(huì)有所差異。

據(jù)搜狗輸入法團(tuán)隊(duì)透露,后續(xù)該版本還將持續(xù)密集迭代。