智東西(公眾號(hào):zhidxcom)
文 | 韋世瑋

智東西8月25日消息,今天,百度在百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)上發(fā)布語(yǔ)義理解技術(shù)與平臺(tái)文心(ERNIE)、智能文檔分析平臺(tái)TextMind、AI同傳會(huì)議解決方案3項(xiàng)新產(chǎn)品,以及智能創(chuàng)作平臺(tái)和智能對(duì)話定制與服務(wù)平臺(tái)UNIT的多項(xiàng)升級(jí)。

其中,文心基于深度學(xué)習(xí)平臺(tái)飛槳打造,能夠?yàn)橛脩籼峁┮徽臼侥芰Γ瑢殚_發(fā)者減少90%數(shù)據(jù)標(biāo)注量、90%算力投入、85%模型開發(fā)時(shí)長(zhǎng),進(jìn)一步降低NLP定制開發(fā)的成本。

據(jù)了解,這些新產(chǎn)品發(fā)布與升級(jí)覆蓋語(yǔ)言理語(yǔ)言生成、對(duì)話、機(jī)器翻譯4大NLP(自然語(yǔ)言理解)領(lǐng)域重點(diǎn)研究方向。

除此之外,百度CTO王海峰也來(lái)到現(xiàn)場(chǎng),為大家分享百度大腦發(fā)展歷程的同時(shí),也從知識(shí)圖譜、語(yǔ)言理解與生成技術(shù)等方面介紹了百度完整的語(yǔ)言與知識(shí)技術(shù)布局。

值得一提的是,百度還聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì),共同發(fā)起中文自然語(yǔ)言處理數(shù)據(jù)共建計(jì)劃——千言,同時(shí)百度技術(shù)委員會(huì)主席吳華還發(fā)布了百度語(yǔ)言與知識(shí)技術(shù)算力共享計(jì)劃。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

一、三大新品發(fā)布與兩大產(chǎn)品升級(jí),豐富落地應(yīng)用

峰會(huì)上,百度集團(tuán)副總裁吳甜以理解、生成、對(duì)話、翻譯四大方向,分別介紹了三款百度語(yǔ)言與知識(shí)技術(shù)的新產(chǎn)品,以及兩項(xiàng)新升級(jí)。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

1、文心(ERNIE):語(yǔ)義理解技術(shù)與平臺(tái)

2019年,百度發(fā)布了具備持續(xù)學(xué)習(xí)和知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE,語(yǔ)言理解能力得到了大幅提升。而今年,百度在ERNIE核心技術(shù)基礎(chǔ)上延展開發(fā)了語(yǔ)義理解技術(shù)與平臺(tái),并取名為“文心”,意義取自《文心雕龍》。

據(jù)介紹,文心基于深度學(xué)習(xí)平臺(tái)飛槳打造,集成了預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開發(fā)套件和平臺(tái)。文心將減少開發(fā)者90%數(shù)據(jù)標(biāo)注量、90%算力投入、85%模型開發(fā)時(shí)長(zhǎng),為開發(fā)者提供一站式NLP開發(fā)與服務(wù),從而降低NLP定制開發(fā)的成本。

目前,文心已經(jīng)廣泛用于百度產(chǎn)品中,包括搜索引擎、推薦系統(tǒng)、智能音箱、智能客服等。同時(shí),文心已累計(jì)支持超過(guò)20000名開發(fā)者,應(yīng)用場(chǎng)景覆蓋金融、通信、教育、電商等各行各業(yè),顯著提升企業(yè)應(yīng)用效果和效率。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

2、TextMind:智能文檔分析平臺(tái)

TextMind是百度面向企業(yè)文本智能化需求,推出的智能文檔分析平臺(tái),主要面向文檔解析、文書審核等場(chǎng)景。

TextMind的底層基于OCR和NLP技術(shù),以文檔解析為核心能力,支持文檔對(duì)比、文檔審核等功能。同時(shí),TextMind還結(jié)合了知識(shí)圖譜的能力,能幫助企業(yè)在合同審核時(shí)能發(fā)現(xiàn)更多的隱含法律風(fēng)險(xiǎn)。

吳甜介紹,TextMind核心優(yōu)勢(shì)為“多、快、好、省”。

其中,“多”指支持多種格式,TextMind目前可解析6種格式、20類文檔;“快”指顯著提高企業(yè)文檔處理效率,比如,可將企業(yè)報(bào)銷時(shí)間從3-5個(gè)工作日縮短至1分鐘;“好”指效果好,基于TextMind預(yù)置的文檔解析能力,企業(yè)開箱即用,實(shí)現(xiàn)零門檻定制;“省”指文檔規(guī)范化解析可幫助企業(yè)降低人力成本80%以上。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

3、AI同傳會(huì)議解決方案

百度自2017年推出同傳系統(tǒng)以來(lái),其AI同傳已逐步構(gòu)建起較為豐富的產(chǎn)品形態(tài),包括桌面助手、翻譯、同傳功能等。這次百度則面向會(huì)議場(chǎng)景,發(fā)布AI同傳會(huì)議解決方案,覆蓋會(huì)議全場(chǎng)景、全流程。

現(xiàn)場(chǎng),吳甜還為大家展示了如何只用一臺(tái)電腦和一部手機(jī),就能快速搭建一套同傳服務(wù),只需點(diǎn)點(diǎn)鼠標(biāo)、打幾個(gè)字,就能快速獲得專業(yè)的同傳服務(wù)。

值得一提的是,用戶在會(huì)議前可以根據(jù)會(huì)議設(shè)計(jì)的特定領(lǐng)域進(jìn)行屬于定制,來(lái)應(yīng)對(duì)各類專業(yè)議題中獨(dú)有的詞義,讓翻譯更準(zhǔn)確。同時(shí),用戶在會(huì)議中也可以隨時(shí)進(jìn)行術(shù)語(yǔ)干預(yù),并實(shí)時(shí)生效,會(huì)議結(jié)束后還能自動(dòng)生成會(huì)議記錄并保存到網(wǎng)盤中。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

4、百度大腦智能創(chuàng)作平臺(tái)

2019年初,百度上線了智能創(chuàng)作平臺(tái),尤其在媒體行業(yè)進(jìn)行了重點(diǎn)深入,通過(guò)輔助創(chuàng)作和自動(dòng)創(chuàng)作等多項(xiàng)能力,輔助用戶進(jìn)行內(nèi)容創(chuàng)作、圖文轉(zhuǎn)換視頻等工作。

此次,百度大腦智能創(chuàng)作平臺(tái)針對(duì)媒體的應(yīng)用場(chǎng)景,更新了智能策劃、智能采編、智能審校3大媒體場(chǎng)景方案,幫助媒體人更快、更好地進(jìn)行創(chuàng)作。

例如,在智能策劃方面,百度大腦創(chuàng)作平臺(tái)上匯聚了全網(wǎng)數(shù)據(jù)資源,利用知識(shí)圖譜與自然語(yǔ)言處理的技術(shù)對(duì)數(shù)據(jù)深度的理解和分析,圍繞媒體行業(yè)推出系列智能策劃場(chǎng)景方案,高時(shí)效性的匯聚全網(wǎng)主流媒體線索,關(guān)聯(lián)分析得到行業(yè)地域的熱點(diǎn)信息。

自平臺(tái)推出以來(lái),它已自動(dòng)創(chuàng)作文章超過(guò)200萬(wàn)篇,圖文轉(zhuǎn)視頻能力已有7000多用戶,已生產(chǎn)短視頻15萬(wàn)個(gè),相當(dāng)于一個(gè)人至少100年的工作量,并已落地人民日?qǐng)?bào)、央視網(wǎng)等20多家媒體機(jī)構(gòu)。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

5、UNIT:智能對(duì)話定制與服務(wù)平臺(tái)

為了讓開發(fā)者更加高效的獲得高質(zhì)量的對(duì)話理解能力,此次百度升級(jí)了UNIT的3大特性,包括任務(wù)式對(duì)話理解、表格問(wèn)答和新對(duì)話引擎,將數(shù)據(jù)標(biāo)注成本進(jìn)一步降低到30%以上,并融合通用對(duì)話能力提升交互體驗(yàn)。

一是小樣本意圖理解能力升級(jí)。每個(gè)意圖將提供大約10個(gè)標(biāo)注樣本就能達(dá)到高準(zhǔn)確率的意圖識(shí)別,顯著降低數(shù)據(jù)標(biāo)注的成本。

同時(shí),UNIT基于最新升級(jí)的依存句法分析技術(shù)和通用關(guān)鍵詞識(shí)別技術(shù),為開發(fā)者帶來(lái)了詞槽修飾關(guān)系的識(shí)別能力。

二是表格問(wèn)答能力升級(jí)。百度通過(guò)對(duì)表格的分析和自動(dòng)化構(gòu)建,基于表格內(nèi)在知識(shí)能力,能夠自動(dòng)理解用戶提出的問(wèn)題,并分析出相應(yīng)答案。此外表格問(wèn)答還具備較好的口語(yǔ)化交互效果,支持在對(duì)話場(chǎng)景中使用。

例如,開發(fā)者只需上傳業(yè)務(wù)數(shù)據(jù)表格,經(jīng)過(guò)UNIT一分鐘自動(dòng)分析后,產(chǎn)出的問(wèn)答機(jī)器人就可以準(zhǔn)確回答大部分基于這些表格的事實(shí)性問(wèn)題;加之1小時(shí)左右的人工輔助調(diào)優(yōu),問(wèn)答機(jī)器人達(dá)到的水平相當(dāng)于以往通過(guò)至少2周的人工整理FAQ建設(shè)的問(wèn)答系統(tǒng)的水平。

三是新一代融合任務(wù)式對(duì)話和通用對(duì)話引擎。該引擎通過(guò)通用對(duì)話的主動(dòng)式人性化交互,進(jìn)一步提升用戶體驗(yàn),同時(shí)動(dòng)態(tài)分析當(dāng)前對(duì)話進(jìn)程,以適當(dāng)推薦引導(dǎo)的方式嘗試觸發(fā)任務(wù),滿足用戶的具體需求。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

二、百度語(yǔ)言與知識(shí)技術(shù)的十年布局發(fā)展

在王海峰看來(lái),要讓自然語(yǔ)言表達(dá)靈活,其普遍語(yǔ)言結(jié)構(gòu)分析和語(yǔ)義理解難度很大。因此,以語(yǔ)言和知識(shí)為研究對(duì)象,研究如何讓機(jī)器像人一樣掌握知識(shí),理解語(yǔ)言的NLP技術(shù)對(duì)AI技術(shù)的發(fā)展至關(guān)重要。

在現(xiàn)場(chǎng),王海峰向大家分享了百度的語(yǔ)言和知識(shí)技術(shù)在過(guò)去十年是如何布局發(fā)展的。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

▲百度CTO王海峰

“我們始終把握技術(shù)發(fā)展和產(chǎn)業(yè)發(fā)展兩個(gè)趨勢(shì)。”王海峰談到,從研究方法上看,百度初期以規(guī)則和統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù)為主,探索深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)語(yǔ)義匹配框架、多語(yǔ)言神經(jīng)網(wǎng)絡(luò)及翻譯等技術(shù),近兩年還擴(kuò)展到知識(shí)增強(qiáng)的深度學(xué)習(xí)。

從研究對(duì)象上看,詞、短語(yǔ)、句子以及篇章都是百度的研究對(duì)象。

隨著AI技術(shù)的發(fā)展,應(yīng)用場(chǎng)景變的愈發(fā)復(fù)雜,百度的研究對(duì)象也從語(yǔ)言擴(kuò)展到語(yǔ)音、視覺等多模態(tài)信息,探索跨模態(tài)語(yǔ)義理解技術(shù),例如語(yǔ)音一體化、圖像語(yǔ)言一體化等。

從研究方向上看,從語(yǔ)言分析、語(yǔ)言生成、知識(shí)圖譜及翻譯拓展到深度與理解,完整的技術(shù)體系也促進(jìn)了各項(xiàng)技術(shù)的融合發(fā)展。

在百度語(yǔ)言和知識(shí)技術(shù)發(fā)展的過(guò)程中,其技術(shù)已應(yīng)用到搜索、翻譯、地圖、信息流和智能硬件等產(chǎn)品,并廣泛應(yīng)用于金融、醫(yī)療、教育和能源等各行各業(yè),在為社會(huì)提供全方位智能服務(wù)的同時(shí),加速產(chǎn)業(yè)智能化升級(jí)。

歷經(jīng)11年的發(fā)展,如今百度已形成了完整的NLP技術(shù)布局,包括知識(shí)圖譜、語(yǔ)言理解與生成技術(shù),以及應(yīng)用系統(tǒng)等。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

王海峰對(duì)百度NLP技術(shù)布局的部分關(guān)鍵技術(shù)進(jìn)行了解讀,并分享了部分最新進(jìn)展。

1、知識(shí)圖譜技術(shù)

作為機(jī)器認(rèn)知世界的重要基礎(chǔ),知識(shí)圖譜主要以結(jié)構(gòu)化的形式描述真實(shí)世界中的實(shí)體屬性、關(guān)系等。

基于搜索引擎,從多元異構(gòu)的大規(guī)模數(shù)據(jù)中能構(gòu)建非常龐大的知識(shí)圖譜?;诖?,百度提出了一整套構(gòu)建方案,包括無(wú)標(biāo)簽大數(shù)據(jù)、開放知識(shí)挖掘技術(shù)知識(shí)體系、自學(xué)習(xí)技術(shù),以及融合多源異構(gòu)數(shù)據(jù)的知識(shí)補(bǔ)全和整合技術(shù)等。

據(jù)王海峰介紹,如今百度打造了一個(gè)多元異構(gòu)知識(shí)圖譜,擁有超過(guò)50億實(shí)體和5500億事實(shí),并在不斷演進(jìn)和更新,已應(yīng)用于各行各業(yè),每日調(diào)用次數(shù)超過(guò)400億次。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

2、語(yǔ)言理解技術(shù)

在知識(shí)的加持下,百度的語(yǔ)言理解相關(guān)技術(shù)也不斷增強(qiáng)。

百度提出知識(shí)增強(qiáng)的語(yǔ)義理解框架文心(ERNIE),即在深度學(xué)習(xí)的基礎(chǔ)上融入知識(shí),具備人類一樣的學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān),刷新榜單歷史,并且超越人類得分。

同時(shí),百度還研制了知識(shí)增強(qiáng)的跨模態(tài)深度語(yǔ)義理解方法,通過(guò)知識(shí)關(guān)聯(lián)跨模態(tài)信息,運(yùn)用語(yǔ)言描述不同模態(tài)信息的語(yǔ)義,進(jìn)而讓機(jī)器實(shí)現(xiàn)從“看清”到“看懂”、從“聽清”到“聽懂”,即圖像和語(yǔ)言、語(yǔ)音和語(yǔ)言的一體化理解。

在NLP技術(shù)領(lǐng)域,還有一個(gè)重要的任務(wù)是語(yǔ)言生成,主要研究如何讓機(jī)器使用自然語(yǔ)言進(jìn)行表達(dá)和寫作。

百度提出了基于多流機(jī)制的語(yǔ)言生成預(yù)訓(xùn)練技術(shù),在語(yǔ)言生成過(guò)程中兼顧詞、短語(yǔ)等不同粒度的語(yǔ)義信息,顯著提升生成和應(yīng)用效果。

基于語(yǔ)言生成技術(shù),百度還結(jié)合了其他語(yǔ)言和知識(shí)技術(shù),并應(yīng)用到百度智能創(chuàng)作平臺(tái),在各個(gè)環(huán)節(jié)全方位幫助用戶進(jìn)行智能創(chuàng)作。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

隨著百度大腦語(yǔ)言與知識(shí)技術(shù)的廣泛落地應(yīng)用,百度已經(jīng)收獲了許多行業(yè)成果。據(jù)王海峰介紹,百度大腦語(yǔ)言與知識(shí)技術(shù)已獲得包括國(guó)家科技進(jìn)步獎(jiǎng)在內(nèi)的20多個(gè)獎(jiǎng)項(xiàng),30多項(xiàng)國(guó)際競(jìng)賽冠軍,發(fā)表學(xué)術(shù)論文超過(guò)300篇,申請(qǐng)專利2000多項(xiàng)。

未來(lái),隨著NLP技術(shù)的不斷突破創(chuàng)新,百度也將在產(chǎn)品上繼續(xù)保持探索,進(jìn)一步賦能智能搜索、智能推薦、智慧城市、智慧醫(yī)療等各行各業(yè)。

三、發(fā)布兩大計(jì)劃,助力語(yǔ)言與知識(shí)技術(shù)發(fā)展

為了突破語(yǔ)言與知識(shí)技術(shù)在研發(fā)過(guò)程中面臨的數(shù)據(jù)匱乏、算力不足的瓶頸,百度聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)共同發(fā)布全球最大中文自然語(yǔ)言處理“千言”數(shù)據(jù)共建計(jì)劃。

百度發(fā)布五大硬核NLP技術(shù)新品及更新!CTO王海峰談?wù)Z言與知識(shí)技術(shù)十年布局

百度千言目標(biāo)覆蓋更豐富的任務(wù)類型,從語(yǔ)義理解、知識(shí)融合、跨模態(tài)融合等角度推動(dòng)技術(shù)進(jìn)步,同時(shí)提供能進(jìn)行多維度綜合評(píng)價(jià)的數(shù)據(jù)集。

據(jù)百度技術(shù)委員會(huì)主席吳華介紹,千言一期項(xiàng)目由來(lái)自國(guó)內(nèi)11家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設(shè),已涵蓋開放域?qū)υ?、閱讀理解等7大任務(wù),20余個(gè)中文開源數(shù)據(jù)集。

未來(lái)三年,百度計(jì)劃面向超20個(gè)任務(wù),收集和建設(shè)不少于100個(gè)中文自然語(yǔ)言處理數(shù)據(jù)集,覆蓋知識(shí)圖譜、語(yǔ)言理解、語(yǔ)言生成、跨模態(tài)融合、NLP 應(yīng)用系統(tǒng)等多個(gè)領(lǐng)域。

吳華談到,算力是語(yǔ)言與知識(shí)技術(shù)發(fā)展中面臨的另一大挑戰(zhàn),超大規(guī)模深度學(xué)習(xí)模型帶來(lái)顯著效果提升的同時(shí),算力的需求也呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng)。

因此,吳華正式發(fā)布了語(yǔ)言與知識(shí)算力共享計(jì)劃,通過(guò)百度AI STUDIO平臺(tái),百度將提供價(jià)值一億元的免費(fèi)算力支持,幫助廣大開發(fā)者更好地專注技術(shù)創(chuàng)新。

結(jié)語(yǔ):百度NLP技術(shù)版圖的十年布局

如王海峰所說(shuō),語(yǔ)言與知識(shí)技術(shù)是人工智能認(rèn)知能力的核心。回顧這場(chǎng)峰會(huì),我們也能看到過(guò)去十年百度在語(yǔ)言與知識(shí)領(lǐng)域的技術(shù)發(fā)展和產(chǎn)業(yè)布局,如今已逐步構(gòu)建起一套成熟和豐富的NLP技術(shù)版圖。

下一個(gè)十年,百度的NLP技術(shù)布局還會(huì)給我們帶來(lái)哪些驚喜?它能否推動(dòng)行業(yè)離通用人工智能(AGI)的目標(biāo)更近一步?我們拭目以待。