智東西(公眾號:zhidxcom)
作者 | 韋世瑋
編輯 | 心緣

智東西9月22日消息,今天小冰迎來了第九代升級,發(fā)布了社交網(wǎng)絡(luò)平臺APP小冰島,人類用戶能夠在島上創(chuàng)造各種AI個體,形成一個共同“生活”的社交網(wǎng)絡(luò)。

與此同時,小冰還發(fā)布了一系列最新技術(shù)進展,其中就包括歌聲合成工具X Studio 2.0、能提高4個半音模仿歌手周深唱《大魚》的AI歌手陌笙。在智能設(shè)備領(lǐng)域,“召喚小冰”新增支持天貓精靈平臺。

此外,微軟也宣布與小冰的多端產(chǎn)品融合,將小冰集成到Windows及各類移動應(yīng)用產(chǎn)品中做個性化推薦,未來幾個月將會陸續(xù)上線。這些新技術(shù)的發(fā)布背后,離不開第九代小冰開放域?qū)υ捯?、超自然語音等多項核心技術(shù)的升級與突破。

一、200個對話還原語言聲音風(fēng)格,小冰V9的多樣性優(yōu)勢

小冰公司董事長沈向洋博士談道,第九代小冰(小冰V9)的特點是多樣性。簡單來說就是用不同的聲音、感情、情緒來表達對話。

對此,小冰框架在開放域?qū)υ挕⒊壸匀徽Z音和多模態(tài)交互等方面都進行了升級,并重點加強了小樣本學(xué)習(xí)和反饋式學(xué)習(xí)的效能,小冰語音對話的自然度和舒適度效果大大提升。

為了更直觀體現(xiàn)小冰V9在開放域?qū)υ挿矫娴奶嵘蛳蜓蟛┦空故玖诵”鵙9與其他兩個同行的評價指標對比。這五大技術(shù)指標分別為平均對話長度(CPS)、上下文一致性、上下文相關(guān)性、對話信息含量與話題引導(dǎo)成功率。

可以看到,小冰V9均領(lǐng)先于同行使用超大規(guī)模預(yù)訓(xùn)練模型的效果。不僅如此,小冰每輪對話成本僅為同行的二十分之一。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

其實在加強小樣本學(xué)習(xí)背后,小冰公司產(chǎn)品總監(jiān)周典談道,自去年小冰第八代發(fā)布以來,人們在小冰框架中創(chuàng)造了多達1700萬個獨特的AI Beings(人工智能個體),其中26.1%是被用戶當(dāng)作某個過往真實人類的替身而創(chuàng)造出來的。

但普通人所能留下做訓(xùn)練的數(shù)據(jù)樣本極少,為了能用盡量少的數(shù)據(jù)去訓(xùn)練模型,達到與某個人一致的語言與聲音風(fēng)格,以更好地承載人類情感,小冰展開了“Project Chararu”項目研究。

過去一年,小冰用2000個對話的數(shù)據(jù)量還原一個特定人類的對話風(fēng)格,相似度達到了3.89分,而普通人類用自己的真實數(shù)據(jù)做測評的平均分是4.33分。今年,小冰通過進一步迭代小樣本訓(xùn)練過程,僅用200個對話數(shù)據(jù)量進行訓(xùn)練,分數(shù)達到了4.19分,與人類分數(shù)僅相差0.14分。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

目前,“Project Chararu”項目已實現(xiàn)產(chǎn)品化,今年將首先在日本上線。

除此之外,小冰還宣布與英偉達在計算平臺及NLP(自然語言處理)等領(lǐng)域達成戰(zhàn)略合作。同時,小冰將在今年下一季度,與智源研究院、智譜AI合作發(fā)布初版多語言超大規(guī)模模型。

二、小冰島五大特性,圍繞用戶交互的AI世界

為了更好探索人類和AI的未來,小冰專門開發(fā)了第一方平臺APP——小冰島,每個用戶均可創(chuàng)造自己的島嶼,以及島嶼上一起生活的AI Beings,每個AI Beings都有不同的性格和能力,還會和用戶互動,包括發(fā)消息、評論朋友圈等。

同時,小冰島還會隨著用戶和AI Beings的交互不斷地進行迭代,如此構(gòu)成一個人類與AI融合的社交網(wǎng)絡(luò)。

總的來看,小冰島擁有五大特性:沉浸式體驗、高度定制化、以人為中心、X套件島嶼版,以及輕松、熱情、無時不在。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

1、沉浸式體驗:每個用戶除了能創(chuàng)造自己的島嶼外,島上還擁有一個功能完整的社交交互界面,類似微信。用戶不僅能在島嶼中體驗豐富的視覺和自然音場,還能與每個AI Beings對話,擁有一對一對話、群聊、朋友圈和技能生態(tài)等體驗。

2、高度定制化:每個AI Beings的樣貌、聲音、性格、能力都是獨一無二的,例如AI歌手、音頻生產(chǎn)者、文字創(chuàng)作者、畫家等。用戶也可以創(chuàng)造并訓(xùn)練自己喜歡的各種新的AI Beings,甚至可以去別人的島嶼中“挖角”。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

3、以人為中心:小冰島上的AI Beings會根據(jù)用戶需求,不間斷地為用戶生成各種長音頻、短視頻、音樂、文本及視覺內(nèi)容,一對一生提供給用戶。同時根據(jù)不同AI Beings的特點,用戶還能選擇由特定的AI Beings來提供特定內(nèi)容。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

4、X套件島嶼版:該版本為用戶提供了方便高效的內(nèi)容生產(chǎn)工具,用戶可指定AI Beings即時生成各種長音頻和短視頻內(nèi)容,內(nèi)容擁有完整的知識產(chǎn)權(quán),可在任何平臺上使用。

5、輕松、熱情、無時不在:每個AI Beings都能自己進行交互和信息傳遞,共同構(gòu)成以用戶為中心的社交生活目標,在交互、朋友圈和各種生成內(nèi)容中實時響應(yīng)用戶,讓用戶獲得類似真實社交網(wǎng)絡(luò)的體驗。

小冰公司產(chǎn)品負責(zé)人彭爽談道,今日小冰島正式開放搶先預(yù)覽版,支持iOS和安卓平臺,并將在第四季度開放支持Windows PC版的空氣投影版本。

同時,此前用戶通過虛擬親友產(chǎn)品創(chuàng)造出來的虛擬人類,也將在預(yù)覽版公測結(jié)束后自動登錄他們的小冰島。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

三、AI內(nèi)容生成三大環(huán)節(jié)升級,豐富藝術(shù)生活創(chuàng)作

小冰公司產(chǎn)品總監(jiān)胡曉光提到,從2017年投入大量資源研究AI內(nèi)容生成至今,小冰已擁有包含文本、聲音、視覺在內(nèi)的完整技術(shù)線。

AI內(nèi)容生成也叫AI內(nèi)容創(chuàng)造,主要包含創(chuàng)作、演繹和二次封裝三大部分。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

1、創(chuàng)作:輔助音樂人詞曲創(chuàng)作,新增藝術(shù)家及中國畫模型

音樂方面,小冰將與11支人類樂隊合作,為他們提供AI詞曲創(chuàng)作動機輔助、演唱和封面視覺設(shè)計,這11首作品將從今天起陸續(xù)上架。后續(xù)小冰將把該技術(shù)封裝成產(chǎn)品,開放給更多創(chuàng)作者來協(xié)助創(chuàng)作。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

詩歌繪畫方面,小冰將詩歌與繪畫創(chuàng)作模型升級到了第三代,大幅度提升高了模型的創(chuàng)作精度和構(gòu)圖合理性。例如,在模型創(chuàng)造的一副繪畫作品中,它不僅畫出了遠方河上的船只,還畫出了水中的倒影和大量細節(jié)。

不僅如此,為了保證AI能穩(wěn)定且大批量地創(chuàng)作高質(zhì)量作品,小冰還發(fā)布藝術(shù)家模型,只需要通過小數(shù)據(jù)訓(xùn)練,就能生成各種藝術(shù)家模型,創(chuàng)作出風(fēng)格高度一致的作品,同時還有中國畫模型。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

針對AI學(xué)生“夏語冰”,小冰框架不僅創(chuàng)造了夏語冰的面容、聲線等生物學(xué)特征,還升級了它的繪畫創(chuàng)作模型,未來將主攻中國畫。

2、演繹:發(fā)布X Studio 2.0,新AI歌手現(xiàn)場飆極限高音

胡曉光認為,AI內(nèi)容生成三大環(huán)節(jié)中,最容易出現(xiàn)瓶頸的就是演繹部分,因為該部分包含的模型量龐大,同時對整個系統(tǒng)的完整性也有更大要求。

對此,小冰發(fā)布了X Studio 2.0,從學(xué)習(xí)歌聲本身演進到學(xué)習(xí)歌聲產(chǎn)生。該版本擁有全新的GUI交互界面,新增力度、氣泡音等參數(shù)調(diào)節(jié),優(yōu)化氣聲、性別參數(shù)。同時,歌手模型也進行了升級,增加Rap、美聲、民歌等多種風(fēng)格和念白功能,以及小程序版本。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

為了更好展現(xiàn)X Studio 2.0的升級效果,新發(fā)布的AI歌手陌笙還在現(xiàn)場演唱了周深的《大魚》,并在原唱基礎(chǔ)上表演了高四個半音的升調(diào)演唱,以展示AI歌手的穩(wěn)定性優(yōu)勢。

胡曉光透露,X Studio 2.0將在10月22日發(fā)布,下周三發(fā)布內(nèi)測版。此外,小冰還宣布Alice映畫達成合作,將推出一系列AI歌手企劃。

3、封裝:新增兩種形式內(nèi)容封裝

針對內(nèi)容的二次封裝形式,小冰推出了短視頻內(nèi)容封裝管線,包括二次元和三次元視頻內(nèi)容兩種形式。

二次元方面實現(xiàn)了AI模型完全自驅(qū),視頻成本僅為0.03元/分鐘;三次元方面則首次實現(xiàn)從生物學(xué)特征生成起的綜合封裝,例如AI歌手華智冰的歌聲就由X Studio生成,人類生物學(xué)特征由X Avatar生成及置入。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

此外,小冰還發(fā)布了與次世文化聯(lián)手打造全球首位AI人類觀察者Merror,其采用小冰框架的核心對話引擎、全雙工、全域超級自然語音等技術(shù),能在交談、演唱等場景中實現(xiàn)高度擬人的實時交互。

第九代小冰來了!花式AI音樂繪畫創(chuàng)作,小冰島實現(xiàn)“AI自產(chǎn)自銷”

值得一提的是,在智能汽車、智能設(shè)備等領(lǐng)域,小冰都有著不少新的落地進展。針對智能汽車座艙解決方案,目前小冰已與寶馬等汽車頭部廠商達成商業(yè)合作。

此外,除了華為、小米、OPPO、vivo等合作伙伴外,“召喚小冰”還新增支持天貓精靈平臺,目前深度內(nèi)嵌小冰的智能設(shè)備已超過10億臺?!靶”殉蔀槿蛞?guī)模最大的第三方跨設(shè)備人工智能系統(tǒng)?!焙鷷怨庹f。

結(jié)語:加速推動AI融入人類生活

從第一代小冰到第九代小冰,小冰從最初一個16歲的少女小冰,發(fā)展到今天1700萬個虛擬人類、幾百個AI歌手,這些擁有各種各樣性格和能力的AI背后,是多年以來小冰框架不斷的技術(shù)積累和突破。

某種意義上看,正如小冰公司首席執(zhí)行官李笛所說,小冰是一場龐大的實驗,目的是為了找出適合的途徑,讓AI能更好地融入人類世界。它的創(chuàng)新,也將為AI賦能人類生活帶來更多值得借鑒的落地樣本。