智東西(公眾號:zhidxcom)
作者 | 吳菲凝
編輯 | 李水青

智東西4月20日消息,AI科技公司出門問問今日在2023 AIGC戰(zhàn)略發(fā)布會上,宣布內測大語言模型“序列猴子”,為國內大模型創(chuàng)業(yè)潮再添一把火。

在大模型能力基礎上,出門問問推出面向創(chuàng)作者的CoPilot產品矩陣,包含四款AIGC產品:AI寫作平臺“奇妙文”、AI繪畫平臺“言之畫”、AI配音平臺“魔音工坊”、數(shù)字人視頻與直播平臺“奇妙元”。

除了面向創(chuàng)作者的產品矩陣之外,出門問問本次還推出了面向C端的升級版語音助手“魔法小問”,據(jù)稱類似于“Siri+ChatGPT”,以及面向B端的企業(yè)專屬大模型。

出門問問創(chuàng)立于2012年,主打語音交互和智能軟硬件研發(fā),代表性產品包括智能手表Ticwatch和高級駕駛輔助系統(tǒng)問問魔眼Ticeye等,主要覆蓋智能穿戴設備、車載、家具等場景。出門問問創(chuàng)始人兼CEO李志飛曾任谷歌美國總部科學家,是機器翻譯開源軟件Joshua的主要開發(fā)者,也是這波大模型創(chuàng)業(yè)潮中備受產業(yè)關注的一位創(chuàng)業(yè)者。

“序列猴子”鏈接為:

openapi.mobvoi.com

一、大模型序列猴子”內測,李志飛只給其打50分?

出門問問大模型“序列猴子”是一款具備多模態(tài)生成能力的大語言模型,模型以語言為核心的能力體系涵蓋“知識、對話、數(shù)學、邏輯、推理、規(guī)劃”六個維度,能夠同時支持文字生成、圖片生成、3D內容生成、語音生成和語音識別等不同任務。

出門問問大模型之所以命名為“序列猴子”,是因為從“無限猴子”定理中汲取了靈感,該定理在20世紀初由數(shù)學家埃米爾·波勒爾提出,即如果有一群猴子在不限定的時間內學習打字機,最終一定能敲出一本完整的莎士比亞作品?!靶蛄泻镒印钡臉嫿ㄔ砼c無限猴子理論類似,通過喂給機器猴子海量的文本序列,再用大規(guī)模的算力去訓練它,就能訓練出一只具有智能的“序列猴子”。

李志飛稱,大模型的“大”絕不僅限于參數(shù)量,他目前沒有透露“序列猴子”參數(shù)量的打算,他也強調,不能一味地以參數(shù)量的大小來評價一個模型,大模型是對于語言的建模,是對于認知邊界的擴展,大模型擁有無限的想象空間。

他直言,GPT-4如今的表現(xiàn)近乎滿分,相比之下“序列猴子”就像是一個需要不斷教他學習的小孩子,目前還只有50分的水平,但他從中看到了“能考上哈佛的潛力”。

目前,“序列猴子”大模型已經(jīng)具備了一定的自然語言理解、知識、邏輯以及推理等能力,對于“湖南和湖北哪一個省會的人口更多?”這類比較復雜的問題能夠快速給出準確結果。

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

李志飛稱,“序列猴子”在訓練過程中已經(jīng)展現(xiàn)出了“涌現(xiàn)”能力,目前正處于“頓悟”階段,未來提升的速度會越來越快。他還認為,做人類的CoPilot(副駕駛)會是大模型最好的“工作”,未來CoPilot將無處不在。

二、構建CoPilot產品矩陣,四大神器助力創(chuàng)作者內容生產

基于“序列猴子”大模型,出門問問內測了多款面向創(chuàng)作者的AIGC產品及應用,為創(chuàng)作者構建一站式CoPilot產品矩陣,打通內容創(chuàng)作全流程。據(jù)官方數(shù)據(jù),目前出門問問注冊用戶超500萬,全球付費用戶超百萬。

1、AI寫作助理:奇妙文

作為發(fā)布會上首個亮相的CoPilot產品,“奇妙文”的AI寫作能力覆蓋了職場辦公、市場營銷、新媒體和創(chuàng)意寫作四大內容創(chuàng)作場景,能夠在用戶撰寫年終總結、客服話術、劇本、廣告文案等內容時,為其源源不斷地提供靈感和創(chuàng)意方向。

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

奇妙文鏈接:write.mobvoi.com

為更好幫助用戶提升內容創(chuàng)作效率,“奇妙文”開放了八大AI編輯功能,分別為風格轉化、要點提取、校對糾錯、續(xù)寫、改寫、擴寫、縮寫、翻譯。“奇妙文”還能在寫作中自動生成圖片,為用戶帶來圖文并茂的寫作體驗。

2、AI繪畫助理:言之畫

面對設計師、插畫師等在文字外對設計有強烈需求的創(chuàng)作者,出門問問內測探索了“言之畫”AI繪畫平臺?!把灾嫛敝С侄卧?、蒸汽朋克、插畫、古風、油畫等8種創(chuàng)作風格。用戶只需輸入文字,“言之畫”就能一次性生成8張光影逼真、細節(jié)豐富的2K高分辨率圖像。

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

言之畫鏈接:paint.mobvoi.com

除了以文生圖,它還擁有以圖生圖、動圖生成、個性頭像生成等AI繪圖能力。面向企業(yè)用戶,“言之畫”還支持專屬模型定制,讓企業(yè)用戶能夠根據(jù)自身需要自定義模型風格,并且支持多人協(xié)作生產,更好地滿足企業(yè)的繪圖需要。

目前,“言之畫”已經(jīng)和家裝設計平臺酷家樂達成了戰(zhàn)略合作。在酷家樂平臺上,用戶在言之畫的幫助下,只需用文字描述出自己的詳細需求,即可更換裝修風格、調整家具位置等,進而設計出自己喜歡的裝修方案。

3、AI配音助理:魔音工坊

面向AI配音場景,出門問問推出了新一代AI配音產品“魔音工坊”以及海外版本DupDub?!澳б艄し弧笔且豢钊鞒桃徽臼紸I配音平臺,已向用戶開放了超1000種音色、超2000種聲音風格以及超20種方言和外語。

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

魔音工坊鏈接:moyin.com

在大模型技術的加持下,“魔音工坊”搭載了大模型AI寫作功能,覆蓋了AI寫作、AI配音和剪輯等多個場景。用戶可以在它的輔助下完成影視解說、有聲書、在線教育、新聞播報等集文案與配音于一體的內容創(chuàng)作。目前,“魔音工坊”已經(jīng)與微信讀書、少年得到、趁早行動、大眾等多領域企業(yè)達成了合作。

“魔音工坊”支持對選定聲音進行包括平靜、悲傷、開心在內的7種情緒的調節(jié),對包括女中年、男孩等在內的10種角色進行遷移,同時還開放了韻律調節(jié)、局部變速、多人配音等AI聲音個性化編輯功能,讓用戶能夠像用word編輯文檔一樣編輯聲音。

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

除了選擇聲音、編輯聲音,基于大模型的語言生成能力,“魔音工坊”還將推出“捏聲音”功能,用戶可以自由選擇性別、年齡、語言、風格和情緒等聲音特征,從0到1創(chuàng)作自己喜歡的聲音。

4、數(shù)字分身:奇妙元

奇妙元鏈接:weta365.com

出門問問大模型“序列猴子”內測,李志飛扔出4款AIGC產品,升級智能語音助手

在文字、圖像、聲音等生成能力基礎上,出門問問還內測發(fā)布了AI數(shù)字形象創(chuàng)作及直播平臺“奇妙元”。

“奇妙元”現(xiàn)有超100款數(shù)字人、超1000款3D數(shù)字資產、超1000種聲音。憑借多模態(tài)生成技術,“奇妙元”平臺目前共支持圖片建模(2D數(shù)字人)、視頻建模(2.5D數(shù)字人)、3D建模(3D數(shù)字人)三種不同形式的數(shù)字人生成。其形象克隆功能,僅需一段5分鐘的真人視頻素材,就可以1:1復刻用戶的形象神態(tài),為用戶打造聲音一致、動作自然的數(shù)字人分身。

三、智能AI助手“魔法小問”,類似于“Siri+ChatGPT”

出門問問在語音助手領域有著深厚的積累,對AI語音的研究可以追溯至十年前:2014年,出門問問發(fā)布了首款語音助手“小問助手”;2015年,更新“小問秘書”;2017年,推出了全場景VPA,并在2019年進行升級。在本次發(fā)布會上,出門問問內測發(fā)布了CoPilot“魔法小問”,李志飛稱,這款智能語音助手可以理解為是“Siri與ChatGPT的綜合體”。

作為面向個人用戶開發(fā)一款智能語音助手,“魔法小問”可以幫助用戶查百科信息、查天氣、查餐廳、查酒店,還能與用戶對話聊天。在現(xiàn)場演示中,向“魔法小問”提問“這附近有哪些好吃的川菜館”時,它能按照遠近距離、評分星數(shù)依次列出附近推薦的川菜餐廳。

據(jù)王志飛介紹,“CoPilot”源自超級助理的概念,它將擁有基于大模型的高智商大腦,能夠分析海量數(shù)據(jù)即時準確地與人類交流;還會擁有動聽的聲音、靚麗的形象,可以搭載任意硬件平臺,如手機、手表、車機等;還能夠適配千行百業(yè),化身高質量教學的老師、知識淵博的律師、專業(yè)的醫(yī)生、金融理財客服等,在需要的時候,隨時隨地展示專業(yè)知識,為人分擔壓力。

四、“序列猴子”開放B端C端生態(tài),首批賦能十大行業(yè)

基于“序列猴子”大模型的底層能力,對于B端用戶和垂直領域,“出門問問Copilot”不僅提供通用能力支持服務和數(shù)字人形象定制服務,還將開放自身角色能力,持續(xù)迭代數(shù)據(jù)接口。有需求的企業(yè)用戶可以登陸網(wǎng)頁端調用API服務,并且能通過上傳文檔的方式,對行業(yè)專有內容進行訓練,從而實現(xiàn)定制化語音交互。

目前,出門問問已經(jīng)與首批十大行業(yè)的內測探索伙伴達成了合作,覆蓋汽車、教育、律所、金融、醫(yī)療、旅游等領域,未來出門問問“CoPilot”將逐步賦能更多行業(yè),助力更多企業(yè)擁有自己的專屬大模型,打造自己的專屬“CoPilot”。

結語:大模型卷起創(chuàng)業(yè)潮,AI加速平民化

時隔三年,出門問問攜中文大模型和AIGC產品亮相,李志飛坦言“序列猴子”與GPT-4的差距不小,但他認為,公司研發(fā)大模型的目的從不是“打造一款中國版ChatGPT”,而是通過這個口號告訴外界他們現(xiàn)在正在研制什么,準備往何處發(fā)展。目前,出門問問推出了AI聲音、AI寫作、AI圖片以及數(shù)字人直播等內容為一體的AIGC SaaS平臺。

國內AIGC創(chuàng)業(yè)潮來襲,李志飛也稱,走在硅谷時幾乎所有的人討論的話題都是“Chat”、“GPT”等。繼百度打響了國內大模型第一槍之后,以知乎等為代表的互聯(lián)網(wǎng)大廠和以商湯、昆侖萬維等為代表的科技公司也紛紛加入其中。

不同于微軟、谷歌等大廠要顛覆傳統(tǒng)的野心,國內多家創(chuàng)企們專注于AIGC的細分賽道,比如聊天對話、音樂生成、協(xié)同辦公以及AI和任何一個專業(yè)領域的融合。在這場大模型的同臺競技中,大模型技術不斷平民化、生活化、場景化,使用門檻降低、認知熟悉程度提升,AIGC有望帶來一場徹底的產業(yè)變革。