智東西(公眾號(hào):zhidxcom)
作者 | 云鵬
編輯 | 漠影

今天,AI視頻模型火爆全球,呈現(xiàn)出百家爭(zhēng)鳴的態(tài)勢(shì)。雖然Sora姍姍來(lái)遲,卻還是在上線當(dāng)天就被擠爆了服務(wù)器。

國(guó)外有Runway、Luma AI這樣的老牌玩家,國(guó)內(nèi)則有各路AI創(chuàng)企和互聯(lián)網(wǎng)科技巨頭接連亮出自家的“中國(guó)造Sora”,各種AI生成視頻越來(lái)越多地出現(xiàn)在大眾視野中。

愛(ài)詩(shī)科技、生數(shù)科技、Minimax等AI創(chuàng)企不斷掏出新策略、新功能、新玩法輪番轟炸,而科技大廠字節(jié)跳動(dòng)、快手也入場(chǎng)攪局。

▲由愛(ài)詩(shī)科技旗下PixVerse v3.5生成

與此同時(shí),AI視頻生成技術(shù)也在快速迭代發(fā)展,競(jìng)爭(zhēng)來(lái)到新的階段。AI視頻模型的競(jìng)爭(zhēng)開始從能用到好用,視頻生成的速度、質(zhì)量成為核心競(jìng)爭(zhēng)焦點(diǎn);另一邊,視頻生成也不局限于文字,隨手發(fā)一張圖就能生成精美視頻已經(jīng)成為現(xiàn)實(shí)。

在這批AI視頻生成開拓者們中間,國(guó)內(nèi)愛(ài)詩(shī)科技旗下PixVerse已成為跑的最快的一家,并在全球市場(chǎng)立下了良好口碑。PixVerse App海外市場(chǎng)一經(jīng)上線,在多個(gè)國(guó)家殺入下載榜前列甚至位列榜首。

從上個(gè)月剛剛火爆全網(wǎng)、朋友圈頻頻刷屏的“毒液特效”視頻,到12月“猛男肌肉特效”視頻,這些“經(jīng)典”都出自PixVerse之手,二者在生成總量上超過(guò)幾百萬(wàn)次,在海外Tiktok平臺(tái)曝光量已經(jīng)過(guò)億,其在全球范圍的熱度甚至一度超越了Runway和Sora。

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲谷歌搜索熱度趨勢(shì)圖,來(lái)源:Google Trends

在C端取得如此驕人戰(zhàn)績(jī)后,PixVerse繼續(xù)加快腳步,開“卷”專業(yè)AI創(chuàng)作能力,最近PixVerse的v3.5模型版本已經(jīng)正式發(fā)布。

不少海外AI專業(yè)創(chuàng)作者和藝術(shù)家都在體驗(yàn)測(cè)試版的過(guò)程中給出了極高的評(píng)價(jià),稱3.5版本具有非常高的靈活性、富有創(chuàng)意,并且動(dòng)畫效果著實(shí)很贊。

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲AI藝術(shù)家Pierrick Chevallier

正式上線后,立刻有不少用戶亮出了自己的得意新作,效果還是比較驚艷的:

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲來(lái)自X平臺(tái)用戶Alfred Cadoux

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲來(lái)自X平臺(tái)AI創(chuàng)作者AZIZ

智東西也提前體驗(yàn)了PixVerse v3.5的內(nèi)測(cè)版本,其生成速度領(lǐng)先數(shù)倍于競(jìng)品,畫面細(xì)節(jié)滿滿、想象力豐富,動(dòng)漫效果更是一騎絕塵,可以說(shuō)十分驚艷。從日常娛樂(lè)到專業(yè)創(chuàng)作,AI視頻生成正愈發(fā)深度地走進(jìn)我們的生活。

一、5秒光速出圖,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

為了感受PixVerse生成視頻速度之快,我們首先挑選了一個(gè)日常生活中常常會(huì)遇到的輕負(fù)載高頻次的場(chǎng)景——讓表情包動(dòng)起來(lái),直接讓一些靜態(tài)梗圖變成動(dòng)圖!

根據(jù)我們實(shí)際體驗(yàn),在極速(Turbo)模式下,利用一張常見表情包生成視頻的時(shí)間最短只有5秒左右,平均在8秒左右。

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

從生成效果來(lái)看,基本的描述都可以比較準(zhǔn)確地實(shí)現(xiàn),角色的肢體動(dòng)作比較自然,遮擋關(guān)系都非常正確,尤其適合做表情包。

雖然在個(gè)別案例中,一些視頻生成模型常見的細(xì)節(jié)穿模問(wèn)題還有待優(yōu)化,但能在10秒之內(nèi)生成如此質(zhì)量的視頻,在體驗(yàn)上已經(jīng)是一種跨越式提升了。

我們也對(duì)比了國(guó)外的AI視頻生成老大哥Runway,不得不說(shuō),Runway在速度這塊的確沒(méi)輸多少,也比較快,但生成視頻質(zhì)量卻與PixVerse存在不小差距。生成效果甚至很難達(dá)到“可用”狀態(tài)。

▲基于相同圖片和提示詞,Runway生成結(jié)果

這種犧牲質(zhì)量換速度的策略顯然存在很大風(fēng)險(xiǎn),稍不留神就會(huì)“翻車”。

相比Runway,國(guó)內(nèi)的可靈、海螺,生成同樣主題視頻的質(zhì)量會(huì)好一些,與PixVerse相對(duì)接近,但是在速度上卻慢了不少,平均生成時(shí)間都在2-3分鐘之間,個(gè)別速度較快的案例可以在1分鐘左右。

值得一提的是,PixVerse生成視頻的速度并不是用質(zhì)量換來(lái)的,整體對(duì)比下來(lái),PixVerse的生成質(zhì)量、對(duì)描述的還原程度,在大部分測(cè)試中都是最高的。

海外AI藝術(shù)家Volodymyr Cherner也亮出了自己的最新作品,他評(píng)論稱,PixVerse可以在1分鐘內(nèi)生成1080P的高清視頻,而不像其他產(chǎn)品一樣需要8-10分鐘,可以說(shuō)是既快又好的代表了。

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲Volodymyr Cherner作品

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲Volodymyr Cherner作品

所以,高效且高質(zhì)量的視頻生成能夠帶來(lái)什么?

最顯而易見的就是效率的提升,進(jìn)而可以轉(zhuǎn)化成實(shí)際生產(chǎn)中的經(jīng)濟(jì)效益提升。

但即使是1分鐘,也與PixVerse存在數(shù)倍的速度差距,10秒與2分鐘之間的差別,帶來(lái)的就是十幾倍的生產(chǎn)效率提升。

同樣時(shí)間內(nèi),PixVerse可以給創(chuàng)作者提供更多的創(chuàng)作機(jī)會(huì),發(fā)覺(jué)更多靈感和創(chuàng)意,大幅增加優(yōu)質(zhì)素材產(chǎn)出的概率、提高效率。

OpenAI的Sora在測(cè)試階段,就曾因視頻生成速度太慢的問(wèn)題飽受詬病,初期Sora甚至需要10多分鐘才能生成一段1分鐘視頻。Luma AI的Dream Machine發(fā)布后,很多用戶甚至需要排隊(duì)等待數(shù)小時(shí)才能得到生成的視頻,這無(wú)疑大大消耗了用戶的耐心,讓體驗(yàn)打折扣。

相比之下,PixVerse可以幾秒、十幾秒生成視頻,這種體驗(yàn)讓AI視頻生成真正變得更普及,我們可以隨時(shí)隨地利用AI生成視頻并與他人交流、分享、使用。

二、解密底層模型升級(jí):運(yùn)動(dòng)控制、細(xì)節(jié)表現(xiàn)出眾,動(dòng)漫創(chuàng)作效果行業(yè)第一

正如前文所說(shuō),“快”只是PixVerse的一個(gè)核心優(yōu)勢(shì),其在生成質(zhì)量方面的表現(xiàn)也可圈可點(diǎn),尤其是在運(yùn)動(dòng)控制、細(xì)節(jié)呈現(xiàn)以及動(dòng)漫/動(dòng)畫效果的表達(dá)上十分亮眼。

首先是運(yùn)動(dòng)控制的穩(wěn)定性。比如在這個(gè)山路騎行的視頻中,人物騎行的動(dòng)作十分自然,車輛行駛的軌跡也控制的比較好,遠(yuǎn)處的背景與騎行者的關(guān)系也保持的比較穩(wěn)定,鏡頭跟隨效果自然。

在滑板視頻中,滑板的運(yùn)動(dòng)軌跡展現(xiàn)是極為困難的,同時(shí)模型對(duì)人物肢體動(dòng)作的控制和展現(xiàn)也都表現(xiàn)的比較好,沒(méi)有出現(xiàn)明顯的不協(xié)調(diào)或違和感。

接下來(lái),我們來(lái)看看PixVerse模型對(duì)細(xì)節(jié)的表現(xiàn)力,以及非現(xiàn)實(shí)創(chuàng)作能力。

在這組圣誕老人在紐約都市夜晚送圣誕禮物的視頻中,我們選擇了3D動(dòng)畫模式,模型表現(xiàn)出了出色的非現(xiàn)實(shí)畫面創(chuàng)作能力,對(duì)于圣誕老人會(huì)以何種形式出現(xiàn)在大都市中,模型給出了很好的答案。

同時(shí),圣誕老人的形象可愛(ài)逼真,馴鹿的運(yùn)動(dòng)姿態(tài)很自然,符合常理。在雪橇滑行過(guò)程中,我們甚至可以看到很多細(xì)節(jié),比如雪橇的顛簸、雪花輕輕濺起、陰影自然跟隨。

在另一個(gè)北極熊在極光下做冰雕的視頻中,3D動(dòng)畫版的北極熊憨態(tài)可掬,十分可愛(ài),其毛發(fā)柔順細(xì)密仿佛觸手可及,同時(shí)北極熊手握冰雕工具的姿態(tài)也十分準(zhǔn)確,進(jìn)行雕刻的動(dòng)作也十分自然真實(shí),另外冰雕中的光線映射也比較擬真。

模型可以很好地想象出本不可能存在的場(chǎng)景,并將一些基本的動(dòng)作和細(xì)節(jié)的刻畫都做到位。

在另外兩組現(xiàn)實(shí)人物面部特寫視頻中,模型一方面可以非常高質(zhì)量的呈現(xiàn)人物面部細(xì)節(jié),比如膚質(zhì)、毛孔,同時(shí)模型可以準(zhǔn)確呈現(xiàn)我們描述的人物神態(tài),比如驚恐或是平靜。

火光在人物面部的映射,視頻背景的自然虛化,這些細(xì)節(jié)也都做的比較到位。

在動(dòng)漫、動(dòng)畫創(chuàng)作方面,我們還讓PixVerse生成了一組海賊王主題的視頻,視頻中路飛和娜美在船頭激情碰拳,模型可以準(zhǔn)確還原動(dòng)漫人物的標(biāo)志性特點(diǎn),角色的配色都沒(méi)有問(wèn)題,同時(shí)動(dòng)作自然沒(méi)有違和感。

在一組動(dòng)漫風(fēng)格的賽車追逐戰(zhàn)視頻中,漫畫中常見的速度感、力量感線條表達(dá)被很好地呈現(xiàn)了出來(lái),車輛的運(yùn)動(dòng)、鏡頭的運(yùn)鏡都處理的十分到位。

可以看到,在動(dòng)漫、動(dòng)畫創(chuàng)作方面,PixVerse的表現(xiàn)是十分驚艷的。據(jù)了解,目前PixVerse的動(dòng)漫動(dòng)畫視頻創(chuàng)作效果SOTA行業(yè)第一。

最后,PixVerse的視頻生成還支持首尾幀功能,用3D數(shù)字藝術(shù)家Travis Davids的話來(lái)說(shuō),兩幅構(gòu)圖相近的圖像放在一起非常有趣,就像變魔術(shù)一樣。

最快5秒光速出片,全球首個(gè)接近實(shí)時(shí)生成的AI視頻模型來(lái)了

▲Travis Davids作品,下方圖片為首尾幀

整體來(lái)看,PixVerse 3.5版本的升級(jí)帶來(lái)了非常直觀的用戶體驗(yàn)提升,其兼顧了生成速度和畫質(zhì),在細(xì)節(jié)表現(xiàn)上十分出眾,動(dòng)畫動(dòng)漫效果成為其突出優(yōu)勢(shì)之一。結(jié)合極具性價(jià)比的價(jià)格,不論是對(duì)大眾消費(fèi)者還是專業(yè)創(chuàng)作者,PixVerse無(wú)疑都是當(dāng)下國(guó)內(nèi)AI視頻生成領(lǐng)域的更優(yōu)選擇。

結(jié)語(yǔ):AI視頻大模型競(jìng)爭(zhēng)升級(jí),從能用走向普及好用

如今,AI大模型技術(shù)的發(fā)展已經(jīng)從比拼參數(shù)走向比拼商業(yè)化落地,如何真正給消費(fèi)者和企業(yè)帶來(lái)好的體驗(yàn),真正賦能生產(chǎn)力、提升生產(chǎn)效率,成為競(jìng)爭(zhēng)焦點(diǎn)。AI視頻生成賽道也不例外。

相比姍姍來(lái)遲吊足胃口的Sora,國(guó)內(nèi)外一眾AI創(chuàng)企和科技巨頭都已亮出各種產(chǎn)品,像PixVerse這樣的年輕力量已經(jīng)走向世界舞臺(tái)并斬獲佳績(jī)。愛(ài)詩(shī)科技憑借底模的升級(jí),在速度顛覆性提升的基礎(chǔ)上兼顧質(zhì)量,將AI視頻模型生成從能用帶向好用。

今天,AI視頻生成工具這把火正越燒越旺,消費(fèi)者認(rèn)知度也越來(lái)越強(qiáng),隨著“內(nèi)卷”的加劇,企業(yè)想要真正殺出重圍,還是要靠技術(shù)硬實(shí)力說(shuō)話。體驗(yàn)好不好,消費(fèi)者自會(huì)用腳投票。