智東西(公眾號(hào):zhidxcom)
編輯 | Panken

智東西1月15日?qǐng)?bào)道,今日,生數(shù)科技發(fā)布視頻大模型Vidu 2.0,將視頻大模型的價(jià)格進(jìn)一步打下來(lái)。

Vidu 2.0的核心升級(jí)包括:速度上,視頻生成速度跑進(jìn)10秒;?價(jià)格上,生成單秒視頻僅需4分錢,同時(shí)上線“錯(cuò)峰模式”,支持閑時(shí)不限量生成,不卡積分、不卡條數(shù);?模型效果首尾幀流暢,風(fēng)格和多主體保持更穩(wěn)定,鏡頭運(yùn)動(dòng)表現(xiàn)出色。

▲國(guó)外用戶生成的Vidu不同版本對(duì)比視頻

此外,Vidu研發(fā)團(tuán)隊(duì)也罕見(jiàn)公布了運(yùn)營(yíng)數(shù)據(jù):自2024年7月底全球上線以來(lái),20天用戶數(shù)突破百萬(wàn),上線100天用戶數(shù)突破千萬(wàn)。截至目前,來(lái)自全球200個(gè)國(guó)家和地區(qū)的用戶在Vidu平臺(tái)上共計(jì)生產(chǎn)了上億條視頻。

根據(jù)已公開(kāi)的數(shù)據(jù),Vidu是目前全球增速最快的AI視頻模型產(chǎn)品。?

一、生成時(shí)長(zhǎng)最快不到10秒,速度提升3倍

生成速度是視頻大模型的一大瓶頸。Vidu團(tuán)隊(duì)一直在方面精進(jìn),去年7月底全球上線1.0版本時(shí),單片段的實(shí)測(cè)推理速度就已跑進(jìn)了30秒內(nèi),實(shí)現(xiàn)全球最快,此次2.0在生成速度上更是突破到秒級(jí)。

不管是圖生視頻、首尾幀生視頻,生成4秒512P單片段視頻不到10秒,速度比前代版本提升了3倍

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了▲Vidu 2.0 512-4s圖生視頻生成速度實(shí)時(shí)測(cè)評(píng)?

而提升生成速度對(duì)廣告制作、影視動(dòng)畫(huà)等專業(yè)內(nèi)容創(chuàng)作的效率提升很有幫助。

比如廣告商業(yè)片,以前傳統(tǒng)廣告制作中,光拍攝周期可能在3-5天,后期制作更是耗時(shí)耗力,從5-15天不等,總體上一條1分鐘廣告片的交付周期在1個(gè)月左右。?

而使用Vidu 2.0,理想狀態(tài)下,僅需花5分鐘就能跑出足夠1分鐘時(shí)長(zhǎng)的視頻素材,等于是既節(jié)約拍攝時(shí)間,又節(jié)省后期制作成本。??

二、加量還降價(jià)!單秒視頻僅需“4分錢”,百元就能產(chǎn)出1分鐘商業(yè)片??

目前市場(chǎng)上的視頻模型采用的是訂閱制,訂閱費(fèi)不菲,每月還會(huì)有積分的限制。

Sora剛上線時(shí),就有海外用戶吐槽Sora價(jià)格“太貴了”,生成一個(gè)5秒480P視頻成本為0.5美元,折合人民幣3.63元,生成一段1080p視頻成本更是高達(dá)27元。?

再比如Runway,產(chǎn)出一條素材需要花費(fèi)25積分,每月625積分只能產(chǎn)出25條5秒左右的素材片段。而做1分鐘的廣告片,至少需要可能5分鐘甚至更多的素材,每月625積分是遠(yuǎn)遠(yuǎn)不夠用的。若生成質(zhì)量不高,還需要不斷地提升會(huì)員權(quán)益,不斷買積分。?

此次Vidu 2.0推出了全新的收費(fèi)套餐,直接將每秒單價(jià)成本降至最低4分錢,讓人人都能用得起。?

橫向與同類模型產(chǎn)品對(duì)比,以各家720P每秒單價(jià)計(jì)算,Vidu 2.0為0.258元/秒,行業(yè)平均價(jià)格約為0.6元/秒。

大致算下來(lái)的話,Vidu 2.0 720P的收費(fèi)僅為行業(yè)平均的43%,也就是連現(xiàn)在業(yè)內(nèi)平均價(jià)格的一半都不到。Runway雖然效果不錯(cuò),但每秒單價(jià)超過(guò)了0.5元。?

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了

價(jià)格便宜了,意味著能生成更多的視頻素材。

以720P為例,目前市面上的視頻模型,10元錢平均只能生成20秒的視頻,而Vidu 2.0能生成38秒的視頻,接近行業(yè)平均水平的2倍。

也就是說(shuō),可能用不到百元的成本,就能完成一支短片的制作。

粗略算筆賬,通常傳統(tǒng)廣告片制作需要經(jīng)過(guò)平面、動(dòng)效、剪輯等流程,需要雇傭剪輯師、畫(huà)師、特效師等等,即使是一個(gè)4-5人的小團(tuán)隊(duì),按照普通出品水準(zhǔn),制作1分鐘廣告片的行業(yè)平均成本至少也在3000-5000元左右。

而采用Vidu 2.0生成1分鐘商業(yè)廣告片素材的成本在3-5元左右,即便考慮素材的有效率和后期剪輯配音等成本,1分鐘廣告片的成本也大約為100元左右,相比傳統(tǒng)制作廣告,成本下降到1/50~1/30。

據(jù)爆款A(yù)I短劇創(chuàng)作者閑人一坤分享,以前做類似規(guī)模的動(dòng)畫(huà)項(xiàng)目,團(tuán)隊(duì)規(guī)模通常需要40-50人,現(xiàn)在整個(gè)項(xiàng)目組不到10個(gè)人就能高效運(yùn)轉(zhuǎn),人力需求直接降低到了原來(lái)的四分之一以下。成本上,傳統(tǒng)的影視拍攝需要投入大量資金購(gòu)買專業(yè)設(shè)備和軟件,動(dòng)輒幾十萬(wàn)甚至上百萬(wàn)的投入。而使用Vidu,整體的軟件使用成本降到了一個(gè)完全不同的數(shù)量級(jí),可以說(shuō)是大大降低了創(chuàng)作的門(mén)檻和成本。

Vidu還悄悄上線了省錢妙招——“錯(cuò)峰模式”。

該模式有點(diǎn)類似于飯店閑時(shí)特價(jià),用戶申請(qǐng)的任務(wù)將排隊(duì)等待流量低峰時(shí)執(zhí)行,錯(cuò)峰生成不僅不扣用戶現(xiàn)有積分,而且生成素材無(wú)限量,想生成多少次就生成多少次。

有率先體驗(yàn)Vidu 2.0內(nèi)測(cè)的用戶在社交平臺(tái)評(píng)價(jià):“目前vidu,生成很快,再配合無(wú)限生成,很爽?!?/p>

三、風(fēng)格、主體、動(dòng)作穩(wěn)定性更高

除了增速降價(jià),Vidu 2.0的效果質(zhì)量也進(jìn)一步升級(jí)。

首先是風(fēng)格一致性保持更穩(wěn),畫(huà)面細(xì)節(jié)、主體更加穩(wěn)定,鏡頭運(yùn)動(dòng)理解更強(qiáng),圖生視頻能夠完整理解風(fēng)格元素、始終保持整體畫(huà)面風(fēng)格一致。

比如一張卷發(fā)男子在花叢中的油畫(huà)圖片,風(fēng)格偏印象派,Vidu 2.0生成的視頻能保持男生手中的花與畫(huà)面背景的花是一致的,油畫(huà)風(fēng)格貫穿始終。其他模型生成的視頻則有不同程度的崩壞。

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了

再比如水墨風(fēng)格的視頻生成,下圖老虎在慢慢靠近,Vidu 2.0沒(méi)有出現(xiàn)風(fēng)格突然變換的問(wèn)題,Pika 2.0生成的視頻則在最后幾秒突然變彩色,Runway的畫(huà)風(fēng)也逐漸跑偏。

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了

生數(shù)還展示了一個(gè)將商品海報(bào)圖用Vidu 2.0參考生視頻變成動(dòng)態(tài)視頻的示例,比如做一個(gè)貓糧的視頻宣傳,讓貓咪伸出爪子吃貓糧。

這種動(dòng)態(tài)表現(xiàn)更能引發(fā)貓主子們的購(gòu)買欲。不過(guò)可以看到畫(huà)面在還原物理特性上仍有進(jìn)步空間,爪子碰到貓糧后不是自然地扒拉下貓糧,而是有點(diǎn)穿過(guò)貓糧的既視感。

Vidu 2.0的鏡頭運(yùn)動(dòng)表現(xiàn)也更自然流暢,對(duì)鏡頭運(yùn)動(dòng)指令的理解更加到位。據(jù)生數(shù)分享,電影中常見(jiàn)的上下左右推拉旋轉(zhuǎn)鏡頭運(yùn)動(dòng)方面,Vidu 2.0在同類視頻生成模型中表現(xiàn)更佳。

以下圖動(dòng)漫人物為例,輸入提示詞“鏡頭順時(shí)針旋轉(zhuǎn)”,Vidu 2.0理解得更到位。

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了

首尾幀畫(huà)面切換同樣更加自然。繼2024年10月Vidu首次上線首尾幀功能后,Vidu 2.0將首尾幀的性能進(jìn)一步提升,中間過(guò)渡更絲滑流暢,畫(huà)面穩(wěn)定性更強(qiáng),同時(shí)在首尾幀中間的場(chǎng)景切換、鏡頭切換更具有想象力,實(shí)現(xiàn)了想象力和穩(wěn)定性更好的平衡。

例如下面的視頻,從兩個(gè)古人在秋天圍爐喝茶的畫(huà)面一下穿越到大雪紛飛的古城街頭,Vidu 2.0生成的視頻更讓人有種瞬時(shí)穿越感。

相比之下,Sora生成的視頻的切換,就有點(diǎn)像切PPT了。

Vidu 2.0還大幅提升了參考生視頻的性能。在不同風(fēng)格的主體和背景的穩(wěn)定性上,Vidu 2.0不僅相較Vidu 1.5提升較大,而且相比Pika 2.0,在穩(wěn)定性上拉開(kāi)了明顯差距。

在三維動(dòng)畫(huà)風(fēng)格中,Pika 2.0的視頻中出現(xiàn)了崩壞的情況,相對(duì)而言Vidu 2.0在多主體情況下仍然保持了畫(huà)面主體和背景的一致。

Vidu 2.0的主體相似度保持得更好,生成的視頻的主體、背景都與參考圖更像,即使在打架這種大幅度動(dòng)作中也能保持主角的一致。相比之下,Pika 2.0生成的視頻中,白衣男生與參考圖完全判若兩人,眼睛都變成綠色了,很難將參考角色與視頻聯(lián)系起來(lái)。

四、用戶數(shù)20天破百萬(wàn),百天破千萬(wàn),全球增速第一

Vidu首次對(duì)外公布了運(yùn)營(yíng)數(shù)據(jù):自7月底全球上線以來(lái),Vidu僅用了20天用戶數(shù)就突破百萬(wàn),上線100天用戶數(shù)就突破千萬(wàn)。

截至目前,Vidu平臺(tái)累計(jì)生成的視頻數(shù)突破億條,其中“參考生視頻”功能僅上線三個(gè)月,用戶利用該功能生成的視頻數(shù)就已達(dá)到千萬(wàn)級(jí)別。

雖然Vidu未公開(kāi)最新用戶數(shù),但相比市面上已知的競(jìng)品情況,愛(ài)詩(shī)科技于11月18日公布用戶數(shù)超1200萬(wàn),討論度較高的可靈于12月10日公布的用戶數(shù)超600萬(wàn)。相比之下,Vidu在10月底就實(shí)現(xiàn)了千萬(wàn)用戶數(shù),用戶規(guī)模遠(yuǎn)超可靈。

從用戶覆蓋地區(qū)看,Vidu已服務(wù)了全球超過(guò)200個(gè)國(guó)家和地區(qū),用戶規(guī)模位列全球第一梯隊(duì)。

之前有一位美國(guó)60歲老奶奶MamaFish用Vidu把她創(chuàng)作的兒童故事變成視頻形式,在短短20分鐘內(nèi)創(chuàng)建50多個(gè)場(chǎng)景,而且成本非常便宜。MamaFish的視頻在YouTube上廣受歡迎,還因此獲得了更多收益。

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了
▲MamaFish利用Vidu創(chuàng)作的兒童動(dòng)畫(huà)短片《如果我是一頭牛(If I Were A Cow)》的截圖

在日本,@8co28 是Vidu第一批早期用戶,是一位二次元愛(ài)好者,曾嘗試過(guò)kling、gen3、hailuo、pika、luma等產(chǎn)品來(lái)創(chuàng)作二次元?jiǎng)赢?huà)。最終,他選擇了用Vidu,認(rèn)為Vidu在參考生視頻方面要比其他平臺(tái)有更強(qiáng)大的優(yōu)勢(shì),同時(shí)對(duì)于大動(dòng)作大動(dòng)態(tài)的處理也十分突出。因?yàn)樗谱鰽I視頻的出色效果,@8co28 吸引了更多人的關(guān)注,粉絲數(shù)已經(jīng)超過(guò)35萬(wàn)。

1秒低至4分錢、20天用戶超百萬(wàn),國(guó)產(chǎn)視頻大模型把價(jià)格打下來(lái)了
▲@8co28 用Vidu生成的AI動(dòng)畫(huà)截圖

Vidu的產(chǎn)品力也獲得了許多企業(yè)的認(rèn)可。Evoke是一家面向海外用戶的AI圖生視頻應(yīng)用,也是Vidu早期的Maas客戶。自從接入Vidu的API后,據(jù)Evoke內(nèi)部數(shù)據(jù),在“擁抱”、“親吻”等場(chǎng)景上,相較于同類視頻生成平臺(tái),Vidu在模型準(zhǔn)確率提升了超60%,在視頻生成時(shí)間上從270秒縮短到35秒,時(shí)間相對(duì)下降了近九成。用戶滿意度也有顯著提升,用戶取消視頻生成的概率降低了10%。這些用戶體驗(yàn)幫助Evoke在海外獲得了更多注冊(cè)用戶和付費(fèi)用戶。

結(jié)語(yǔ):視頻大模型普惠第一步,拔高性價(jià)比

Vidu 2.0的發(fā)布,推動(dòng)視頻生成進(jìn)入“秒級(jí)時(shí)代”,再加上更親民的價(jià)格,標(biāo)志著視頻生成領(lǐng)域邁向“人人可用”階段,從小眾走向大眾。

隨著生成時(shí)間的快速提升,長(zhǎng)期來(lái)看,視頻生成逐步走向?qū)崟r(shí)生成,未來(lái)有望誕生全新的內(nèi)容互動(dòng)形式,創(chuàng)造類似互動(dòng)短劇、互動(dòng)游戲等全新用戶體驗(yàn)。?