智東西(公眾號:zhidxcom)
作者 | 王涵
編輯 | 冰倩

智東西2月10日報道,字節(jié)跳動AI視頻模型Seedance2.0,自2月7日開啟灰度測試以來討論熱度不減

連國際知名投資機(jī)構(gòu)a16z的合伙人Justine Moore用Seedance2.0制作出了一段奧運(yùn)會女子平衡木決賽的鏡頭,并感嘆說:“我們剛剛通過了AI視頻模型的圖靈測試。Seedance2.0簡直不可思議。”

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲Justine Moore體驗帖(來源:X)

區(qū)塊鏈及數(shù)字資產(chǎn)交易公司Binance聯(lián)合創(chuàng)始人兼首席客戶服務(wù)官Yi He發(fā)推說,Seedance2.0發(fā)出后,有朋友制作了有她肖像的短劇視頻,并要借此開展一個“六大門派圍攻光明頂”的AI自制短劇比賽。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲Yi He發(fā)帖(來源:X)

與光同弛AI創(chuàng)始人、導(dǎo)演劉馳在小紅書上發(fā)布了其Seedance2.0的體驗感受,她說她只用了兩張場景圖和一張本人的照片,就做出了電影感極強(qiáng)的視頻片段,“全程被驚掉下巴”。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲導(dǎo)演體驗帖子(來源:小紅書)

小紅書AI產(chǎn)品體驗博主摸魚小李發(fā)帖稱其在1小時內(nèi)做出了9條可以直接用的TVC。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲小紅書博主發(fā)帖(來源:小紅書)

一位學(xué)習(xí)了7年數(shù)字電影制作的網(wǎng)友在體驗后說,這個模型(Seedance2.0)是唯一一個讓他感到害怕的模型,電影行業(yè)的所有崗位幾乎都要消失了。90%他所學(xué)習(xí)到的技能,Seedance2.0都能實現(xiàn)。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴” Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲數(shù)字電影制作學(xué)習(xí)者評論(來源:X)

游戲科學(xué)創(chuàng)始人兼CEO、《黑神話·悟空》制作人馮驥在體驗了Seedance2.0后還專門發(fā)了微博,稱贊該模型為“當(dāng)前地表最強(qiáng)的視頻生成模型?!?/strong>并且很慶幸今天的Seedance2.0來自中國。但他也從其中看出了假視頻泛濫與信任危機(jī),因為“逼真的視頻將變得毫無門檻。”

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲馮驥微博(來源:新浪微博)

但是Seedance2.0也并不完美,在字節(jié)Seedance團(tuán)隊發(fā)出的飛書文檔《Seedance2.0使用手冊》中,有用戶在評論區(qū)中反映,使用同樣的提示詞和素材,生成的視頻在精細(xì)化控制上卻不太行。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲飛書文檔用戶評論(來源:飛書)

并且在一個官方案例中,Seedance2.0生成視頻的中文字幕還是會出現(xiàn)老生常談的中文亂碼情況。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲官方案例錯誤(來源:飛書)

Seedance2.0在物理規(guī)律、動作表現(xiàn)和指令理解等核心能力上較上一代模型有所提升,支持混合輸入文本、圖片、視頻和音頻等至多15個參考素材,用戶通過自然語言指令即可控制視頻的生成。

它不僅能復(fù)刻參考素材的構(gòu)圖、細(xì)節(jié)等,可以實現(xiàn)鏡頭規(guī)劃和特效,還支持視頻的平滑延長、鏡頭銜接以及角色替換等編輯功能,不過目前為保護(hù)隱私,暫不支持處理真實人臉?biāo)夭摹?/p>

智東西第一時間體驗了Seedance2.0,Seedance2.0所生成的視頻的場景和人物的一致性較高,模型可以主動添加運(yùn)鏡和剪輯,但偶爾會出現(xiàn)“憑空出現(xiàn)”等破綻。(“強(qiáng)到可怕!”字節(jié)Seedance2.0灰度測試爆火,黑悟空老板:AIGC的童年結(jié)束了

體驗地址:

https://jimeng.jianying.com/ai-tool/home

一、“發(fā)朋友圈90%的人都認(rèn)不出是AI”,從寫腳本到出片不到三個小時

自2月7日開放測試以來,有很多網(wǎng)友們都親自動手體驗了Seedance2.0模型。

小紅書AIGC博主明義發(fā)布了一個由Seedance2.0生成的視頻短片,時長1分鐘。短片中兩個長相相同的的女孩子對向而坐,穿黑色西裝的女孩化了精致的妝,語氣咄咄逼人。另一個女孩則面色憔悴,透露著害怕的情緒。Seedance2.0很精準(zhǔn)地分辨出了兩個女生不同的氣質(zhì)、情緒和語氣,明義補(bǔ)充說這則短片從寫腳本到生成不到三個小時。

接著,明義直接用Seedance2.0生成了一個自己”出鏡“介紹上一段視頻制作過程的視頻,并附上了提示詞。網(wǎng)友們乍一看還以為是博主真人出鏡,但明義在評論區(qū)中回復(fù)稱,其實連素材都是AI生成的。

播客“三五環(huán)”和“半拿鐵”的主持人劉飛也在小紅書上發(fā)布了他用Seedance2.0生成的短劇,劇情為男孩用山東省公務(wù)員錄取通知回?fù)襞笥迅赣H。

視頻中”父親“的前后神情和動作都很自然,公務(wù)員錄取通知文件上面的字也生成準(zhǔn)確,沒有亂碼。劉飛感嘆稱,Seedance2.0簡直是“短劇殺手”

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲劉飛制作短劇片段(來源:小紅書)

微博上,汽車博主滑布李用朋友家的貓咪照片作為首尾幀,分別用視頻模型3.5 Pro和Seedance 2.0生成了兩段貓咪后空翻的視頻。

對比效果顯示,老版視頻模型3.5 Pro所生成的視頻丟失了后空翻細(xì)節(jié),沒有分鏡,睡覺部分貓咪出現(xiàn)穿幫,人類配音也很生硬。

▲視頻模型3.5 Pro生成效果(來源:微博)

而Seedance 2.0生成的視頻中,有兩段貓咪后空翻的鏡頭,且貓咪在空中翻轉(zhuǎn)、落地的身體形態(tài)都沒有發(fā)生畸變,Seedance 2.0還根據(jù)貓咪的習(xí)性,添加了貓咪蹭沙發(fā)的鏡頭,讓視頻更加自然、真實

滑布李評價Seedance 2.0生成的視頻是“發(fā)朋友圈90%的人都認(rèn)不出是AI的程度”。

▲Seedance 2.0生成效果(來源:微博)

AIGC創(chuàng)作者DynamicWang用Seedance2.0制作了一個模仿Nike品牌廣告風(fēng)格的短片,短片中共出現(xiàn)了四位不同族裔的女性,每一位角色的身材和肌肉線條都很符合其所進(jìn)行的運(yùn)動的標(biāo)準(zhǔn),且鏡頭角度變動后,角色的臉部特征依舊保持一致。

短片中的運(yùn)鏡也十分自然,沒有拼接痕跡,慢動作、角度移動的位置都很準(zhǔn)確,符合劇情需要。

從第一位體操女孩流暢的翻轉(zhuǎn)跳躍可以看到,Seedance2.0直接攻破了“AI生成不了體操視頻”這個難題。拳擊女生和跑步女生的汗水以及游泳女生濺起的水花,都沒有了此前AI生成的“黏膩感”。

▲DynamicWang制作視頻

自媒體博主冰河用Lovart的Skill生成分鏡故事板,直接復(fù)制到Seedance2.0中,他說該模型所生成的視頻比他用ComfyUI做的還細(xì)致。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲自媒體博主冰河制作視頻片段(來源:X)

在小云雀App中,也有不少用戶都上傳了自己用Seedance2.0生成的視頻片段。

有李小龍對戰(zhàn)日本武士:

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲用戶體驗案例(來源:小云雀App)

真人版七龍珠:

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲用戶體驗案例(來源:小云雀App)

還有仙俠竹林對決:

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲用戶體驗案例(來源:小云雀App)

二、智東西體驗:能自動添加運(yùn)鏡,但仍有憑空出現(xiàn)破綻

智東西上手體驗了Seedance2.0模型,主要考察模型的自運(yùn)鏡、角色場景一致性和角色替換方面的能力。

Seedance2.0所生成的視頻畫風(fēng)、場景和人物的一致性較高,不會發(fā)生畸變現(xiàn)象。模型可以根據(jù)其自己對劇情的理解添加運(yùn)鏡和剪輯,聲效上也可以實現(xiàn)提示詞和參考素材的要求。但其所生成的視頻還是會偶爾出現(xiàn)“憑空出現(xiàn)”等破綻。

在設(shè)置界面,用戶可以自行選擇所生成視頻的比例和時長。Seedance2.0提供中文和英文兩種語言,用戶還可以選擇普通話、東北話、河南話、港臺腔、陜西話、粵語和四川話等不同的方言,視頻風(fēng)格、人物形象、音色風(fēng)格和視頻情緒都可以自由選用。

首先我們來試試Seedance2.0在廣告片生成上的表現(xiàn)。我們上傳了一張可口可樂蜜桃味的海報,輸入提示詞:

【@圖1】中的可口可樂飲料,360度高速旋轉(zhuǎn)2圈后,突然停住蓄力分裂成了3個部分進(jìn)行展示。隨后分解后的可口可樂飲料罐的上中下三部分快速向內(nèi)旋轉(zhuǎn)合成,一罐完整的可口可樂飲料,3D渲染產(chǎn)品展示特效,動感產(chǎn)品特效展示。

Seedance2.0生成的視頻如下:

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲可口可樂廣告片(來源:智東西體驗)

Seedance2.0所生成的廣告片基本符合提示詞要求,視頻中的可樂罐與素材幾乎絲毫不差。但仔細(xì)看,視頻還是可以看出破綻,比如這一幀有一部分瓶身憑空出現(xiàn)。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲出現(xiàn)破綻

接下來,我們來試試該模型生成數(shù)字人的效果。由于平臺合規(guī)要求,Seedance2.0目前暫不支持上傳包含寫實真人臉部的素材,圖片和視頻素材均不行。

我們不提供素材,僅輸入提示詞:

特寫,焦距50mm,扎馬尾的女生坐在窗邊,微笑時有梨渦,在咖啡廳的桌面上的筆記本上寫著什么,偶爾有思考的停頓,背景虛化呈現(xiàn),咖啡館的木質(zhì)桌沿,柔光打在面部,突出輕松的氛圍,咖啡廳中放著鋼琴曲。

Seedance2.0生成的視頻如下:

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲咖啡廳女孩生成片段(來源:智東西體驗)

在生成速度上,Seedance2.0生成一段10秒的視頻需要5分鐘左右。從視頻的畫面上來看,在提示詞沒有說如何運(yùn)鏡的情況下,該模型自動在開頭加了一個漸進(jìn)的運(yùn)鏡,讓畫面劇情更加自然和流暢。在漸進(jìn)的過程中,畫面中的人物、場景都沒有發(fā)生畸變,保持了一致性。

最近,一個韓國AI小狗接受采訪的視頻非常火,我們將視頻截圖發(fā)給Seedance2.0,讓它將原圖中的小狗換成小貓。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲AI小狗視頻截圖(來源:小紅書)

可以看到,Seedance2.0生成的視頻很完整地保留了參考素材的風(fēng)格,給小貓穿上了睡衣,并且讓小貓雙手張開,并不是簡單地?fù)Q頭,小三花貓沒有被睡衣覆蓋的肚子部分也還原了真實小貓崽肚子的質(zhì)感。

而且,在音頻上,Seedance2.0也準(zhǔn)確地實現(xiàn)了提示詞中所說的25歲女記者和小孩的聲線。

Seedance2.0首波用戶體驗:兩張照片生成逼真電影感大片,知名導(dǎo)演“驚掉下巴”

▲AI小貓生成片段(來源:智東西體驗)

結(jié)語:Seedance2.0體驗熱情依舊高漲,創(chuàng)意的重要性日漸顯現(xiàn)

從周末的灰度測試到今天的正式發(fā)布,網(wǎng)絡(luò)上有關(guān)Seedance2.0的討論話題逐漸從其所生成視頻的驚艷效果,逐漸轉(zhuǎn)為對影視行業(yè)下一步該怎么走的思考。

即使Seedance2.0目前所生成的視頻還是會有一些小破綻,徹底改變影視界還言之過早,但Seedance2.0的出現(xiàn),無疑降低了專業(yè)表達(dá)的門檻,讓更多人有工具可以將想法可視化。

簡單來說就是,做視頻的門檻,變低了。以往需要一個視頻團(tuán)隊所做的工作,如今一個人一臺電腦或一部手機(jī)就可以完成。

而這時,創(chuàng)意就成了AI時代的重中之重。