智東西(公眾號(hào):zhidxcom)
作者 | 陳駿達(dá)
編輯 | 李水青

智東西10月16日?qǐng)?bào)道,今天,谷歌宣布推出全新的Veo 3.1視頻生成模型,新版本提升了畫面真實(shí)感與敘事控制能力,同時(shí)具備更強(qiáng)大的提示詞理解力和音畫同步生成能力。

依托Veo 3.1的能力,谷歌同步升級(jí)了旗下AI影視創(chuàng)作平臺(tái)Flow。此次更新最大的變化,是在多項(xiàng)核心功能中首次引入了AI生成音頻,實(shí)現(xiàn)“聲畫合一”的創(chuàng)作體驗(yàn)。

在Flow的素材生視頻(Ingredients to Video)功能里,創(chuàng)作者可以上傳多張參考圖像,系統(tǒng)自動(dòng)生成包含指定角色與場(chǎng)景風(fēng)格的完整視頻。首尾幀(Frames to Video)功能可根據(jù)用戶上傳的畫面,生成自然銜接的過渡鏡頭。視頻延展(Extend)則可以從已有片段延展出新的鏡頭,使短片可銜接成長視頻,持續(xù)一分鐘或更長時(shí)間。

音頻生成系統(tǒng)會(huì)自動(dòng)根據(jù)畫面內(nèi)容生成環(huán)境音、動(dòng)作聲及氛圍配樂,讓作品更加沉浸和具象。

不過,在生成視頻后,創(chuàng)作者往往有進(jìn)一步編輯、修改畫面內(nèi)容的需求。為此,F(xiàn)low新增了多項(xiàng)編輯工具,讓創(chuàng)作者能更精準(zhǔn)地掌控畫面。

現(xiàn)在,創(chuàng)作者可向現(xiàn)有視頻中插入新元素(如人物、動(dòng)物或道具),AI將自動(dòng)調(diào)整光影與景深,使其自然融入場(chǎng)景。Flow中還即將上線一鍵移除功能,可去除不需要的對(duì)象或人物,系統(tǒng)自動(dòng)重建背景,實(shí)現(xiàn)“無痕修復(fù)”。

Veo 3.1現(xiàn)已通過Flow、Gemini API、Vertex AI以及Gemini應(yīng)用向開發(fā)者、企業(yè)與創(chuàng)作者全面開放,可免費(fèi)試用。在Flow中,谷歌為買免費(fèi)用戶每月提供了100個(gè)AI點(diǎn)數(shù),大約可用于5條視頻的生成。

體驗(yàn)鏈接:https://labs.google/fx/zh/tools/flow

智東西第一時(shí)間體驗(yàn)了Veo 3.1的生成效果??梢钥吹?,Veo 3.1提供兩個(gè)版本,分別為Veo 3.1-Fast(快速版)與Veo 3.1-Quality(高質(zhì)量)。實(shí)測(cè)中,快速生成大約需要30秒-1分鐘。

Sora 2之后,谷歌AI視頻大殺器來了!像Nano Banana一樣編輯視頻,附一手實(shí)測(cè)

Veo 3.1能夠準(zhǔn)確地根據(jù)提示詞,還原涉及復(fù)雜光影的畫面,表現(xiàn)出良好的光影層次與自然氛圍。畫面整體偏暖且柔和,符合清晨光線的真實(shí)色溫。小溪的水流模擬平滑,反光細(xì)節(jié)恰到好處。其配音也符合畫面內(nèi)容與提示詞要求。

不過,在“地獄級(jí)難度”的體操視頻生成上,Veo 3.1徹底翻車了,輸出的畫面完全不符合人體規(guī)律,出現(xiàn)了明顯的扭曲。

Sora 2之后,谷歌AI視頻大殺器來了!像Nano Banana一樣編輯視頻,附一手實(shí)測(cè)

我們也嘗試了素材生視頻的功能。在上傳咖啡杯、桌子和人像后,Veo 3.1可以參考提示詞和素材,生成用戶所需的廣告短片。Veo 3.1對(duì)廣告畫面和廣告詞的呈現(xiàn)符合提示詞中定義的調(diào)性,還賦予了廣告詞一定的旋律。

Sora 2之后,谷歌AI視頻大殺器來了!像Nano Banana一樣編輯視頻,附一手實(shí)測(cè)

我們上傳了OpenAI CEO Sam Altman的照片,但生成的畫面中人物的年齡和外貌與他差異較大。這可能與Flow對(duì)名人肖像權(quán)的保護(hù)機(jī)制有關(guān):在上傳部分圖像時(shí),系統(tǒng)會(huì)提示不支持使用名人肖像。

結(jié)語:技術(shù)進(jìn)步可喜,但仍需謹(jǐn)慎應(yīng)用

從月初的Sora 2到今天的Veo 3.1,視頻生成技術(shù)在短短幾周內(nèi)取得了顯著進(jìn)展。不過,與Veo 2到Veo 3的飛躍相比,Veo 3到Veo 3.1的提升并沒有那么顯著。

總體而言,Veo 3.1的發(fā)布為AI視頻創(chuàng)作提供了更強(qiáng)大的工具,但在實(shí)際應(yīng)用中,創(chuàng)作者可能仍需對(duì)其生成的畫面進(jìn)行調(diào)整,以克服當(dāng)前的局限,實(shí)現(xiàn)更高質(zhì)量的作品。