智東西(公眾號(hào):zhidxcom)
作者 | 陳駿達(dá)
編輯 | 漠影

這一多模態(tài)AI創(chuàng)意工具,迎來(lái)多項(xiàng)重磅升級(jí)!

智東西11月6日?qǐng)?bào)道,近日,昆侖萬(wàn)維旗下的多模態(tài)創(chuàng)意工具平臺(tái)SkyReels迎來(lái)一波集中升級(jí),其中最大的亮點(diǎn)就是,他們用一張“無(wú)限畫布”,取代了復(fù)雜的創(chuàng)作交互方式。

在新版SkyReels上,無(wú)論是圖片、視頻生成還是數(shù)字人,每一種內(nèi)容的生成、編輯與組合都可以在同一張“無(wú)限畫布”上完成,并且通過(guò)簡(jiǎn)單拖拽即可實(shí)現(xiàn)多模態(tài)內(nèi)容的自由創(chuàng)作。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

這些新功能并非孤立存在,而是相互聯(lián)動(dòng)、形成層次分明的解決方案。SkyReels根據(jù)用戶不同的工具使用能力,提供了三種創(chuàng)作路徑:

熟悉AI工具的用戶可以直接使用AI模型生成圖片、視頻、音頻或數(shù)字人內(nèi)容;希望更高效創(chuàng)作的用戶,則可依托近30款聚焦特定場(chǎng)景的Expert Agent,快速完成生成;而對(duì)沒(méi)有創(chuàng)作經(jīng)驗(yàn)的小白用戶,只需套用智能模板,通過(guò)簡(jiǎn)單的文字描述和畫面替換,即可輕松復(fù)刻參考內(nèi)容。

在此基礎(chǔ)上,SkyReels還推出了Agentic Copilot模式——集Super Agent與Expert Agents于一體的“雙核驅(qū)動(dòng)”體系。用戶可以通過(guò)自然語(yǔ)言、上傳素材或提供鏈接,讓AI理解并生成跨模態(tài)的創(chuàng)意內(nèi)容。我們還用這一功能,復(fù)刻了Vlog之父Casey Neistat的拍攝風(fēng)格。

無(wú)論是捕捉靈感瞬間,還是規(guī)劃完整的創(chuàng)作流程,Agent都能提供智能輔助,讓復(fù)雜的創(chuàng)作變得輕松、高效。

智東西對(duì)SkyReels近期的升級(jí)進(jìn)行了全面體驗(yàn)??梢哉f(shuō),這一升級(jí)后的創(chuàng)作平臺(tái),不僅在功能上提供了便利,更在整體體驗(yàn)上實(shí)現(xiàn)了統(tǒng)一與流暢。無(wú)限畫布、智能Agent等要素的結(jié)合,讓用戶能夠在一個(gè)簡(jiǎn)潔直觀的平臺(tái)上,實(shí)現(xiàn)海量創(chuàng)意的可能。

一、一張無(wú)限畫布,如何統(tǒng)一AI多模態(tài)創(chuàng)作?

如今的多模態(tài)AI創(chuàng)作平臺(tái)看起來(lái)五花八門、功能強(qiáng)大,但用起來(lái)卻常常讓人頭大。界面層層疊疊,操作邏輯又有點(diǎn)反直覺(jué),更麻煩的是,不同功能之間(比如生圖、生視頻、生音頻)等往往處在不同的界面,甚至是不同的網(wǎng)站,毫無(wú)連貫感。

例如,谷歌推出的AI視頻創(chuàng)作工具Flow僅支持文本轉(zhuǎn)視頻、幀轉(zhuǎn)視頻和素材轉(zhuǎn)視頻,如果想用谷歌的Gemini 2.5 Flash生成圖像,并用于創(chuàng)作,還需切換到谷歌的其他AI工具。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

對(duì)創(chuàng)作者來(lái)說(shuō),這種割裂的體驗(yàn)打斷了創(chuàng)作靈感,也拉高了AI工具的學(xué)習(xí)成本。AI本該讓創(chuàng)作更輕松、更有趣,但現(xiàn)在的門檻反而擋住了許多好點(diǎn)子。

那么,一個(gè)真正以創(chuàng)作者為中心、能夠打通多模態(tài)的AI創(chuàng)作平臺(tái),應(yīng)該是什么樣的?

SkyReels給出的答案,就是一張“無(wú)限畫布”。

打開新版SkyReels,占據(jù)視覺(jué)中心的并非密集的功能面板,而是承載創(chuàng)作素材的畫布。這讓用戶的注意力和操作重心始終在創(chuàng)作本身,而不是被復(fù)雜的菜單和參數(shù)所干擾。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

所有AI功能與模型都被整合到畫布的側(cè)邊欄,既有昆侖萬(wàn)維自家的多款模型,也覆蓋了當(dāng)前業(yè)內(nèi)的幾乎所有主流模型。在這片空間中,用戶可以自由地上傳圖像、音頻、視頻等多模態(tài)內(nèi)容,文生圖生成的素材可以成為圖像編輯、圖生視頻的起點(diǎn)。

這種設(shè)計(jì)符合用戶長(zhǎng)期形成的心智模型。Photoshop以畫布為中心,工具和功能區(qū)被放在側(cè)邊欄或頂部菜單,用戶直接在畫布上操作圖像、繪制、編輯。AE同樣以畫布為視覺(jué)核心,所有特效、素材、合成操作在畫布上直觀呈現(xiàn),工具界面相對(duì)輔助。

在繼承經(jīng)典創(chuàng)作軟件的界面邏輯、降低用戶學(xué)習(xí)門檻的同時(shí),SkyReels也對(duì)多模態(tài)創(chuàng)作流程進(jìn)行了創(chuàng)新整合,讓創(chuàng)作在圖像、視頻、音頻之間自由流動(dòng)。

在無(wú)限畫布上,用戶主要以三種方式進(jìn)行交互與創(chuàng)作:拖拽、對(duì)話、二次編輯。

用戶可以一次性上傳多張圖片、多個(gè)視頻,并根據(jù)創(chuàng)作需求將素材拖拽到對(duì)應(yīng)的功能上。

例如,將靜態(tài)圖片拖拽到“視頻生成”功能上后,它便會(huì)在畫布原地變?yōu)閯?dòng)態(tài)視頻。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

如果需要讓視頻中的人物說(shuō)出想要的臺(tái)詞,就只需拖動(dòng)這個(gè)視頻到“Avatar(數(shù)字人)”功能上,人物就能開口說(shuō)話。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

同時(shí),用戶還能在無(wú)限畫布上捕捉并打磨靈感。當(dāng)聽到令人心動(dòng)的音樂(lè)、看到有啟發(fā)性的視頻后,只需將音頻拖入Chat界面,與智能agent對(duì)話。Agent能幫助用戶逐步厘清創(chuàng)作需求,并最終生成相應(yīng)的視覺(jué)畫面。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

在獲得初步生成結(jié)果后,用戶可以進(jìn)行二次編輯——包括視頻風(fēng)格化、延長(zhǎng)內(nèi)容或進(jìn)行UpScale畫質(zhì)升級(jí)等。這些操作都可在同一界面中完成,無(wú)需跳轉(zhuǎn)或切換。

SkyReels的無(wú)限畫布,把復(fù)雜的操作和設(shè)置都封裝在了簡(jiǎn)單的物理動(dòng)作背后?!?strong>我們希望用戶不需要學(xué)習(xí)AI,而只需要使用AI。”SkyReels團(tuán)隊(duì)這樣強(qiáng)調(diào)。

二、Agent深度融入創(chuàng)作,海量模板讓數(shù)字營(yíng)銷更輕松

為了讓創(chuàng)作的流程進(jìn)一步提效與智能化,SkyReels 還引入了“雙核驅(qū)動(dòng)”的智能創(chuàng)作體系——由Super Agent與Expert Agents共同構(gòu)成的全能與專業(yè)一體化系統(tǒng)。

在內(nèi)容創(chuàng)作的早期階段,靈感往往稍縱即逝,圖片、文字、視頻都有可能成為創(chuàng)作的起點(diǎn)。Super Agent的設(shè)計(jì)讓捕捉這種瞬間的創(chuàng)意需求變得更為容易。

在試用中,Super Agent的多模態(tài)識(shí)別能力表現(xiàn)出色:無(wú)論是上傳圖片、輸入文字,還是提供視頻,它都能跨模態(tài)快速理解意圖,并給出有針對(duì)性的反饋。

知名Vlogger Casey Neistat有“Vlog之父”稱號(hào),其風(fēng)格啟發(fā)了不少創(chuàng)作者。如今,借助Super Agent的能力,普通人也能在SkyReels中復(fù)刻N(yùn)eistat的風(fēng)格。

我們可以上傳Neistat的Vlog,并輸入指令“按照Casey Neistat的風(fēng)格幫我打造一只關(guān)于小狗的Vlog”。Super Agent系統(tǒng)能根據(jù)視頻的內(nèi)容,并結(jié)合公開信息,分析提煉創(chuàng)作風(fēng)格。

當(dāng)用戶的指令并不清晰時(shí),Super Agent不會(huì)將錯(cuò)就錯(cuò),而是會(huì)主動(dòng)提問(wèn),讓用戶輸入所需信息,或是選擇創(chuàng)作方向。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

完全了解用戶需求后,Super Agent才會(huì)開始規(guī)劃創(chuàng)作流程,幫用戶逐步打造制作計(jì)劃、分鏡、生成角色與背景和生成視頻,期間,用戶不用手動(dòng)切換工具,只需要確認(rèn)Agent提出的方案或動(dòng)作,僅在不滿意時(shí)才需介入調(diào)整。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

SkyReels生成的首個(gè)鏡頭如下,無(wú)論是清晨的紐約城,還是富有動(dòng)感的運(yùn)鏡,都和Neistat的風(fēng)格有幾分神似。在此基礎(chǔ)上,用戶可以繼續(xù)按照計(jì)劃生成視頻,最終獲取足夠的創(chuàng)作素材。

更值得一提的是,Super Agent并非單次響應(yīng)的“問(wèn)答式工具”,而是一個(gè)可以被隨時(shí)喚起、持續(xù)陪伴的創(chuàng)作伙伴,可以參與到用戶創(chuàng)作的每一個(gè)階段。

相比Super Agent的通用創(chuàng)意能力,Expert Agents更像是一個(gè)針對(duì)垂直行業(yè)打造的“專業(yè)智囊?guī)臁薄?/strong>目前SkyReels已內(nèi)置28個(gè)專家Expert Agents,覆蓋市場(chǎng)營(yíng)銷、電商運(yùn)營(yíng)、虛擬形象打造和故事創(chuàng)作等領(lǐng)域。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

在我們的體驗(yàn)中,營(yíng)銷類Expert Agent尤其值得關(guān)注。要使用Expert Agents,用戶本身并不需要是特定領(lǐng)域的“專家”——Expert Agents在每個(gè)場(chǎng)景都會(huì)給出清晰的指引,用戶按照指引,像做填空題一樣補(bǔ)全產(chǎn)品賣點(diǎn)、目標(biāo)受眾、所傳遞的情緒、使用場(chǎng)景等關(guān)鍵信息后,系統(tǒng)便能生成完整的營(yíng)銷素材,如海報(bào)、宣傳視頻等等。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

▲SkyReels幫助用戶厘清消費(fèi)電子產(chǎn)品的宣傳視頻拍攝策略

這28個(gè)專家Agent均在特定領(lǐng)域經(jīng)過(guò)深度訓(xùn)練和優(yōu)化。它們內(nèi)置了該領(lǐng)域的專業(yè)知識(shí)庫(kù)和成熟的工作流程,能夠理解行業(yè)術(shù)語(yǔ)和復(fù)雜需求,提供具有行業(yè)洞察、可執(zhí)行性強(qiáng)的專業(yè)方案。這使非專業(yè)用戶也能快速獲得具備可執(zhí)行性的成品方案,而不必陷入反復(fù)調(diào)整和試錯(cuò)。

隨著多Agent的協(xié)作機(jī)制進(jìn)一步完善,未來(lái),這些Agent或許將有望組成專業(yè)團(tuán)隊(duì),協(xié)作完成更為復(fù)雜的任務(wù)。

同時(shí),為進(jìn)一步便利創(chuàng)作,SkyReels還配備了海量創(chuàng)作模板。這些模板同樣主打“簡(jiǎn)單好用”,甚至連文字提示詞都無(wú)需輸入——用戶只需上傳基本的圖像素材,即可完成替換。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

例如,在服裝外貿(mào)電商場(chǎng)景,SkyReels的模板已經(jīng)覆蓋了不同人種、不同膚色、不同服裝類目,無(wú)論是T恤衫、衛(wèi)衣、夾克還是大衣,都有對(duì)應(yīng)的細(xì)分模板。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

替換元素后,新的衛(wèi)衣款式、品牌Logo能與原模板無(wú)縫融合,真正實(shí)現(xiàn)了模板效果的“所見即所得”。

智東西批量嘗試了多個(gè)不同樣式的模板,其融合效果始終穩(wěn)定可靠,幾乎沒(méi)有割裂感和不自然的觀感。

此類數(shù)字營(yíng)銷工具,讓相關(guān)從業(yè)者無(wú)需耗費(fèi)大量時(shí)間、精力拍攝宣傳素材,也減少了他們學(xué)習(xí)AI工具的機(jī)會(huì)成本。從業(yè)者可以把精力集中于產(chǎn)品創(chuàng)意與市場(chǎng)策略本身,從而更高效地實(shí)現(xiàn)品牌傳播與業(yè)務(wù)增長(zhǎng)目標(biāo)。

三、底層模型能力集中升級(jí),數(shù)字人能實(shí)現(xiàn)多人對(duì)話了

“無(wú)限畫布”、Agent、模板等創(chuàng)作方式的升級(jí)背后,是昆侖萬(wàn)維在視頻生成模型底層能力上的不斷突破。

數(shù)字人能力方面,SkyReels V3模型首先在生成長(zhǎng)度上實(shí)現(xiàn)跨越,能完成數(shù)分鐘的數(shù)字人畫面生成。借助這一功能,我們甚至可以用自己打造的卡通形象,拍一部新品宣傳廣告片。

SkyReels在生成數(shù)字人時(shí),支持32個(gè)運(yùn)鏡組合與鏡頭運(yùn)動(dòng)選項(xiàng),能夠滿足不同敘事和畫面表達(dá)需求,使視覺(jué)表現(xiàn)更加生動(dòng)自然。這些特性,讓數(shù)字人能勝任更為完整的營(yíng)銷敘事,提升宣傳效果。

告別繁瑣切換!昆侖萬(wàn)維SkyReels用“無(wú)限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

SkyReels V3還是業(yè)內(nèi)首個(gè)支持單鏡頭多人多輪對(duì)話的數(shù)字人模型。在傳統(tǒng)的數(shù)字人生成模型更多僅提供單人對(duì)口型和多人同時(shí)發(fā)聲。SkyReels V3則能精準(zhǔn)控制每個(gè)角色的說(shuō)話時(shí)機(jī)、節(jié)奏、肢體語(yǔ)言和角色間的眼神互動(dòng),實(shí)現(xiàn)自然的多人對(duì)話流,甚至還能同步生成真實(shí)的環(huán)境音。

在創(chuàng)意場(chǎng)景,SkyReels現(xiàn)在還能將視頻的創(chuàng)意延展,或是轉(zhuǎn)變?yōu)樘囟ǖ娘L(fēng)格。

這些能力基于升級(jí)的SkyReels V3。其視頻延長(zhǎng)不再局限于業(yè)內(nèi)“單鏡頭拉長(zhǎng)”的傳統(tǒng)方式,而是基于視頻語(yǔ)義和用戶Prompt,智能預(yù)測(cè)下一個(gè)鏡頭的合理延續(xù)與場(chǎng)景內(nèi)容。

SkyReels V3視頻延長(zhǎng)支持多種切鏡方式,包括影視拍攝中常用的切入鏡頭、切出鏡頭、反打鏡頭、多角度鏡頭、切離鏡頭等,能生成具備敘事邏輯與視覺(jué)連貫性的延展片段,讓鏡頭語(yǔ)言更豐富,畫面更具動(dòng)感與電影感。

這一能力讓用戶可以從短視頻中自然過(guò)渡至更完整的敘事結(jié)構(gòu),為影視預(yù)演、電商視頻延展、UGC 創(chuàng)作等場(chǎng)景提供更高效的生成方式。

而SkyReels V3此次的風(fēng)格化模型并非簡(jiǎn)單的“濾鏡遷移”。它通過(guò)對(duì)視頻時(shí)序一致性、細(xì)節(jié)保真度與光影邏輯的深度優(yōu)化,實(shí)現(xiàn)了1:1的角色、動(dòng)作和場(chǎng)景保真。

無(wú)論是“辛普森風(fēng)”、“樂(lè)高風(fēng)”還是“梵高風(fēng)”,視頻中的細(xì)節(jié)都能保持一致,讓風(fēng)格化不再只是“涂層”,而是深度地融合到畫面之中。

與市面上常見的5秒級(jí)別LoRA一鍵風(fēng)格化不同,SkyReels的模型保持了原視頻的動(dòng)態(tài)結(jié)構(gòu)與語(yǔ)義邏輯。這讓風(fēng)格遷移具備了更強(qiáng)的穩(wěn)定性和一致性,足以支撐時(shí)長(zhǎng)更長(zhǎng)廣告創(chuàng)意、動(dòng)畫預(yù)演的視覺(jué)再創(chuàng)作。

結(jié)語(yǔ):SkyReels升級(jí)背后,昆侖萬(wàn)維的AI全景布局

SkyReels近期的升級(jí),只是昆侖萬(wàn)維在AI領(lǐng)域的部分探索。昆侖萬(wàn)維近期披露的財(cái)報(bào)顯示,其AI布局已經(jīng)涵蓋大模型、AGI研究、多模態(tài)創(chuàng)作平臺(tái)、智能音樂(lè)與語(yǔ)音、游戲與社交等方向,并開源了Skywork-Reward、Skywork-R1V、UniPic、Matrix-3D 等系列模型,推出了SkyReels、Mureka、Linky、StarMaker和DramaWave等多款應(yīng)用。

這也帶動(dòng)了其業(yè)績(jī)的快速增長(zhǎng)。昆侖萬(wàn)維在本財(cái)年前三季度的營(yíng)收已達(dá)58億元,同比增長(zhǎng) 52%,海外收入占比93%。作為中國(guó)AI出海的重要力量之一,昆侖萬(wàn)維有望持續(xù)推動(dòng)AI技術(shù)研發(fā)、產(chǎn)品迭代和商業(yè)化應(yīng)用,打造覆蓋研發(fā)、創(chuàng)作和內(nèi)容生態(tài)的全方位AI平臺(tái)。