智東西(公眾號(hào):zhidxcom)
作者 | 程茜
編輯 | 漠影

全民低成本自制爽劇的時(shí)代真來了?

短劇行業(yè)正迎來爆發(fā)式增長(zhǎng),去年微短劇市場(chǎng)規(guī)模首超電影票房。

同時(shí)眼下,AI也正顛覆短劇產(chǎn)業(yè),深度滲透至短劇創(chuàng)作全鏈路,瞄準(zhǔn)了分鐘級(jí)出片,和“一人劇組”的工業(yè)化生產(chǎn)模式。

但對(duì)于短劇觀眾而言,很多AI短劇目前還未能徹底解決口型對(duì)不上、劇情存在邏輯硬傷等槽點(diǎn);尤其是純AI驅(qū)動(dòng)的創(chuàng)作,往往還會(huì)帶來超長(zhǎng)劇本架構(gòu)失控、角色場(chǎng)景設(shè)定前后矛盾等等問題。這讓觀眾不得不陷入“邊罵邊追更”的狀態(tài),恨不得自己上手改劇本。

今天,商湯科技在產(chǎn)品發(fā)布周上,推出了全新升級(jí)的行業(yè)首個(gè)創(chuàng)編一體、多劇集生成智能體——Seko 2.0版本,其圍繞著上述痛點(diǎn)全面更新,高效率、低門檻的特征,讓個(gè)人創(chuàng)作者也能秒變“一人劇組”。

今年7月上線以來,Seko已經(jīng)成為諸多視頻創(chuàng)作者的必備工具。其聯(lián)合專業(yè)團(tuán)隊(duì)打造的《婉心計(jì)》登上抖音AI短劇榜斷層第一,熱度超200萬

下面正是創(chuàng)作者使用Seko創(chuàng)作出的視頻效果:

從Seko 2.0的重磅更新出發(fā),我們?cè)噲D拆解商湯科技在AI視頻創(chuàng)作領(lǐng)域的獨(dú)特打法,解析其底層技術(shù)布局。

一、靈感成真!Seko 2.0讓AI短劇創(chuàng)作一步到位

主打一步成片的Seko這次更新,將視頻生成的高交互性與低門檻拉滿了。其更新圍繞著三大功能:UI升級(jí)、支持100集以內(nèi)劇本連續(xù)創(chuàng)作、Agent智能調(diào)度

首先是UI升級(jí),Seko提供了沉浸式的創(chuàng)意體驗(yàn),用戶在生成過程中對(duì)人物、分鏡、圖片、場(chǎng)景的編輯、交互性增強(qiáng)。

打開Seko可以發(fā)現(xiàn),交互界面包含的元素增多。在對(duì)話框下方,用戶可以直接選擇提示靈感,或者可以自行輸入提示詞。在對(duì)話框中,用戶還可以直接上傳劇本、選擇模型、添加主體、添加畫風(fēng)。

在對(duì)話框右下角就是另一個(gè)重要更新多劇集Agent,打開“多劇集”,用戶就能進(jìn)行長(zhǎng)劇集多文本創(chuàng)作。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

該Agent會(huì)分析文本、給出多劇集大綱、塑造整個(gè)劇集的人物和場(chǎng)景塑造,商湯科技Seko產(chǎn)品負(fù)責(zé)人王子彬稱,相比于Seko 1.0,2.0可以直接在編輯界面對(duì)所有人物和場(chǎng)景進(jìn)行精確控制和剪輯。

可以看到在畫面左側(cè),用戶能點(diǎn)擊+號(hào)生成下一集,其會(huì)延續(xù)第一集的故事設(shè)定,保持人物和場(chǎng)景一致。用戶還能進(jìn)行更為細(xì)節(jié)的交互式處理,如每一個(gè)圖片、分鏡、口型、畫布等都可以進(jìn)行修改。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

在上述更新之上,Seko 2.0可以支持多達(dá)100集的劇本連續(xù)創(chuàng)作。

這波更新,一方面為專業(yè)創(chuàng)作者提供了更全面的工具支持,另一方面讓非專業(yè)人士也能快速上手,輕松將創(chuàng)意想法轉(zhuǎn)化為實(shí)際視頻。

智東西也體驗(yàn)了下Seko 2.0的生成效果,在沒有結(jié)合其他視頻創(chuàng)作工具的同時(shí),從輸入靈感、生成大綱、分鏡到調(diào)整分鏡圖、生成視頻、導(dǎo)出,智東西在十幾分鐘內(nèi)就得到了1分鐘左右的一集AI短劇。

生成分鏡后,用戶可以點(diǎn)擊分鏡圖上方的畫布編輯和對(duì)口型,對(duì)應(yīng)修改這一部分的視頻內(nèi)容,或者直接在左下角的對(duì)話框輸入提示詞重新生成圖片。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

生成的短劇視頻中,女主角的形象在不同場(chǎng)景切換、不同表情變化的過程中始終保持高度一致,無違和感與割裂感。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

并且主角人物表情變化十分細(xì)膩,在女主角內(nèi)心獨(dú)白時(shí),其通過皺眉到低頭、神色緩和的表情變化,將人物內(nèi)心變化準(zhǔn)確刻畫了出來。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

此次版本更新后,我們?cè)赟eko 2.0平臺(tái)上的整體操作更加流暢自然,它中間還支持用戶對(duì)細(xì)節(jié)的自定義修改,生成內(nèi)容更加契合用戶需求。從生成的結(jié)果來看,不僅劇情連貫,人物、場(chǎng)景能前后保持一致。更關(guān)鍵的是,對(duì)于專業(yè)創(chuàng)作者而言,一次就可以完成100集的超長(zhǎng)制作!

二、四大核心技術(shù)加持,AI短劇告別換臉穿幫、口型對(duì)不上

從上面的視頻生成效果來看,Seko 2.0已經(jīng)支持在多人連續(xù)對(duì)話時(shí)精準(zhǔn)匹配口型,且能在切換場(chǎng)景與劇集時(shí)保證人物表情、形象全程一致,且生成速度高效快捷。

這背后是商湯科技針對(duì)性的技術(shù)全棧升級(jí)。

第一是角色一致性技術(shù)SekoIDX,其通過擴(kuò)散模型優(yōu)化,平衡參考圖相似性與提示詞響應(yīng)性,使得生成效果精準(zhǔn)可控。

短劇創(chuàng)作中,換臉式穿幫問題會(huì)因?yàn)槿四樧冃?、特征失真等瑕疵破壞畫面真?shí)感,影響觀眾的沉浸式觀看體驗(yàn),同時(shí)在保證一致性的同時(shí)還要讓人臉隨場(chǎng)景、表情變化更加自然、真實(shí)。

基于此,其會(huì)提供正向和反向的參考圖,適當(dāng)加入副參考圖,以兼顧主體的多樣性和一致性,避免直接像復(fù)制粘貼主體形象。

第二是多人對(duì)口型方案SekoTalk,這也是業(yè)內(nèi)首個(gè)支持超過2人對(duì)口型的方案。對(duì)于短劇而言,多人對(duì)口型是強(qiáng)需求,且往往在制作過程中會(huì)面臨多人對(duì)話、連續(xù)切換說話人、口癖還原等核心痛點(diǎn)。

商湯科技的實(shí)時(shí)語音驅(qū)動(dòng)數(shù)字人技術(shù)SekoTalk,可以在8卡服務(wù)器上達(dá)到25 FPS的生成速度,首幀延遲低至3.5秒,同時(shí)做到多人、多語言的口型精準(zhǔn)匹配和超長(zhǎng)時(shí)間穩(wěn)定生成。

第三是效率提升技術(shù)Phased DMD蒸餾,進(jìn)一步降低多劇集生成成本。

擴(kuò)散模型低步數(shù)生成的質(zhì)量受限于等效模型質(zhì)量,如果等效模型容量不足,低步數(shù)生成的視頻就會(huì)出現(xiàn)模糊、細(xì)節(jié)缺失、邏輯混亂等問題。主流SOTA視頻生成模型已經(jīng)驗(yàn)證了MoE技術(shù)的優(yōu)勢(shì),不需要增加推理階段的計(jì)算開銷。

商湯科技研究團(tuán)隊(duì)創(chuàng)新性提出Phased DMD技術(shù),既能提升蒸餾模型生成的動(dòng)態(tài)效果和多樣性,使SekoTalk推理開銷在降低1/25的同時(shí),仍保持教師模型良好的肢體運(yùn)動(dòng)效果和情緒表現(xiàn)力。

同時(shí)Seko 2.0已經(jīng)支持性價(jià)比更高的寒武紀(jì)芯片適配方案。

最后是商湯開源的行業(yè)首個(gè)能夠達(dá)到實(shí)時(shí)視頻生成的推理框架LightX2V,其與模型協(xié)同設(shè)計(jì),支持低資源部署。

商湯科技在模型和系統(tǒng)設(shè)計(jì)之初,就讓它們?nèi)谌氲捅忍亓炕兄?xùn)練、稀疏注意力等原生優(yōu)化,配合自研“SPARSE+NVFP4+低比特通信”高效注意力算子,模型訓(xùn)練完成后可直接低資源部署。這一開源框架的累計(jì)下載量已超350萬次。

總的來看,Seko 2.0的升級(jí)正是聚焦短劇行業(yè)痛點(diǎn),真正達(dá)成生成質(zhì)量與效率的雙向平衡。其能實(shí)現(xiàn)分鐘級(jí)出片,還能通過多劇集一致性保證生成視頻的質(zhì)量,更將成本壓至最優(yōu),破解行業(yè)的產(chǎn)能與質(zhì)量焦慮。

三、Seko進(jìn)化:讓AI短劇進(jìn)入分分鐘出片、零基礎(chǔ)上手的全民時(shí)代

以Seko為代表的AI視頻創(chuàng)作平臺(tái)的出現(xiàn)與升級(jí)迭代,讓AI短劇迎來風(fēng)口。

談及Seko的產(chǎn)品迭代理念,王子彬談道,他們的產(chǎn)品定位是和創(chuàng)作者做朋友、為創(chuàng)作者提供便利、滿足創(chuàng)作者的需求,也就是真正把“一切圍繞創(chuàng)作者”落到實(shí)處。

這也可以從Seko的用戶畫像看出來,他補(bǔ)充說,其有固定創(chuàng)作需求的用戶占比在50%~60%之間,這類用戶分兩類,一類是專業(yè)高頻創(chuàng)作者,他們對(duì)自己的內(nèi)容有高度把控性和要求,更看重工具易用性;另一類是MCN創(chuàng)作者,其對(duì)視頻創(chuàng)作有自己的理解,有固定每周1~2個(gè)視頻創(chuàng)作需求。

王子彬談道,《婉心計(jì)》就是專業(yè)創(chuàng)作團(tuán)隊(duì)基于Seko打造的AI短劇,創(chuàng)作團(tuán)隊(duì)會(huì)使用Seko完成大部分流程,然后調(diào)用其他工具進(jìn)行高精修完善創(chuàng)作。

全民AI短劇時(shí)代來了!商湯Seko 2.0登場(chǎng),分分鐘手搓百級(jí)劇情,你做的AI短劇也能登上熱榜

▲AI短劇《婉心計(jì)》片段

最后一部分是完全沒有創(chuàng)作經(jīng)驗(yàn)的用戶,其占比達(dá)到30%-40%,這部分用戶一般而言沒有二次創(chuàng)作需求,很難長(zhǎng)期留存。

無論是具備AI視頻創(chuàng)作基礎(chǔ)的進(jìn)階用戶,還是意欲嘗鮮體驗(yàn)的入門群體,Seko均可全面覆蓋其差異化需求

如今Seko再度更新,為AI短劇創(chuàng)作門檻帶來一場(chǎng)降維革命。

此前視頻制作需要專業(yè)的創(chuàng)作團(tuán)隊(duì),且成本甚至高達(dá)百萬元級(jí)別,如今普通人就可以在家用PC制作一部成片,讓視頻創(chuàng)作應(yīng)用到了更為廣泛的場(chǎng)景。

如山西一位語文老師通過Seko,將學(xué)生的作文直接轉(zhuǎn)換成了視頻,在播放的過程中,通過視頻形式增強(qiáng)學(xué)生對(duì)好的作文內(nèi)容的認(rèn)同感與共鳴感,同時(shí)能進(jìn)一步增強(qiáng)其創(chuàng)造力和想象力。

此外還有不少跨界創(chuàng)作熱潮,如程序員借Seko圓了武俠夢(mèng)、作家讓筆下小說一鍵變身可視化影像、公務(wù)員用它制作生動(dòng)的歷史動(dòng)畫……使得AI視頻工具打破行業(yè)壁壘,釋放更大的產(chǎn)業(yè)價(jià)值。

在視頻創(chuàng)作領(lǐng)域,新人入門難、產(chǎn)能低的難題也被破解。

過去漫劇新人需掌握分鏡設(shè)計(jì)、剪輯、模型適配等專業(yè)技能,上手周期長(zhǎng)且易因操作失誤影響產(chǎn)出;而Seko通過簡(jiǎn)化交互、智能調(diào)度模型等功能,讓新人無需復(fù)雜學(xué)習(xí)就能快速啟動(dòng)創(chuàng)作。據(jù)了解,已經(jīng)有漫劇工作室新人通過Seko快速上手,日均產(chǎn)出3-4集成片。

產(chǎn)業(yè)發(fā)展有一大規(guī)律是,當(dāng)創(chuàng)作工具實(shí)現(xiàn)普惠,必將催生行業(yè)增長(zhǎng)的正向循環(huán)。

Seko進(jìn)一步拉低視頻創(chuàng)作的門檻,使得更多元化的創(chuàng)作者團(tuán)隊(duì)入局,讓更多創(chuàng)意大神將腦洞變成新穎的視頻,緩解短劇劇情同質(zhì)化的困境,帶動(dòng)產(chǎn)業(yè)規(guī)?;鲩L(zhǎng)。

結(jié)語:AI視頻制作工具,正加速拆掉短劇創(chuàng)作門檻

伴隨AI技術(shù)進(jìn)階,視頻生成正在打破視頻生成的壁壘,從此前依賴高端、專業(yè)團(tuán)隊(duì)的創(chuàng)作形式,向普通人也能輕松參與其中的方式擴(kuò)展。

從Seko的發(fā)展軌跡來看,AI視頻生成工具正朝著推動(dòng)視頻生成產(chǎn)業(yè)實(shí)現(xiàn)質(zhì)量與規(guī)模同步提升發(fā)展,既通過多維度的技術(shù)優(yōu)化保障內(nèi)容輸出的高質(zhì)量,又以高效生成能力支撐規(guī)?;蓜?chuàng)意視頻,人人都是創(chuàng)作者的時(shí)代真要來了。