智東西(公眾號:zhidxcom)
作者 | 江宇
編輯 | 漠影

智東西9月24日報(bào)道,阿里巴巴旗下夸克今日發(fā)布全新AI創(chuàng)作平臺“造點(diǎn)”,集成圖像與視頻生成能力,并接入最新版本的通義萬相模型Wan2.5,成為目前國內(nèi)首個(gè)支持“音畫同步”生成的公開平臺。

夸克發(fā)布AI創(chuàng)作平臺“造點(diǎn)”,接入通義Wan2.5和Midjourney V7,現(xiàn)在免費(fèi)體驗(yàn)

用戶可通過輸入文本,一鍵生成圖像或視頻。此外,在視頻生成方面,通義萬相Wan2.5支持10秒長度、24幀每秒、1080P分辨率,并可同步生成語音、音效與背景音樂,實(shí)現(xiàn)更完整的故事表達(dá)。

通義萬相Wan2.5還具備較強(qiáng)的指令響應(yīng)能力,可在生成過程中呈現(xiàn)運(yùn)鏡等連續(xù)變化效果。

圖像生成方面,“造點(diǎn)”引入了Midjourney V7模型,并結(jié)合夸克自研算法進(jìn)行本地化優(yōu)化,突出亞洲人像、中文文字及國風(fēng)視覺表現(xiàn)能力。該平臺支持多圖參考、風(fēng)格代碼、精細(xì)參數(shù)調(diào)節(jié)等功能,還面向電商設(shè)計(jì)、影游內(nèi)容創(chuàng)作等專業(yè)場景開放使用。

目前,用戶可訪問官網(wǎng)或通過夸克PC端“AI生圖”入口進(jìn)入“造點(diǎn)”。移動端則支持“一句話P圖”“AI創(chuàng)意視頻”“風(fēng)格轉(zhuǎn)化”等功能。截止至9月30日,通義萬相Wan2.5視頻生成功能將面向用戶開放免費(fèi)體驗(yàn)。

夸克發(fā)布AI創(chuàng)作平臺“造點(diǎn)”,接入通義Wan2.5和Midjourney V7,現(xiàn)在免費(fèi)體驗(yàn)

相比單一模型或單一模態(tài)的工具,“造點(diǎn)”在一個(gè)平臺內(nèi)集成圖像與視頻生成能力,嘗試覆蓋更多創(chuàng)作需求。依托通義萬相與Midjourney等主流模型的集成,該平臺在提升生成質(zhì)量的同時(shí),也降低了內(nèi)容創(chuàng)作的門檻。

從當(dāng)前開放功能來看,其在畫質(zhì)呈現(xiàn)、音畫同步上的表現(xiàn)已有初步完成度,但在長視頻生成、多輪調(diào)整等方面仍有待后續(xù)觀察。