智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影

智東西6月12日報道,今日,美圖推出一款能落地的AI視頻產(chǎn)品MOKI,可以輔助創(chuàng)作者打造動畫短片、網(wǎng)文短劇、故事繪本和MV,讓人人都可以用AI輕松創(chuàng)作短片作品。

為了提升可控性,美圖打造了AI短片工作流,只要輸入一小段故事創(chuàng)意,就能用AI快速生成具有完整結(jié)構(gòu)的腳本,然后進行視覺風(fēng)格、角色形象、角色配音、旁白配音等前期設(shè)定的選擇。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

下一步,用AI根據(jù)前期設(shè)定生成分鏡圖,對分鏡圖進行局部修改,將分鏡圖轉(zhuǎn)成視頻素材,用臺詞驅(qū)動角色開口說話。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

最后通過智能剪輯、AI配樂、AI音效、自動字幕等功能將所有素材自動串聯(lián)成片,一條AI短片作品就完成了。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖還與Ainimate Lab共創(chuàng)了一支AI短片。

MOKI將于7月31日上線,訪問www.moki.cn可體驗。

除了MOKI外,美圖還推出專業(yè)級AI批量修圖軟件美圖云修V2、用AI制作口播視頻開拍V2、面向電商人的AI設(shè)計工具美圖設(shè)計室V3、找優(yōu)質(zhì)設(shè)計服務(wù)的視覺創(chuàng)意平臺站酷、游戲物料AI制作與投放平臺奇覓。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

6款產(chǎn)品覆蓋商業(yè)攝影、口播視頻、電商設(shè)計、設(shè)計服務(wù)、游戲營銷、視頻生成領(lǐng)域,將進一步完善美圖的AI產(chǎn)品生態(tài)。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻宣布,美圖奇想大模型(MiracleVision)已升級到V5版本,美圖將正在通過將AI單點功能串聯(lián)成“AI工作流”,進一步助力電商、廣告、游戲、影視、動漫五大行業(yè)提高生產(chǎn)力。

隨著大模型能力持續(xù)升級,未來美圖將拓展更多視頻創(chuàng)作場景,為創(chuàng)作者提供更加簡單高效的AI短片工作流。

在以AI工作流助力行業(yè)和用戶提效的同時,美圖公司全球VIP會員數(shù)創(chuàng)下歷史新高,截至6月11日,美圖全球VIP會員數(shù)為1063萬。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

一、AI視頻產(chǎn)品如何落地?美圖升級大模型架構(gòu),6大亮點支撐AI短片創(chuàng)作

今年2月,OpenAI發(fā)布AI文生視頻模型Sora,并引發(fā)文生視頻領(lǐng)域的激烈競賽。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

在Sora發(fā)布后,美圖第一時間升級了視頻大模型技術(shù)架構(gòu),從U-Net架構(gòu)升級到了更強的DiT架構(gòu),同時還升級了編解碼技術(shù),實現(xiàn)了空間域和時間域的同步壓縮。

下面美圖用其自研視頻大模型的部分內(nèi)測效果快剪的一個治愈向視頻合集。

這只是近期的一個內(nèi)測效果,下個月美圖將推出效果更好的進階版本。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖基于與用戶需求與產(chǎn)品追求自研視頻大模型,升級后的美圖視頻大模型有6大亮點:更強的模型架構(gòu)、更大的模型參數(shù)量、更準(zhǔn)的語義理解、更長的視頻時長、更好的動態(tài)連續(xù)性、更高的畫面穩(wěn)定性

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻談道,美圖通過AI短片創(chuàng)作工具MOKI解決了視頻大模型“故事成片難”、“可控性較差”的問題。

在他看來,目前市場上的AI視頻產(chǎn)品傾向于提供像文生視頻這樣的常規(guī)能力,但美圖團隊認(rèn)為只有深度理解創(chuàng)作者的需求、提煉有共性的視頻場景,才能打造輔助內(nèi)容創(chuàng)作的工具。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

以前用視頻大模型輔助內(nèi)容創(chuàng)作會遇到視覺風(fēng)格、場景、角色不一致,無法用分鏡進行整體把控,角色無法開口說話等難點。

與常規(guī)文生視頻產(chǎn)品不同,MOKI深度理解視頻創(chuàng)作者需求,實現(xiàn)內(nèi)容和成本的雙重可控,目前可以進行多種視頻場景的AI短片創(chuàng)作。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖根據(jù)制作成本和內(nèi)容可控性分析了主流視頻的形式。

空鏡素材對內(nèi)容可控性的要求最低,生成成本也最低,可靈活應(yīng)用在各種各樣的視頻里面;專業(yè)影視制作,比如用視頻大模型輔助電影電視劇的制作,對于內(nèi)容可控性有極高的要求,制作成本也是最高的。

所以基于對內(nèi)容可控性與制作成本的最大考量,MOKI不做常規(guī)的文生視頻,而是聚焦于AI短片創(chuàng)作,專注于像動畫短片、網(wǎng)文短劇、故事繪本MV等視頻場景。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

借助美圖奇想大模型的底層能力,可構(gòu)建一個從前期設(shè)定到AI內(nèi)容生成再到后期制作的AI短片工作流。與傳統(tǒng)工作流相比,MOKI大大提升了短片的制作效率,讓視頻創(chuàng)作更加簡單高效。

二、美圖奇想大模型升級到V5:覆蓋圖像、視頻、音頻、文本

吳欣鴻認(rèn)為,在影像與設(shè)計行業(yè),AI是推動創(chuàng)新和提升效率的重要力量。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖奇想大模型(MiracleVision)發(fā)布于2023年6月,是國內(nèi)首個懂美學(xué)的AI視覺大模型,為美圖全系產(chǎn)品提供AI模型能力。

升級到V5版本的奇想大模型(MiracleVision)采用美圖自研DiT技術(shù)架構(gòu),涵蓋圖像大模型、視頻大模型、音頻大模型和文本大模型,擁有更好的擴展性與更大的參數(shù)量,在語義理解、畫面穩(wěn)定性、動態(tài)連續(xù)性、主體一致性、內(nèi)容可控性以及生成時長等方面,獲得全方位提升。

據(jù)介紹,美圖奇想大模型整合了Weitu AI的多模態(tài)能力,能理解圖像、視頻、音頻、文本等信息,讓用戶使用自然語言交互實現(xiàn)影像創(chuàng)作。例如使用美圖秀秀里的AI助手RoboNeo,用戶只用簡單的自然語言指令,就能完成一系列復(fù)雜的AI改圖、AI消除等圖像編輯功能。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

目前,美圖的AI產(chǎn)品生態(tài)已經(jīng)進一步完善:

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

應(yīng)用層有AI圖像、AI視頻、AI設(shè)計、AI營銷四大模塊的多款產(chǎn)品,生態(tài)層由中國領(lǐng)先的視覺創(chuàng)意平臺站酷美圖AI助手RoboNeo提供服務(wù),模型層由美圖奇想大模型(MiracleVision)為全系產(chǎn)品提供AI模型能力。

“作為一家以美為核心的公司,我們對效果有著極高的要求。只有自研視頻大模型,才能以高標(biāo)準(zhǔn)不斷提升效果。同時,只有將模型與產(chǎn)品深度融合,做到模型即產(chǎn)品,才能給用戶最好的體驗。”吳欣鴻說。

三、多款新品發(fā)布:每小時修圖1000張,十分鐘做出高質(zhì)量口播視頻

結(jié)合美圖的應(yīng)用實踐,吳欣鴻分享了三個觀點:1)目前AI技術(shù)領(lǐng)先于AI應(yīng)用,AI應(yīng)用比想象中慢不少;2)好概念≠好產(chǎn)品,將AI概念轉(zhuǎn)化為優(yōu)秀產(chǎn)品的并不多;3)要讓AI幫用戶創(chuàng)收,用戶愿意為能創(chuàng)造價值的AI產(chǎn)品付費。

對比傳統(tǒng)工作流,AI工作流有五大優(yōu)勢:1)云端與客戶端實現(xiàn)算力融合;2)一個人就是一支團隊,AI能夠自動化解決很多重復(fù)性的勞動,還能讓非專業(yè)人士借助AI解決專業(yè)領(lǐng)域的問題;3)AI能提供近乎無限的靈感創(chuàng)意庫;4)AI會像搭積木一樣,按需調(diào)整,用不同的能力組成工作流,從而完成特定任務(wù);5)AI工作流中模型能夠基于數(shù)據(jù)自動迭代,速度遠超人工。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

除了MOKI外,美圖今日還發(fā)布另外5款圍繞影像與設(shè)計AI工作流的產(chǎn)品:

1、美圖云修V2:專業(yè)級AI批量修圖軟件,年修圖數(shù)量已超過5億張,成功幫助商業(yè)攝影門店提升了12倍的精修效率。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

新版美圖云修升級了AI批量精修和AI批量調(diào)色能力,將修圖效率提升到每小時1000張,已開放API服務(wù),實現(xiàn)即傳即修即用,進一步幫助商業(yè)攝影客戶大幅提效。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

2、開拍V2:用AI制作口播視頻,月活躍用戶數(shù)已接近70萬,累計內(nèi)容創(chuàng)作數(shù)超過4000萬,訂閱收入也高速增長,成為一款月毛利突破百萬的AI應(yīng)用。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

新版開拍升級了AI腳本、AI數(shù)字人、視頻翻譯、一鍵包裝等能力,10秒鐘就能學(xué)會了綜藝感剪輯,不到30分鐘就能創(chuàng)作出一條高質(zhì)量口播視頻,解決口播視頻創(chuàng)作者的策劃、制作、變現(xiàn)等難題。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

3、美圖設(shè)計室V3:面向電商人的AI設(shè)計工具,擁有近1800萬個月活躍用戶,每月產(chǎn)生超過4000萬的電商物料數(shù)。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

新版美圖設(shè)計室升級了AI批量化能力和AI商品視頻創(chuàng)作能力,并支持團隊多人協(xié)作,大幅提升電商物料設(shè)計產(chǎn)能。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

4、站酷:找優(yōu)質(zhì)設(shè)計服務(wù)的平臺,今年上半年加入美圖大家庭,已有1700萬視覺創(chuàng)意人入駐,擁有4.6億的正版素材,與超過1500家知名品牌達成了深度合作。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

站酷推出找人高效、流程簡單、售后放心的設(shè)計服務(wù)平臺,目前有14類設(shè)計服務(wù),連接廣大設(shè)計需求者和千萬級專業(yè)設(shè)計師,以幫助每一位有設(shè)計需求的用戶輕松搞定設(shè)計,今日正式上線。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

5、奇覓:游戲物料AI制作與投放平臺,融合了美圖的AI影像技術(shù)與睿晟的游戲營銷經(jīng)驗,為游戲營銷行業(yè)提供廣告的高效制作與精準(zhǔn)投放,今日正式上線,并開啟免費試用。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

游戲廣告有制作成本高、投放成本高兩大痛點。奇覓AI靈感庫提供了熱點雷達,實時捕捉全網(wǎng)游戲熱點,找到游戲玩家關(guān)注度最高的話題,幫助廣告策劃人員去激發(fā)創(chuàng)意;AI廣告解析功能可以對熱門廣告的腳本、畫面、配音、配樂進行全方位拆解,快速洞察廣告火爆的原因。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

在正式投放前,AI投前分析5分鐘內(nèi)就能完成數(shù)十條廣告的預(yù)審核和投放潛力的評估,快速過濾掉高風(fēng)險的廣告,或者說投放潛力低的廣告。還有批量創(chuàng)建投放計劃,可針對不同的人群去搭建差異化的廣告策略,僅需10分鐘就可以完成3000多條不同廣告計劃的設(shè)置。奇覓現(xiàn)已覆蓋巨量引擎、華為、OPPO、vivo等主流廣告平臺,只需1分鐘就能直達這些游戲投放渠道。

結(jié)語:未來AI工作流將進化成AI平臺生態(tài)

隨著AI大模型的發(fā)展,AI應(yīng)用將經(jīng)歷從點到線再到面的三階段。美圖打造了眾多爆款的AI單點功能,希望把這些單點功能串成AI工作流,幫助電商、廣告、游戲、影視、動漫等行業(yè)進一步提高生產(chǎn)力。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

吳欣鴻說,美圖將繼續(xù)探索AI應(yīng)用更深層次的價值,相信在不遠的將來,AI工作流會進化成AI平臺生態(tài),深入影響我們的工作和生活。

美圖在過去兩屆美圖影像節(jié)發(fā)布的AI產(chǎn)品已得到用戶和市場認(rèn)可,多次登頂日本、韓國、泰國、越南等國App Store總榜第一。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

此外,美圖設(shè)計室全年收入過億,Wink是視頻工具賽道第二名,美圖證件照是在線證件照賽道第一名,開拍是口播創(chuàng)作工具賽道第一名。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

為持續(xù)推動AI應(yīng)用落地實踐,在第三屆美圖影像節(jié)現(xiàn)場,開拍宣布推出“開拍AI助農(nóng)計劃”,提供三農(nóng)主題的AI腳本和素材,輔導(dǎo)新農(nóng)人拍攝和制作視頻,以AI技術(shù)助力農(nóng)村經(jīng)濟發(fā)展。

能落地的AI視頻產(chǎn)品來了!分分鐘創(chuàng)作AI短片,自帶配音和音效,美圖奇想大模型V5發(fā)布

美圖設(shè)計室則推出“小微電商AI助力計劃”,圍繞義烏、廣州、泉州等電商集中城市,助力電商個體創(chuàng)業(yè)者“一個人就是一支團隊”,后續(xù)還將啟動“電商AI設(shè)計課程”,幫助電商用戶提升AI設(shè)計技能和訂單轉(zhuǎn)化。

“美圖是一家成立16年,DNA里刻著對產(chǎn)品的熱愛,并始終保持創(chuàng)業(yè)心態(tài)的公司?!眳切励櫿劦?,面對正在發(fā)生的技術(shù)與商業(yè)變革,美圖將通過實踐不斷探索落地場景,深耕AI應(yīng)用,為用戶和客戶打造更好的AI工作流,讓每個人都能享受到AI的價值。