智東西AI前瞻(公眾號(hào):zhidxcomAI)
作者|江宇
編輯|漠影

智東西9月19日?qǐng)?bào)道,近日,夸克AI生圖已悄悄接入MidJourney V7模型,支持通過中文提示詞調(diào)用該模型的圖像生成能力。MidJourney V7是目前行業(yè)中表現(xiàn)較為突出的AI生圖模型,其在細(xì)節(jié)呈現(xiàn)、構(gòu)圖精度與風(fēng)格融合方面具備較高完成度,尤其在藝術(shù)化視覺表現(xiàn)上更為擅長,此次接入可讓用戶直接體驗(yàn)V7的圖像生成能力。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

智東西獲得本輪內(nèi)測資格后,第一時(shí)間進(jìn)行了實(shí)測體驗(yàn)。

進(jìn)入夸克AI生圖界面后,模型默認(rèn)選中為MidJourney V7。用戶可直接在輸入框內(nèi)輸入中文提示詞,或使用下方“智能潤色”進(jìn)行語言優(yōu)化,也可以點(diǎn)擊“特征詞”快速選擇圖像風(fēng)格標(biāo)簽,例如“肖像精細(xì)”“復(fù)古風(fēng)”“夢幻效果”“色彩鮮明”等。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

夸克AI生圖還支持開啟“加速生成”功能,耗時(shí)約15秒,需要消耗16積分;不加速則耗時(shí)約30秒,默認(rèn)消耗8積分。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

一次生成圖像數(shù)量為4張,畫面比例也可在多種尺寸間切換,包括1:1、16:9、3:2、4:3、9:16等。

此外,在“美學(xué)控制”部分還提供三個(gè)可調(diào)參數(shù),分別為:

1、風(fēng)格化:控制畫面藝術(shù)風(fēng)格的強(qiáng)弱,數(shù)值越高,圖像越藝術(shù)化、越遠(yuǎn)離提示詞原意;數(shù)值越低,則越貼近提示詞。

2、怪異化:用于引入超現(xiàn)實(shí)或不規(guī)則元素,適合進(jìn)行實(shí)驗(yàn)性或先鋒風(fēng)格創(chuàng)作。

3、多樣化:控制4張圖像之間的差異程度,數(shù)值越高,四圖構(gòu)圖與風(fēng)格差異越大。

以初始提示詞“一位婦女的肖像,她的眼睛反射著星系,頭發(fā)像北極光一樣流動(dòng),穿著傳統(tǒng)服裝,神秘而智慧”為例,點(diǎn)擊“智能潤色”后,系統(tǒng)會(huì)自動(dòng)生成一版優(yōu)化后的提示詞——“一位穿著中國傳統(tǒng)長袍的女性,她的深邃眼睛仿佛能映照出遙遠(yuǎn)的星系,瞳孔中閃爍著銀河般的光芒,如同夜空中的北極光在她秀發(fā)間流轉(zhuǎn),飄逸的發(fā)絲在微風(fēng)中輕輕舞動(dòng),透露出神秘而智慧的氣質(zhì),背景是傳統(tǒng)中國山水畫風(fēng)格的朦朧山川?!庇脩粢部梢赃x擇重新潤色,替換為不同版本。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

智東西選擇了優(yōu)化后的提示詞,在默認(rèn)設(shè)置下進(jìn)行生成:風(fēng)格化設(shè)為100,其余參數(shù)為0,圖像比例為1:1。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

隨后智東西還嘗試了其余參數(shù)組合的生成效果:

1、風(fēng)格化-0,怪異化-100,多樣化-0;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

2、風(fēng)格化-0,怪異化-0,多樣化-100;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

同時(shí),我們也測試了幾組創(chuàng)意類提示詞,覆蓋未來主義、神話風(fēng)格、寫實(shí)幻想等多個(gè)方向,進(jìn)一步觀察V7模型在不同題材下的風(fēng)格表達(dá)能力。

1、故障新藝術(shù)賽博美人魚,光纖發(fā)絲穆夏發(fā)型,裝飾藝術(shù)金屬尾鰭,全息孔雀羽毛QR鱗片;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

2、新藝術(shù)太空艙,穆夏風(fēng)格外星植物,彩色玻璃舷窗分形星座,裝飾藝術(shù)面板發(fā)光海藻;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

3、故障賽博埃及王,NFT象形文身,碎屏假睫毛,USB頭飾流沙;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

4、在月球表面進(jìn)行的一場足球比賽,穿著宇航服的宇航員在踢球,地球在背景中可見,低重力導(dǎo)致動(dòng)作夸張;

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

5、在未來主義背景下的一場時(shí)裝秀,模特們穿著融合了歷史風(fēng)格和科幻元素的服裝,伊麗莎白時(shí)代的領(lǐng)子帶有全息投影,維多利亞時(shí)代的裙子帶有霓虹裝飾,創(chuàng)意而前衛(wèi);

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

6、一幅靜物畫,展示了一場由珍貴寶石和金屬制成的盛宴,水果像鉆石一樣閃耀,面包有著金色的外殼,一個(gè)高腳杯里溢出液態(tài)銀,奢華而超現(xiàn)實(shí);

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

從生成效果來看,MidJourney V7在這些極具創(chuàng)意和風(fēng)格跨度的提示詞下展現(xiàn)出較強(qiáng)的構(gòu)圖能力,能實(shí)現(xiàn)高完成度的細(xì)節(jié)呈現(xiàn)與視覺統(tǒng)一性,尤其在材質(zhì)質(zhì)感與色彩融合方面表現(xiàn)突出。

除了文本生成圖像功能外,夸克AI生圖也支持上傳參考圖來輔助生成,進(jìn)一步增強(qiáng)了提示詞控制能力。用戶在上傳參考圖后,可從三種參考方式中進(jìn)行選擇,分別為“智能參考”“主體參考”和“風(fēng)格參考”,對(duì)應(yīng)不同的生成策略與圖像融合強(qiáng)度。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

智東西在體驗(yàn)中選擇上傳了馬斯克的一張照片,并輸入提示詞“將男人的帽子移除,替換成一個(gè)禮帽”。

在“智能參考”模式下,生成結(jié)果能大致保留人物面部特征與背景構(gòu)圖,但在帽子替換過程中出現(xiàn)了細(xì)節(jié)失真,模型更注重整體畫面一致性,但人物一致性有一定程度的下降。整體來看,參考圖功能拓展了生圖控制方式,但在人物細(xì)節(jié)、面部表情的精準(zhǔn)還原方面仍存在優(yōu)化空間。

夸克悄悄接入MidJourney V7,中文就能用,實(shí)測藝術(shù)感拉滿

結(jié)語:模型能力強(qiáng),平臺(tái)適配是下一個(gè)挑戰(zhàn)

MidJourney V7具備極強(qiáng)的視覺表現(xiàn)力,在構(gòu)圖、材質(zhì)、色彩和藝術(shù)風(fēng)格的表達(dá)上可支持較復(fù)雜場景生成。從體驗(yàn)來看,通過夸克接入后的生成效果已經(jīng)具備較高水準(zhǔn),能夠支撐多數(shù)創(chuàng)作類或視覺靈感場景需求。

但同時(shí),中文提示詞的適配與調(diào)優(yōu)仍存在一定提升空間,尤其是在精確控制細(xì)節(jié)、保持人物一致性等方面,仍需進(jìn)一步打磨。