智東西(公眾號(hào):zhidxcom)
編譯 | 徐珊
編輯 |?云鵬

智東西6月17日消息,據(jù)Facebook官網(wǎng)顯示,他們剛剛公布了一個(gè)新的AI項(xiàng)目——文本樣式筆刷(TextStyleBrush)。只需要提交某一個(gè)單詞的圖像,文本樣式筆刷就可以復(fù)制照片中文字的字跡,然后將其他文本統(tǒng)一替換成該類文字的樣式。簡(jiǎn)單來說,就是可以模仿你的字跡。

同時(shí),文本樣式筆刷技術(shù)運(yùn)用了一種新的自我監(jiān)督AI模型,可以預(yù)先通過字體分類器(font classifier)和文本識(shí)別器(text recognizer)訓(xùn)練來識(shí)別源樣式(source style samples)和目標(biāo)內(nèi)容。

Facebook認(rèn)為,文本樣式筆刷將釋放人們的創(chuàng)造性以及自我表達(dá)的潛力,協(xié)助打造個(gè)性化的文本和字幕。在AR領(lǐng)域,文本樣式筆刷可以提供虛擬和現(xiàn)實(shí)之間的文本轉(zhuǎn)換(photo-realistic translation of languages)技術(shù)。

目前,這份研究成果已經(jīng)在6月10日發(fā)表在Facebook官網(wǎng),報(bào)告名稱為《文本樣式筆刷:通過一個(gè)簡(jiǎn)單的例子來繼承“字形美學(xué)”(TextStyleBrush: Transfer of text aesthetics from a single example)》。

AI換臉后又來AI換字!Facebook打造了“文字版的Deepfake”

報(bào)告鏈接:

https://ai.facebook.com/research/publications/textstylebrush-transfer-of-text-aesthetics-from-a-single-example

一、文字版Deepfake,可自主理解“字跡”

文本樣式筆刷類似于文字處理器里的格式刷工具,更像文字版本的Deepfake(AI換臉軟件)。

文本樣式筆刷采用了先進(jìn)的AI訓(xùn)練方法,可以一次性傳輸所有信息,然后自動(dòng)分離圖像中的文字信息與字體邊框、紙張背景等,不需要重新輸入新的源樣式示例。

與之前大多數(shù)人工圖像生成技術(shù)不同,文本樣式筆刷并不需要研發(fā)者設(shè)定特定類型或目標(biāo)樣式的參數(shù)。研發(fā)團(tuán)隊(duì)試圖構(gòu)建一個(gè)足夠靈活的人工智能系統(tǒng)來理解現(xiàn)實(shí)生活中不同文本和筆跡之間的細(xì)微差別。

AI換臉后又來AI換字!Facebook打造了“文字版的Deepfake”

▲圖源Facebook

這意味著,該人工智能系統(tǒng)需要自主理解任何字體的呈現(xiàn)形式,不僅是字體、書法、文字風(fēng)格,而且還需要理解字體形式的不同變換,如旋轉(zhuǎn)、彎曲(curved text)、紙筆之間的變形,以及圖片背景干擾(image noise)等。

如果AI不能剔除這些干擾信息,就不能從圖片中完整地得到文字本身的相關(guān)信息。同時(shí),研發(fā)團(tuán)隊(duì)也很難為整個(gè)字母表或者數(shù)字的所有呈現(xiàn)形式都配上注釋。

該項(xiàng)研究證明,人們可以借助AI,在各類場(chǎng)景中更加靈活和準(zhǔn)確地表達(dá)“字體美學(xué)”。但研究報(bào)告也同時(shí)提到,目前文本樣式筆刷技術(shù)仍有不足,還難以識(shí)別金屬材質(zhì)或不同顏色的文本。

二、多場(chǎng)景普遍使用,直接合成逼真照片

經(jīng)驗(yàn)表明,文本樣式筆刷可以模仿垃圾桶、路牌、飲料瓶、店面裝飾等多場(chǎng)景下字體的文本樣式。

文本樣式筆刷技術(shù)對(duì)合成圖片的要求同樣很高。

AI換臉后又來AI換字!Facebook打造了“文字版的Deepfake”

▲圖源Facebook研究報(bào)告

TextStyleBrush模型是基于StyleGAN2設(shè)計(jì),能夠形成非常逼真的圖片。

文本樣式筆刷技術(shù)不但可以將印刷體都轉(zhuǎn)換成手寫體,同時(shí)可以識(shí)別其他樣式的文字,將它自動(dòng)合成手寫體樣式。

AI換臉后又來AI換字!Facebook打造了“文字版的Deepfake”

同時(shí),F(xiàn)acebook還通過結(jié)合文字樣式分類、文本識(shí)別(OCR)和GAN這三種模型來保留文字輸出的樣式,再用通過字體分類器和文本識(shí)別器來“判斷”圖像的文字內(nèi)容是否合格。

三、你的字跡會(huì)被盜用?別擔(dān)心,該技術(shù)暫時(shí)不會(huì)落地現(xiàn)實(shí)

在期待新技術(shù)的應(yīng)用時(shí),F(xiàn)acebook也在報(bào)告中提到對(duì)技術(shù)濫用的擔(dān)憂。

他們擔(dān)心該項(xiàng)技術(shù)可能會(huì)如Deepfake一樣遭到濫用,甚至成為不法分子的作案工具,因此該項(xiàng)技術(shù)暫時(shí)不會(huì)落地現(xiàn)實(shí)。

Facebook表示,他們希望通過公開這項(xiàng)AI研究結(jié)果,鼓勵(lì)業(yè)內(nèi)更多人士對(duì)虛擬文本的研究,以避免受到深度偽造文本攻擊(deepfake text attacks)。

他們認(rèn)為,如果人工智能研究人員能夠在構(gòu)建仿真文本方面技術(shù)領(lǐng)先,就可以更好地建立識(shí)別虛假文本的技術(shù)體系。

目前這項(xiàng)技術(shù)僅存在研究,但Facebook表示它可以在未來應(yīng)用廣泛,比如將圖像文本翻譯成不同的語言,創(chuàng)建個(gè)性化的文本信息和標(biāo)題,甚至協(xié)助在AR世界里翻譯現(xiàn)實(shí)文本。

結(jié)語:真假難辨,AI呈現(xiàn)雙刃劍

2017年,Deepfake首次在美國(guó)社交新聞網(wǎng)站Reddit亮相,成功互換兩部電影女主角的臉。但很快,就被全球封禁。這期間,有一些人因?yàn)槔胬肈eepfake偽造總統(tǒng)致辭,散布不實(shí)傳聞等,人們?cè)谡媾c假中惶惶不安。

圖片上的PS技術(shù),視頻領(lǐng)域的Deepfake換臉技術(shù),文字領(lǐng)域的文本樣式筆刷技術(shù)都會(huì)讓人難以分別真假,從而引發(fā)一系列辨別真假的鬧劇。

在期待技術(shù)給人們帶來更多便捷的時(shí)候,我們也要不忘對(duì)新的技術(shù)抱有謹(jǐn)慎的態(tài)度。

來源:Facebook