「AI新青年講座」將邀請(qǐng)世界頂尖AI研究機(jī)構(gòu)和大學(xué)的科研新青年,主講他們?cè)谟?jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對(duì)人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專(zhuān)業(yè)知識(shí)也能夠得以積累加深。同時(shí),通過(guò)與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過(guò)程中遇到的問(wèn)題,也能夠盡快解決。
有興趣分享學(xué)術(shù)成果的朋友,可以與智東西公開(kāi)課教研團(tuán)隊(duì)進(jìn)行郵件(class@zhidx.com)聯(lián)系。
人臉生成具有廣泛的應(yīng)用,現(xiàn)有較好的基于StyleGAN的人臉生成方法,然而其僅能生成2D人臉,在3D人臉生成上無(wú)能為力。3D感知人臉生成旨在通過(guò)語(yǔ)義分割圖生成3D人臉,而其目前主要面臨兩大問(wèn)題,一是生成的人臉?lè)直媛瘦^低,二是對(duì)生成的高清人臉很難進(jìn)行實(shí)時(shí)的編輯。
為了解決上述問(wèn)題,清華大學(xué)三維視覺(jué)實(shí)驗(yàn)室在讀博士孫景翔等人提出了三維人臉語(yǔ)義編輯系統(tǒng)IDE-3D,這是一個(gè)兩全其美的系統(tǒng),既能生成高清的3D人臉,也能對(duì)人臉進(jìn)行實(shí)時(shí)地編輯。
IDE-3D主要由三個(gè)部分組成:
(1)一個(gè)基于StyleGAN2的3D語(yǔ)義感知人臉生成模型,用來(lái)生成視角一致的、紋理和幾何相互解耦的人臉圖像和語(yǔ)義掩碼。
(2)一種混合GAN反演方法,通過(guò)語(yǔ)義和紋理編碼器對(duì)單視角圖像進(jìn)行編碼,得到初始的隱式編碼,并通過(guò)進(jìn)一步的優(yōu)化策略實(shí)現(xiàn)高保真的人臉編輯。
(3)一個(gè)高效的正則空間人臉編輯器,將正則視角下編輯的語(yǔ)義掩碼轉(zhuǎn)化成隱式編碼,從而產(chǎn)生高質(zhì)量的局部編輯結(jié)果。
通過(guò)這三個(gè)部分,IDE-3D能夠支持許多靈活和交互式的人臉任務(wù),例如自由視角人臉生成、編輯和風(fēng)格遷移,以及真實(shí)人臉的反演與實(shí)時(shí)編輯,并且在照片寫(xiě)實(shí)、忠實(shí)度和效率方面達(dá)到最先進(jìn)的水平。
10月11日晚6點(diǎn),「AI新青年講座」第163講邀請(qǐng)到清華大學(xué)三維視覺(jué)實(shí)驗(yàn)室在讀博士孫景翔參與,主講《基于StyleGAN2的高清3D感知人臉生成與編輯》。
講 者
孫景翔,清華大學(xué)三維視覺(jué)實(shí)驗(yàn)室在讀博士;師從劉燁斌教授,碩士畢業(yè)于伊利諾伊大學(xué)香檳分校,研究方向?yàn)槿S視覺(jué),特別是三維場(chǎng)景表征與生成,曾在CVPR、ECCV、SIGGRAPH Asia等會(huì)議和期刊發(fā)表文章多篇。
主 題
《基于StyleGAN2的高清3D感知人臉生成與編輯》
提 綱
1、現(xiàn)有3D感知人臉生成與編輯的困境
2、基于StyleGAN2的3D感知人臉生成模型
3、利用混合GAN反演實(shí)現(xiàn)高保真3D人臉編輯
4、在人臉生成與編輯任務(wù)中的應(yīng)用
直播信息
直播時(shí)間:10月11日18:00
直播地點(diǎn):智東西公開(kāi)課知識(shí)店鋪
成 果
IDE-3D:《IDE-3D: Interactive Disentangled Editing for High-Resolution 3D-aware Portrait Synthesis》
論文鏈接:https://arxiv.org/pdf/2205.15517.pdf
開(kāi)源代碼:https://github.com/MrTornado24/IDE-3D