繼「CV前沿講座」之后,智東西公開課全新推出「機器學(xué)習(xí)前沿講座」,聚焦機器學(xué)習(xí)前沿領(lǐng)域研究成果與進(jìn)展,包括(深度)強化學(xué)習(xí)、遷移學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、GNN/GCN、可解釋性AI等前沿領(lǐng)域,我們將持續(xù)邀請研究者、專家和資深開發(fā)者,為大家?guī)砀嗟闹辈ブv解。直播由主講環(huán)節(jié)和Q&A環(huán)節(jié)組成,共計90分鐘。

機器學(xué)習(xí)領(lǐng)域,輸入數(shù)據(jù)和輸出答案之間不可觀察的空間通常被稱為“黑箱”,也就是大家所關(guān)注的可解釋性AI問題。在本次「機器學(xué)習(xí)前沿講座」第1講的講座中,智東西公開課邀請到美國加州大學(xué)洛杉磯分校博士后王可澤,為大家?guī)碇黝}為《可解釋性AI在視頻分析中的研究和應(yīng)用》的講座。

相比于現(xiàn)有的機器學(xué)習(xí)范式,即人單方面地給定機器需要學(xué)習(xí)的視覺概念,輸入海量標(biāo)注數(shù)據(jù),進(jìn)而讓計算機進(jìn)行歸納學(xué)習(xí)。通過人機雙向問答的過程,人和計算機可以逐漸統(tǒng)一對事物的認(rèn)識,基于人機問答的交流溝通和信息傳遞方式,在問答過程中分別為用戶(人)和機器設(shè)計不同的視覺概念解析圖模型。

視覺解析圖是將常見的不同層級主觀和客觀的視覺概念(“實體”、“屬性”、“關(guān)系”、“事件”等)連接成一個圖狀結(jié)構(gòu),用以表示用戶或計算機所見的輸入圖像的理解和表述。該模型使得人機可以通過自然地語言問答以實現(xiàn)視覺概念和常識的傳遞和學(xué)習(xí)。同時,基于圖模型,機器在問答過程中不斷地對用戶進(jìn)行情感建模,并對用戶意圖進(jìn)行預(yù)判,實現(xiàn)“組合抽象”、“因果推理”以及在“學(xué)習(xí)中學(xué)習(xí)”等能力。這就使得用戶能夠在對查詢需求十分模糊的情況下,快速地檢索到所需要的視覺內(nèi)容,從而有效地填補了用戶與機器之間的意圖鴻溝。

7月13日上午10點,智東西公開課「機器學(xué)習(xí)前沿講座」第1講將直播開講,王博士將從可解釋性AI在視頻分析中的研究出發(fā),解析情感分析理論模型(ToM)的原理和基于圖模型的用戶情感建模及在視覺問答任務(wù)中的應(yīng)用。感興趣的朋友不要錯過。

王可澤,美國加州大學(xué)洛杉磯分校博士后,導(dǎo)師為朱松純,主要研究方向計算機視覺、機器學(xué)習(xí)、可解釋人工智能。王博士針對當(dāng)前海量復(fù)雜、多源異質(zhì)、動態(tài)增加和無標(biāo)注的海量圖像視頻數(shù)據(jù),以減少對訓(xùn)練樣本依賴和挖掘海量無標(biāo)簽的圖像數(shù)據(jù)為目標(biāo),以融合視覺領(lǐng)域知識和語義信息的深度表達(dá)學(xué)習(xí)為主線,從監(jiān)督學(xué)習(xí)演化到自主學(xué)習(xí)機制,以視覺高層語義理解為主要應(yīng)用場景,展開了一系列的研究,提出了聯(lián)合知識與數(shù)據(jù)驅(qū)動的學(xué)習(xí)范式,具有廣泛的應(yīng)用前景。他的研究成果發(fā)表了兩篇TPAMI和數(shù)篇TNNLS、IJCV、TIP、TMM、TCSVT等頂級SCI期刊和10余篇頂級國際會議上,其中被引用次數(shù)總計超過800次。

課程時間

時間:7月13日早上10點
地點:智東西公開課小程序

課程詳情

主題:
可解釋性AI在視頻分析中的研究和應(yīng)用
提綱:
1、可解釋性AI在視頻分析中的研究概述
2、情感分析理論模型(ToM)的原理解析
3、基于圖模型的用戶情感建模及可解釋性
4、應(yīng)用解析:視頻分析中的視覺問答任務(wù)

講師:

王可澤,美國加州大學(xué)洛杉磯分校博士后,導(dǎo)師為朱松純,主要研究方向計算機視覺、機器學(xué)習(xí)、可解釋人工智能。王博士針對當(dāng)前海量復(fù)雜、多源異質(zhì)、動態(tài)增加和無標(biāo)注的海量圖像視頻數(shù)據(jù),以減少對訓(xùn)練樣本依賴和挖掘海量無標(biāo)簽的圖像數(shù)據(jù)為目標(biāo),以融合視覺領(lǐng)域知識和語義信息的深度表達(dá)學(xué)習(xí)為主線,從監(jiān)督學(xué)習(xí)演化到自主學(xué)習(xí)機制,以視覺高層語義理解為主要應(yīng)用場景,展開了一系列的研究,提出了聯(lián)合知識與數(shù)據(jù)驅(qū)動的學(xué)習(xí)范式,具有廣泛的應(yīng)用前景。研究成果發(fā)表了兩篇TPAMI和數(shù)篇TNNLS、IJCV、TIP、TMM、TCSVT等頂級SCI期刊和10余篇頂級國際會議上。其中被引用次數(shù)總計超過800次。

報名方式

添加智東西公開課小助手曼曼(ID:zhidxclass006)報名,添加時請備注“姓名-公司/學(xué)校-職位/專業(yè)”,因報名人數(shù)過多,優(yōu)先通過備注者。