「AI新青年講座」將邀請(qǐng)世界頂尖AI研究機(jī)構(gòu)和大學(xué)的科研新青年,主講他們?cè)谟?jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對(duì)人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專業(yè)知識(shí)也能夠得以積累加深。同時(shí),通過與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過程中遇到的問題,也能夠盡快解決。
「AI新青年講座」目前已完結(jié)111講,錯(cuò)過往期講座直播的朋友,可以點(diǎn)擊文章底部“閱讀原文”進(jìn)行回看!
有興趣分享學(xué)術(shù)成果的朋友,可以與智東西公開課教研團(tuán)隊(duì)進(jìn)行郵件(class@zhidx.com)聯(lián)系。
摩爾定律曾預(yù)言了半導(dǎo)體行業(yè)半個(gè)多世紀(jì)的蓬勃發(fā)展——集成電路上可容納的晶體管數(shù)目,每隔十八個(gè)月翻一番——芯片性能也將隨著片上資源的豐富而翻番。然而由于功耗限制,程序行為依賴等諸多原因,通用處理器的性能每?jī)纱畏臅r(shí)間間隔越來越長。
因此,為追求更快的速度和更好的功耗性能比,學(xué)界與工業(yè)界都開始將可編程的專用體系結(jié)構(gòu)(硬件加速器)用于特定的應(yīng)用上。工業(yè)界代表性的產(chǎn)品有比如谷歌的TPU,阿里的晗光和華為的昇騰,都是為深度學(xué)習(xí)/AI算法設(shè)計(jì)的加速器。學(xué)術(shù)界有名的論文有比如計(jì)算所為神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的DianNao,哥倫比亞大學(xué)為數(shù)據(jù)庫設(shè)計(jì)的Q100,和斯坦福大學(xué)為通用計(jì)算設(shè)計(jì)的Plasticine。
然而為設(shè)計(jì)這些可編程的專用的體系結(jié)構(gòu),都需要經(jīng)過一個(gè)冗長的工作流程:首先學(xué)習(xí)目標(biāo)程序集的行為,然后根據(jù)這些程序的行為設(shè)計(jì)對(duì)應(yīng)的專用硬件機(jī)制及其軟硬件接口;最后,為有一個(gè)開發(fā)者友好的全棧設(shè)計(jì),還要為這個(gè)全新的硬件開發(fā)新的編譯器,以適應(yīng)其全新的編程/執(zhí)行模型。很少有人考慮將這個(gè)過程(或其中幾步)復(fù)用,從而使得每次為新的程序集設(shè)計(jì)加速器都要從頭開始。
由加利福尼亞大學(xué)洛杉磯分校翁健博士所在的PolyArch團(tuán)隊(duì)提出一個(gè)將可編程加速器設(shè)計(jì)流程自動(dòng)化的框架DSAGEN,可以自動(dòng)為目標(biāo)程序集生成專用的加速器。該框架在硬件層面,每一個(gè)對(duì)程序行為專用的硬件機(jī)制都被抽象成一個(gè)模塊,可以獨(dú)立地集成到目標(biāo)加速器中;在軟件層面,因?yàn)榫幾g器能夠理解軟件中需要被專用的關(guān)鍵行為,于是就能將此轉(zhuǎn)化為對(duì)于硬件模塊的需求,以此指導(dǎo)專用加速器的對(duì)于功能的集成和硬件資源的需求。
由翁健、劉思皓等人開發(fā)的框架DSAGEN,是一個(gè)特異化加速器設(shè)計(jì)的全棧實(shí)現(xiàn)——包括了應(yīng)用、編譯器、RTL實(shí)現(xiàn),并能在FPGA上完成原型機(jī)的部署。目前該框架仍在活躍地更新,以囊括更豐富的軟硬件特性。
4月27日,「AI新青年講座」第12講邀請(qǐng)到加利福尼亞大學(xué)洛杉磯分校PolyArch實(shí)驗(yàn)室翁健參與,主講《可編程加速器設(shè)計(jì)自動(dòng)化及編譯實(shí)現(xiàn)》。
講者
翁健,加利福尼亞大學(xué)洛杉磯分校PolyArch實(shí)驗(yàn)室在讀博士,師從Tony Nowatzki,研究領(lǐng)域?yàn)橛?jì)算機(jī)體系結(jié)構(gòu),編譯原理,和軟硬件協(xié)同設(shè)計(jì);在計(jì)算機(jī)體系結(jié)構(gòu)頂會(huì)HPCA、MICRO、ASPLOS、ISCA發(fā)表多篇論文,論文入選IEEE Micro Top Picks和Honorable Mentions。
第12講
主 題
《可編程加速器設(shè)計(jì)自動(dòng)化及編譯實(shí)現(xiàn)》
提 綱
1、可編程加速器的研究現(xiàn)狀
2、專用加速器的設(shè)計(jì)流程及問題
3、可編程的加速器設(shè)計(jì)流程自動(dòng)化框架DSAGEN
4、在FPGA上完成原型機(jī)的部署
直 播 信 息
直播時(shí)間:4月27日10:00
直播地點(diǎn):智東西公開課知識(shí)店鋪
論文成果
DSAGEN:《DSAGEN: Synthesizing Programmable Spatial Accelerators》
鏈接:www.seas.ucla.edu/~jianw/isca2020.pdf
開源地址:https://github.com/PolyArch/dsa-framework