10月25日,上海交通大學(xué)(下稱上海交大)AI計算平臺完成技術(shù)驗收,正式上線服務(wù)。

上海交大AI計算平臺由8臺NVIDIA DGX-2組建,包含128張NVIDIA Tesla V100計算卡,深度學(xué)習(xí)張量計算能力可以達到16PFLOPS;通過搭載NVIDIA NVSwitch技術(shù),GPU間帶寬高達 2.4 TB/s;AI計算平臺采用可擴展架構(gòu),使得模型的復(fù)雜性和規(guī)模不再受傳統(tǒng)架構(gòu)的限制,可以應(yīng)對眾多復(fù)雜的人工智能挑戰(zhàn)。

然而搭建AI計算平臺,除了需要考慮基礎(chǔ)硬件的算力能否滿足日益復(fù)雜的AI計算需求之外,還要考慮應(yīng)用部署的便捷性、計算資源調(diào)度的靈活性等因素,因為AI計算平臺不僅僅是具有超強算力的簡單的硬件堆砌,而是一個復(fù)雜的軟硬件一體化系統(tǒng)。

在應(yīng)用部署方面,由于現(xiàn)在的人工智能和高性能計算應(yīng)用往往需要使用大量更新頻繁的框架、庫、驅(qū)動程序等復(fù)雜的組件,所以如果單純依靠人工來調(diào)試和維護運行環(huán)境,不僅需要耗費大量的人力,工作效率也會受到很大的影響。上海交大AI計算平臺采用NVIDIA NGC容器技術(shù),將應(yīng)用程序與其依賴的系統(tǒng)庫一起打包發(fā)布,簡化了軟件部署流程和軟硬件協(xié)同優(yōu)化,大大降低了應(yīng)用部署的復(fù)雜性和用戶使用平臺的成本;

在資源調(diào)度方面,如何避免不同負(fù)載在計算平臺內(nèi)的相互干擾,提高不同應(yīng)用在平臺上的運行效率也是搭建AI計算平臺不得不考慮的要素之一。上海交大AI計算平臺創(chuàng)新性的采用了“SLURM + Singularity”的管理模式,可以為用戶提供可伸縮、可擴展、高可靠的資源調(diào)度功能和最佳性能的應(yīng)用支持。

上海交大AI計算平臺自部署以來,極大地加速了全校人工智能和高性能計算科研應(yīng)用,使科研計算運行效率提升30-18000倍;在一些關(guān)鍵任務(wù)上,使原本需要數(shù)周甚至數(shù)月才能完成的計算任務(wù),可以在幾小時內(nèi)完成計算,大大提高了科研實驗的迭代速度和科研效率??梢哉f上海交大AI計算平臺已經(jīng)成為了高校打造AI計算平臺的成功典范。

11月19日,智東西公開課聯(lián)合NVIDIA推出深度學(xué)習(xí)&GPU加速公開課NVIDIA專場,由上海交大網(wǎng)絡(luò)信息中心工程師韋建文主講,主題為《為深度學(xué)習(xí)和科學(xué)研究搭建AI計算平臺的關(guān)鍵與挑戰(zhàn)》。

韋建文老師將從上海交大AI計算平臺的搭建、遇到的挑戰(zhàn)、架構(gòu)特性、不同容器技術(shù)的差異、如何利用Spack創(chuàng)建自己的容器鏡像到如何實現(xiàn)計算資源的靈活調(diào)度、實際應(yīng)用優(yōu)化案例等方面進行系統(tǒng)講解,為你解密上海交大AI計算平臺。

深度學(xué)習(xí)&GPU加速公開課下周開講!解密128張Tesla V100打造的超強AI計算平臺

課程時間

時間:11月19日
地點:智東西公開課小程序

課程詳情

主題:為深度學(xué)習(xí)和科學(xué)研究搭建AI計算平臺的關(guān)鍵與挑戰(zhàn)
講師;上海交大網(wǎng)絡(luò)中心工程師韋建文

提綱:
1、上海交通大學(xué)校級人工智能平臺建設(shè)的最新進展;
2、基于NVIDIA DGX-2的上海交通大學(xué)校級AI計算平臺的搭建與特性
3、如何利用容器技術(shù)在AI計算平臺實現(xiàn)高效的應(yīng)用部署
4、上海交大用戶在DGX-2上應(yīng)用優(yōu)化的成功案例

講師介紹

韋建文,上海交通大學(xué)碩士,上海交大網(wǎng)絡(luò)信息中心工程師,負(fù)責(zé)校級“π”超算系統(tǒng)的運維和數(shù)據(jù)密集應(yīng)用的優(yōu)化。先后協(xié)助物理與天文學(xué)院、瑞金醫(yī)院等多個研究團隊完成應(yīng)用優(yōu)化,并積極參與HPC軟件包管理器Spack的開發(fā)工作,以及容器化HPC應(yīng)用的研究。所開發(fā)的軟件部署方法和異常作業(yè)診斷方法已應(yīng)用于生產(chǎn)平臺,極大提高了運維效率和用戶滿意度。

入群路徑

本次課程我們將設(shè)置主講群,講師將親自入群交流。希望進入主講群與老師認(rèn)識和交流的朋友,掃描海報下方二維碼添加智東西公開課聯(lián)絡(luò)員“大越(xdxaxx)”為好友,添加時請備注“姓名-公司-職位或姓名-學(xué)校-專業(yè)”,申請進入課程群交流。

社群規(guī)則

1、智東西社群堅持實名學(xué)習(xí)、交流和合作,入群后需要修改群昵稱為:姓名-公司-所在領(lǐng)域,違者踢群;
2、禁止在群內(nèi)廣告和發(fā)送二維碼等無關(guān)信息,違者踢群。