智東西(公眾號:zhidxcom)
文 |?季瑜生

導語:用十秒,Atlas 900就能從20萬顆星星中找到你的那一顆。

智東西9月18日上海消息,今日早晨,華為在上海世博中心舉行了2019華為全聯(lián)接大會,智東西帶來現(xiàn)場一手干貨報道。

會上,華為輪值董事長胡厚崑發(fā)表了《共創(chuàng)智能新高度》的演講,同時還發(fā)布了由數(shù)千顆昇騰910組成,只需60秒就可以完成典型網(wǎng)絡(luò)的訓練的全球最快AI集群Atlas 900。

此外,胡厚崑還首次從架構(gòu)創(chuàng)新、產(chǎn)品布局、商業(yè)策略、開放生態(tài)四個角度全面對外公開了華為的整體計算戰(zhàn)略

最后,胡厚崑還透露出幾個數(shù)據(jù),2023年,全球計算產(chǎn)業(yè)市場空間將達兩萬億美元,到2025年,AI計算將占算力總量80%以上。

一、華為很好,就像上海的天氣,秋高氣爽、云淡風輕

上場伊始,華為輪值董事長胡厚崑先向在場的所有朋友們親切的打了招呼。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

他表示,今年的全聯(lián)接大會上比去年的人來的更多,而且也有很多老朋友的出席,這說明大家對于華為都是非常關(guān)心。

緊接著他表示,“今天一早,很多朋友問我你們還好嗎?你們還不錯吧?”

對此,胡厚崑回應:過去半年頂著巨大的壓力走過來,不過華為現(xiàn)在過的還不錯,就像今天上海的天氣,秋高氣爽、云淡風輕。而且華為一定不會讓所有人失望的!

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

二、華為整體計算戰(zhàn)略首次公開:將5年投入15億美元構(gòu)建開放生態(tài)

剛一上場,胡厚崑就向我們強調(diào)了兩個詞語“計算”與“聯(lián)接”?;谌A為兩年前發(fā)布的新愿景——構(gòu)建萬物互聯(lián)的智能世界,計算與聯(lián)接是其中最重要的兩個孿生兄弟。長期以來,哪里有聯(lián)接,哪里就有計算。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

此外,胡厚崑也表示,向來以通信行業(yè)巨頭形象出現(xiàn)在我們面前的華為,其實對計算的投入已經(jīng)超過十年的時間。

長期以來,計算模式一直在發(fā)生著變化,從基于規(guī)則的計算到基于統(tǒng)計的計算,再到如今計算進入智能時代。

而在智能時代,有幾個因素不可忽略,此外,胡厚崑還提出一個趨勢預判——智能時代,具備三大特征:

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

(1)端邊云高效聯(lián)動的協(xié)同計算將成為未來的最大趨勢。

(2)計算將無處不在,在終端側(cè)、邊緣側(cè)、中心側(cè)都將存在,甚至在智能手機、智能眼鏡、智能耳機都應該有計算能力。

(3)基于中心節(jié)點對通用模型進行訓練量、計算量極大的暴力計算將無處不在。

緊接著胡厚崑公布了幾個數(shù)字:2023年,全球計算產(chǎn)業(yè)市場空間將達兩萬億美元,到2025年,AI計算將占算力總量80%以上。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

基于這一認知,華為也首次公布了其在智能計算領(lǐng)域的整體戰(zhàn)略,借此來讓所有人了解華為的想法與戰(zhàn)略,共同將市場做大。

華為智能計算的戰(zhàn)略整體分為四部分:架構(gòu)創(chuàng)新、產(chǎn)品布局、商業(yè)策略、開放生態(tài)。

1、架構(gòu)創(chuàng)新。華為這些年一直在長期投資基礎(chǔ)研究,打造出了達芬奇架構(gòu),重點解決全場景智能的架構(gòu)問題。達芬奇架構(gòu)是全行業(yè)唯一一個覆蓋端邊云全場景的架構(gòu)。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

2、投資全場景處理器族。包括面向通用計算的鯤鵬系列,面向AI的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列,將來還有一系列處理器,面向更多的場景。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

3、商業(yè)策略-有所為有所不為。胡厚崑重點強調(diào),華為處理器不直接對外銷售,而是會以云服務和部件為主面向客戶,并開放硬件框架、數(shù)據(jù)庫、AI計算框架部件給合作伙伴,優(yōu)先支持合作伙伴發(fā)展整機。在這一過程中,華為有三個堅持:堅持硬件開放、堅持軟件開源、堅持使能應用開發(fā)和遷移。在這一過程中,華為不做應用,而是幫助合作伙伴做應用。

4、構(gòu)建開放生態(tài)。未來5年,繼續(xù)投入15億美元,匯聚500萬開發(fā)者,使能全球合作伙伴開發(fā)應用及解決方案。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

關(guān)于華為的生態(tài)構(gòu)建以及選擇,在會后的媒體專訪中,華為方面向包括智東西在內(nèi)的媒體進一步闡釋了為什么鯤鵬處理器選擇ARM架構(gòu)的原因:

鯤鵬之所以兼容ARM架構(gòu),是因為客戶有多樣性的需求與選擇。ARM架構(gòu)在新的時代有它的優(yōu)勢所在,華為選擇ARM是為了客戶需求考慮,而不是為了不同而不同。

此外,一個計算產(chǎn)業(yè)的成功不只是靠一個好的架構(gòu),很多企業(yè)有了好的架構(gòu)還是走了彎路最后失敗。架構(gòu)只是基礎(chǔ),要成功還需要開放生態(tài)、務實的商業(yè)策略。

比如華為剛剛在會上宣布的新的開放生態(tài)構(gòu)建計劃,以及不做應用等策略,這都是華為緊緊圍繞上面兩點所做出的探索。

另外需要補充的一點是,此前,ARM處理器一直被認為具有非常好的終端以及應用但是不適合在中心側(cè)進行計算,但是到了今天,邊緣側(cè)的優(yōu)勢將會向中心側(cè)延伸,性能問題也已經(jīng)能夠很好的解決。比如華為鯤鵬920在SPEC?benchmark測試成績超過930分,位居第一,超越業(yè)界主流CPU25%。

此外,胡厚崑也宣布了華為面向通用計算領(lǐng)域的最新業(yè)務策略。依舊是從產(chǎn)品創(chuàng)新、產(chǎn)品生態(tài)、開放生態(tài)、商業(yè)策略四個方面進行解讀。

1、打造有競爭力的通用計算處理器。長期以來,華為一直持續(xù)投入鯤鵬生態(tài),借此來打造最有競爭力的產(chǎn)品。

2、投資板卡、服務器、操作系統(tǒng)、數(shù)據(jù)庫、編譯器等關(guān)鍵技術(shù)和產(chǎn)品,打通生態(tài)全鏈條,完成系統(tǒng)級驗證,幫助合作伙伴更好地銷售整機

3、目前鯤鵬生態(tài)已落地北京、上海、重慶、深圳、成都等城市,在平臺搭建、人才培養(yǎng)、應用示范等領(lǐng)域全面開展合作。華為將持續(xù)與伙伴合作共同打造鯤鵬產(chǎn)業(yè)生態(tài)基地,與各地的政府、合作伙伴一起,結(jié)合當?shù)氐膬?yōu)勢,打造鯤鵬計算產(chǎn)業(yè)的創(chuàng)新基地和孵化平臺。以平臺為載體,聚合生態(tài)伙伴,開展應用示范,培養(yǎng)產(chǎn)業(yè)人才,孵化產(chǎn)業(yè)標準。

4、上市節(jié)奏,基于鯤鵬處理器的系列產(chǎn)品、解決方案和服務,將面向全球市場;當前先聚焦中國市場,后續(xù)將基于客戶需求、生態(tài)建設(shè)等有節(jié)奏在其他不同區(qū)域、國家/地區(qū)逐步上市。

關(guān)于AI計算,胡厚崑也向我們宣布了華為的最新進展。他表示,華為的全棧全場景AI解決方案已經(jīng)全面落地。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

去年全聯(lián)接大會上,華為發(fā)布了全棧全場景的AI解決方案。不過胡厚崑也坦言,“當時我們只交付了用于推理的昇騰310處理器和ModelArts應用開發(fā)平臺?!?/p>

但是今年,華為用于訓練的昇騰處理器和AI計算框架MindSpore都已經(jīng)發(fā)布了。至此,華為的全棧全場景AI解決方案全面落地。

最后,胡厚崑表示:“大家可以放心地和我們來開展合作!”

三、最快AI訓練集群Atlas 900發(fā)布:60秒完成典型網(wǎng)絡(luò)訓練

在大型數(shù)據(jù)集上進行訓練的神經(jīng)網(wǎng)絡(luò)架構(gòu)涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統(tǒng)等各個方面,訓練這些神經(jīng)網(wǎng)絡(luò)模型需要大量浮點計算能力。

近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規(guī)模分布式AI集群環(huán)境來提升神經(jīng)網(wǎng)絡(luò)訓練系統(tǒng)的浮點計算能力。

基于這一認知,作為本場大會最大的驚喜——胡厚崑發(fā)布了全球最快AI訓練集群Atlas 900。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

根據(jù)現(xiàn)場解讀,Atlas 900由數(shù)千顆昇騰910組成,總算力達256-1024PFLOPS@FP16,相當于50萬臺PC的計算力。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

昇騰910 AI有多強?每顆昇騰910 AI處理器內(nèi)置32個達芬奇AI Core,單芯片就可以提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。而AI訓練集群Atlas 900,則直接將數(shù)千顆昇騰910 AI處理器互聯(lián),打造出了業(yè)界第一的算力集群。

值得關(guān)注的是,昇騰910 AI處理器采用的是SoC設(shè)計,集成了“AI算力、通用算力、高速大帶寬I/O”,可以大幅度卸載Host CPU的數(shù)據(jù)預處理任務,充分提升訓練效率。

那么它到底有多快?只需59.8秒就可以完成基于ImageNet數(shù)據(jù)集訓練ResNet-50模型,在同等精度下比第2名(70.2秒)快15%。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

這是什么概念,基于這種測試,就像頂尖的短跑選手測試,區(qū)別在于第一名沖線還喝了瓶水,第二名才姍姍來遲。

除了超快之外,Atlas 900還具備最佳集群網(wǎng)絡(luò)、系統(tǒng)級調(diào)優(yōu)、優(yōu)秀散熱系統(tǒng)兩大特性。

1、最佳集群網(wǎng)絡(luò)。Atlas 900整合了“HCCS、PCle4.0、100G以太”三類高速互聯(lián)方式。通過百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時延,梯度同步時延縮短10~70%。

通過華為自研HCCS片間互聯(lián)240Gbps單端口速率業(yè)界領(lǐng)先;最新的PCIE4.0接口則在速率上達到了當前業(yè)界的2倍;100G RoCE高速集群互聯(lián)網(wǎng)絡(luò)進一步讓傳輸速率一快再快。

在AI服務器內(nèi)部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術(shù)互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術(shù)的兩倍,使得數(shù)據(jù)傳輸更加快速和高效。

在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內(nèi)的所有AI服務器接入高速交換網(wǎng)絡(luò)。

此外,華為還獨創(chuàng)了iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進行實時的學習訓練,實現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時延。

2、Atlas 900系統(tǒng)級調(diào)優(yōu)。通過HCCL通信庫+網(wǎng)絡(luò)拓撲+訓練算法級調(diào)優(yōu),可實現(xiàn)線性度大于80%。

3、散熱。華為方面表示,Atlas 900還具備業(yè)界頂尖的散熱系統(tǒng)。Atlas 900采用的是大于95%的液冷占比,可以大幅減少對外散熱。高效節(jié)能也是Atlas 900的一大特性,單液冷柜支持50KW超高散熱,實現(xiàn)PUE小于1.1。

那么通過Atlas 900的強大算力究竟能做什么?

胡厚崑表示,Atlas 900可廣泛應用于科學研究與商業(yè)創(chuàng)新。比如天文探索、氣象預測、自動駕駛、石油勘探等領(lǐng)域,這些領(lǐng)域都需要進行龐大的數(shù)據(jù)計算和處理,原來可能花費好幾個月的工作,現(xiàn)在交給Atlas 900,就是幾秒鐘的事情。

緊接著,胡厚崑分享了一個天文探索的案例,這是華為聯(lián)合上海天文臺與SKA共同打造的。天文研究高度依賴于海量的數(shù)據(jù)分析和計算,離不開超強的算力支持。

以下是一張南半球的星空圖,這張圖上有20萬顆星星,用人眼是看不見這么多星星的,這些畫面來自于SKA射電望遠鏡的數(shù)據(jù)。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

當前條件下,天文學家要從這20萬顆星星中,找出某種特征的星體,相當困難,需要169天的工作量?,F(xiàn)在用上Atlas 900,只用10秒,就從20萬顆星星中檢索出了相應特征的星體。

胡厚崑:華為很好,云淡風輕,還發(fā)布了全球最快AI訓練集群Atlas 900

最后,胡厚崑表示,為了讓所有人能夠盡快用上Atlas 900的超強算力,華為已經(jīng)把它部署到華為云上,并以極優(yōu)惠的價格向全球科研機構(gòu)和大學開放。

結(jié)語:華為的管道與水庫,左手5G,右手云邊端計算

如果說長期以來,我們對于華為的定義還只是一個能做手機的通信設(shè)備巨頭,那么這十年多來華為在計算領(lǐng)域的發(fā)力逐漸浮出水面,則讓我們重新定義了這個全行業(yè)的商業(yè)巨無霸。

左手是風頭無兩的5G與領(lǐng)先的6G,建立起了數(shù)據(jù)傳輸?shù)淖畲蠊艿馈?/p>

右手是聯(lián)接到管道兩端的水庫與毛細血管。在云端,華為是Atlas 900集群與鯤鵬生態(tài),在邊緣側(cè)昇騰生態(tài)則構(gòu)建起了毛細血管層面的計算。

隨著AI與5G的雙重催化,計算與聯(lián)接已經(jīng)成為全行業(yè)所共通必須的基礎(chǔ)設(shè)施。不過如何共同推進整個產(chǎn)業(yè)的發(fā)展,華為在做好黑土地之后,還需要更多的產(chǎn)業(yè)應用角色參與其中?;蛟S正如胡厚崑所言“這是計算產(chǎn)業(yè)新的大航海時代,我們期待的是千帆競發(fā),而不是獨舟奮進。