智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西8月19日銀川報道,昨日,由工業(yè)和信息化部、寧夏回族自治區(qū)政府主辦的2023中國算力大會在寧夏銀川舉辦。

大會期間,作為頭部算力基礎(chǔ)設(shè)施提供商,聯(lián)想推出兩款全新AI服務(wù)器產(chǎn)品——聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器、聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器,為大模型AI訓(xùn)練和推理提供新的基礎(chǔ)設(shè)施。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲“算力中國”創(chuàng)新成果展上的聯(lián)想兩款A(yù)I服務(wù)器產(chǎn)品展示

同時,聯(lián)想首次對外發(fā)布“普慧”AI算力戰(zhàn)略,提出將100%算力基礎(chǔ)設(shè)施產(chǎn)品支持AI,50%基礎(chǔ)設(shè)施研發(fā)投入在AI領(lǐng)域等戰(zhàn)略舉措,并推出了聯(lián)想智算中心解決方案和服務(wù)核心產(chǎn)品。

聯(lián)想集團(tuán)副總裁、中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬說:“全新推出的兩款聯(lián)想問天AI服務(wù)器,秉承‘AI賦智,綠色賦能’的兩大戰(zhàn)略特征,通過領(lǐng)先的AI技術(shù),覆蓋全域應(yīng)用,打造全面的AI導(dǎo)向基礎(chǔ)設(shè)施?!?/p>

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想集團(tuán)副總裁、中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬

會議期間,智東西與少數(shù)媒體對陳振寬,以及聯(lián)想集團(tuán)副總裁、中國區(qū)方案服務(wù)業(yè)務(wù)群總經(jīng)理戴煒進(jìn)行了深度采訪。

AI服務(wù)器的交付時間是產(chǎn)業(yè)關(guān)注的一大焦點(diǎn)問題。對此,陳振寬告訴智東西,目前AI服務(wù)器呈現(xiàn)供不應(yīng)求的態(tài)勢。今天正式對外宣布兩款的AI服務(wù)器,目前訂單數(shù)量火爆,一些訂單甚至要排到明年。

當(dāng)下眾多中國廠商發(fā)布了大模型,聯(lián)想在此是否已有布局?

戴煒告訴智東西,聯(lián)想目前沒有自研通用超大規(guī)模模型,而是聚焦于智能基礎(chǔ)設(shè)施服務(wù)方面,基于百行業(yè)的客戶應(yīng)用需求、圍繞行業(yè)場景去布局。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想集團(tuán)副總裁、中國區(qū)方案服務(wù)業(yè)務(wù)群總經(jīng)理戴煒

當(dāng)談到大模型對東數(shù)西算工程的影響,戴煒認(rèn)為,大模型的興起或許能為以寧夏為代表的西部算力樞紐帶來新機(jī)遇。離客戶場景較近的大模型推理可以放在東部算力樞紐,離客戶場景較遠(yuǎn)的大模型訓(xùn)練則可放在西部算力樞紐。

而帶動“東數(shù)西算”工程的落地,需要智能計算技術(shù)、應(yīng)用需求、人才生態(tài)等多方面因素共同作用。

一、聯(lián)想副總裁陳振寬:50%基礎(chǔ)設(shè)施研發(fā)投入在AI領(lǐng)域

隨著算力成為各國科技戰(zhàn)略布局重點(diǎn),聯(lián)想提出將“普慧算力”作為算力發(fā)展的戰(zhàn)略方向。

陳振寬說,“普”代表普適,希望算力像水和電一樣,人人可得、人人可用、人人適用;“慧”代表智慧,意味著自適應(yīng)、自學(xué)習(xí)、自進(jìn)化,用戶可以隨需使用。

陳振寬說,聯(lián)想的“普慧”AI算力戰(zhàn)略有兩大特征:一是AI賦智,二是綠色賦能。

在AI賦智方面,聯(lián)想提出將100%算力基礎(chǔ)設(shè)施產(chǎn)品支持AI,50%基礎(chǔ)設(shè)施研發(fā)投入在AI領(lǐng)域,全面AI技術(shù)覆蓋全域AI應(yīng)用。在綠色賦能方面,聯(lián)想提出全面布局和引領(lǐng)液冷技術(shù),打造液冷技術(shù)和液冷集群方案燈塔,持續(xù)創(chuàng)新引領(lǐng)未來技術(shù)。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想要提供全面的AI技術(shù)與服務(wù)

追溯聯(lián)想AI算力戰(zhàn)略的背后邏輯,聯(lián)想“AI賦智,綠色賦能”如何促進(jìn)“普慧”AI算力實(shí)現(xiàn)?

陳振寬告訴智東西,聯(lián)想通過“全棧智能”的方式實(shí)現(xiàn)戰(zhàn)略方向的落地,體現(xiàn)在三個方面:AI內(nèi)嵌的智能終端、AI導(dǎo)向的基礎(chǔ)設(shè)施、AI原生的方案服務(wù)。

在AI導(dǎo)向的基礎(chǔ)設(shè)施方面,聯(lián)想已推出了“聯(lián)想ThinkSystem”和“聯(lián)想問天”雙品牌,目前在AI方面已有60多款產(chǎn)品。

其中聯(lián)想ThinkSystem系列產(chǎn)品主打“全球智慧+本地交付”,新的聯(lián)想問天品牌則主打“本地創(chuàng)新+敏捷高效”,基于本地的創(chuàng)新、生態(tài)位中國客戶實(shí)現(xiàn)更加靈活定制的個性化方案。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想智能算力基礎(chǔ)設(shè)施采取雙品牌戰(zhàn)略

二、推出兩大AI服務(wù)器產(chǎn)品,大模型訓(xùn)練提速近10

以AI為導(dǎo)向的基礎(chǔ)設(shè)施要依據(jù)AI數(shù)據(jù)和算法的特性而設(shè)計和優(yōu)化,包括AI數(shù)據(jù)的“向量、矩陣或多維數(shù)組的形式”、“數(shù)據(jù)噪音多”等特征,以及AI算法“巨大規(guī)模并行計算和矩陣計算”、“容忍低精度浮點(diǎn)或量化整數(shù)”等特征,都需要被考慮在內(nèi)。

本次,聯(lián)想推出的兩大AI服務(wù)器產(chǎn)品聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器、聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器,正是其全新AI算力戰(zhàn)略理念的展現(xiàn)。

1、AI大模型訓(xùn)練服務(wù)器:算力達(dá)32P FLOPS,大模型AI訓(xùn)練速度提升9倍

今年年初,聯(lián)想發(fā)布了聯(lián)想服務(wù)器的首個本地化品牌“聯(lián)想問天”,聯(lián)想問天WA7780 G3是一款專為AI大模型訓(xùn)練所打造的服務(wù)器。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器

(1)AI算力提升超3倍,AI推理速度提升達(dá)30倍

聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器基于第四代英特爾至強(qiáng)可擴(kuò)展處理器。NVIDIA HGX H800系統(tǒng)配備8顆H800 NVLink GPU,擁有高達(dá)640GB的HBM3高速顯存,通過NVLink,GPU間互聯(lián)帶寬高達(dá)400GB/s。據(jù)稱其將AI算力提升了3.44倍,至高可達(dá)32P FLOPS AI算力。

NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),與上一代產(chǎn)品相比,可為大模型AI訓(xùn)練速度帶來高達(dá)9倍提升,可將大模型AI推理速度提升高達(dá)30倍。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器的算力指標(biāo)情況

(2)快速低延遲互聯(lián),支持按需配比和擴(kuò)展不同算力

聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器支持IB、RoCE等多種對外網(wǎng)絡(luò)連接方案。其最高可以支持8張RDMA高速網(wǎng)卡,提供3.2Tb/s聚合帶寬,充分滿足了超大模型訓(xùn)練并行計算時,跨節(jié)點(diǎn)的通信需求。

同時,在本地存儲的設(shè)計上,聯(lián)想問天WA7780 G3采用GPU Direct Storage (GDS)技術(shù)。通過GDS技術(shù),GPU與NVMe實(shí)現(xiàn)了快速低延遲互聯(lián),能夠有效提高訓(xùn)練數(shù)據(jù)載入的速度,提升大模型訓(xùn)練的性能。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器的靈活架構(gòu)

(3)創(chuàng)新散熱設(shè)計:功耗降低約10%,PUE值有望低于1.1

聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器,在產(chǎn)品設(shè)計中采用了三重獨(dú)立風(fēng)道設(shè)計,針對不同部件的散熱特征,進(jìn)行了系統(tǒng)性的優(yōu)化,有效降低了由風(fēng)扇帶來的散熱功耗。據(jù)稱,相比同級別產(chǎn)品,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器功耗降低約10%。

同時,為了滿足未來智算中心對PUE值更低的要求,本產(chǎn)品預(yù)留了液冷冷板設(shè)計,未來將支持液冷,這將大幅度節(jié)省在AI大模型訓(xùn)練過程中,因系統(tǒng)散熱帶來的額外能耗,PUE值有望低于1.1。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器能耗情況

2、AI訓(xùn)推一體服務(wù)器:支持多種場景、多元算力

再來看看聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器。這是聯(lián)想問天品牌中的一款4U機(jī)架式AI服務(wù)器,支持多元的算力和豐富的生態(tài)。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器

(1)最多支持10張NVIDIA H800,支持多款A(yù)I加速卡

聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器采用2顆第四代英特爾至強(qiáng)可擴(kuò)展處理器,支持最新PCIe 5.0。通過PCIe擴(kuò)展,其最多可以支持10張包括最新NVIDIA H800 GPU在內(nèi)的,多類型、多品牌AI加速卡。聯(lián)想問天WA5480 G3可以靈活應(yīng)用于AI通用模型訓(xùn)練、大模型推理、AI生成、云游戲、科學(xué)計算等多種應(yīng)用場景。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器支持多元算力

(2)靈活拓?fù)?,不同組合滿足多種AI場景需求

聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器在CPU-GPU互聯(lián)的硬件設(shè)計上采用靈活多變的設(shè)計理念。其基于不同AI工作負(fù)載,可以為客戶提供包括直通、Balance、Common多種CPU-GPU互聯(lián)方式,避免了因?yàn)镃PU-GPU數(shù)據(jù)通信方式單一與工作負(fù)載不匹配,帶來的潛在性能瓶頸和系統(tǒng)效率下降。結(jié)合不同種類,不同數(shù)量的加速卡選擇,其可實(shí)現(xiàn)對AI各種復(fù)雜場景的完美匹配。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施▲聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器支持豐富生態(tài)

(3)充分考慮設(shè)計冗余,確保無間斷運(yùn)行

聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器充分考慮了設(shè)計冗余,支持電源N+N冗余,節(jié)點(diǎn)內(nèi)電源間互為備份,對外可以連接雙路市電,從而保障服務(wù)器24小時在線運(yùn)行。該產(chǎn)品支持CPU、GPU、內(nèi)存等關(guān)鍵部件的功耗監(jiān)測,整機(jī)功耗封頂調(diào)控,動態(tài)保障服務(wù)器運(yùn)行在合理的功耗區(qū)間,保證性能的穩(wěn)定,以及風(fēng)扇N+1冗余等多種安全設(shè)計保障高環(huán)溫?zé)o間斷運(yùn)行。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器的穩(wěn)定性

陳振寬告訴智東西,在AI算力、智算方面,這應(yīng)該是一個變革式的推出,循序漸進(jìn)式的不大可以滿足智算的需求。所以在智算方面,聯(lián)想這次推出的這兩款產(chǎn)品還是比較偏向于大規(guī)模的推理和大規(guī)模的訓(xùn)練,就是大規(guī)模和超大規(guī)模。

三、推出智算中心方案,三種交付方式支持三類算力場景

當(dāng)下,混合架構(gòu)模式在智算中心的建設(shè)中已成為行業(yè)趨勢。

戴煒認(rèn)為,智能算力場景持續(xù)推動算力需求的不斷升級,智算中心建設(shè)需要滿足千行百業(yè)對混合算力的要求,包括公有云和私有云的混合,國產(chǎn)算力及通用算力的混合,以及普算、超算和智算,企業(yè)智算中心和區(qū)域智算中心都顯現(xiàn)出復(fù)雜性。

智算中心的復(fù)雜性需要領(lǐng)先的技術(shù)框架和陪伴服務(wù)。為此,聯(lián)想推出端到端的智算中心方案,以及全周期陪伴式服務(wù)能力。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲戴煒講解智算中心方案及陪伴服務(wù)

聯(lián)想智算中心解決方案,是其AI原生的方案服務(wù)的重要部分。AI原生的方案服務(wù)包括聯(lián)想智算中心解決方案、聯(lián)想混合云解決方案、聯(lián)想大腦嵌入的解決方案和端到端全周期的聯(lián)想智算中心服務(wù)和臻算服務(wù)。

聯(lián)想推出AI大模型訓(xùn)練服務(wù)器!對話聯(lián)想副總裁:全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施

▲聯(lián)想智算中心解決方案

戴煒說:“針聯(lián)想方案服務(wù)將以三種交付方式(混合云、臻算服務(wù)2.0訂閱式和一站式)支持三類算力場景(普算、智算、超算)的混合計算需求。”

結(jié)語:大模型落地行業(yè),推動AI算力需求爆發(fā)

隨著大模型向千行百業(yè)落地,AI算力已成為算力基礎(chǔ)設(shè)施的重要發(fā)展方向。知名行研機(jī)構(gòu)IDC報告顯示,隨著生成式人工智能應(yīng)用的爆發(fā),各行業(yè)對智算的需求首次超過通用算力,AI算力已成為算力發(fā)展的主要方向,也成為“東數(shù)西算”發(fā)展的新的強(qiáng)勁動力。

乘此東風(fēng),IDC的數(shù)據(jù)顯示聯(lián)想集團(tuán)是2022增長最快的AI硬件基礎(chǔ)設(shè)施(服務(wù)器和存儲)提供商,同比增長139%,全球排名第三。本次,隨著聯(lián)想推出多款面向AI大模型時代的服務(wù)器,并加速推進(jìn)AI賦智、綠色賦能的“普慧”戰(zhàn)略,其有望為我國大模型的研發(fā)和落地提供新的動力。