智東西(公眾號(hào):zhidxcom)
作者 | 陳駿達(dá)
編輯 | 心緣

智東西12月12日?qǐng)?bào)道,近日,在第二十屆中國(guó)IDC產(chǎn)業(yè)年度大典(IDCC2025)暨數(shù)字基礎(chǔ)設(shè)施科技展(DITExpo)上,商湯科技大裝置事業(yè)群智算中心總經(jīng)理林海分享了商湯大裝置在算電協(xié)同方面的實(shí)踐經(jīng)驗(yàn)。

林海稱(chēng),從全球范圍看,算力基礎(chǔ)設(shè)施正迎來(lái)新一輪“算力效能”戰(zhàn)略競(jìng)爭(zhēng),包括各大科技巨頭通過(guò)自研AI加速器、數(shù)據(jù)中心液冷、可再生能源電力協(xié)同等方式不斷提升算力效能。

同時(shí)以 Palantir “Chain Reaction”等平臺(tái)為代表,將算力調(diào)度、電力預(yù)測(cè)與芯片資源管理納入同一體系,試圖構(gòu)建“國(guó)家級(jí)AI基礎(chǔ)設(shè)施操作系統(tǒng)”。

商湯大裝置在算電協(xié)同領(lǐng)域已展開(kāi)探索,并給出了一套“算力—能源”協(xié)同的建設(shè)范式。

一、全球推進(jìn)“算力—能源”協(xié)同,商湯大裝置構(gòu)建算電融合體系

林海講道,近期,美國(guó)知名大數(shù)據(jù)企業(yè)Palantir Technologies Inc.(NYSE: PLTR)正式發(fā)布了名為“Chain Reaction”的產(chǎn)品,并將其定位為“面向美國(guó)人工智能基礎(chǔ)設(shè)施的操作系統(tǒng)”。

這一舉措表明,以美國(guó)為代表的科技強(qiáng)國(guó)已開(kāi)始從國(guó)家戰(zhàn)略層面,系統(tǒng)推進(jìn)推動(dòng)“算力—芯片—能源”一體化布局,旨在構(gòu)建自主可控、高效協(xié)同的國(guó)家級(jí)人工智能基礎(chǔ)設(shè)施體系。

在這一全球趨勢(shì)下,商湯大裝置基于自身萬(wàn)卡級(jí)智算中心(AIDC)的長(zhǎng)期運(yùn)營(yíng)實(shí)踐,于2025年7月正式發(fā)布了自主可控的“算電協(xié)同智能調(diào)度平臺(tái)”,打通算力及電力數(shù)據(jù)。

這不僅是一項(xiàng)企業(yè)降本增效的技術(shù)工程,更是關(guān)系到我國(guó)在人工智能時(shí)代能否在基礎(chǔ)設(shè)施層面掌握發(fā)展主動(dòng)權(quán)的戰(zhàn)略課題。

隨著AI應(yīng)用需求爆發(fā)與“雙碳”目標(biāo)推進(jìn),電力正成為制約算力擴(kuò)展與綠色運(yùn)營(yíng)的關(guān)鍵瓶頸。林海稱(chēng),新一代智算中心絕非單純堆服務(wù)器、拼規(guī)模的傳統(tǒng)數(shù)據(jù)中心,而是要實(shí)現(xiàn)“算力與能源的深度協(xié)同”。

然而,當(dāng)前行業(yè)普遍存在“模型任務(wù)數(shù)據(jù)、集群負(fù)載數(shù)據(jù)、底層電力調(diào)度數(shù)據(jù)”彼此割裂,以及結(jié)算機(jī)制的不穿透,造成了數(shù)據(jù)的孤島以及運(yùn)行模式難以協(xié)同。

為破解這一結(jié)構(gòu)性難題,商湯大裝置聚焦更深層次的基礎(chǔ)設(shè)施運(yùn)行邏輯,構(gòu)建了“IaaS+MaaS+算電協(xié)同”的整體架構(gòu)體系,穿透從底層風(fēng)、火、水、電到頂層模型任務(wù)的全鏈路數(shù)據(jù),以“源-網(wǎng)-荷-儲(chǔ)”全鏈路算電協(xié)同平臺(tái),實(shí)現(xiàn)算力與能源的精準(zhǔn)匹配。

給數(shù)據(jù)中心裝上AI大腦,商湯亮出“算電協(xié)同”方案,全年節(jié)電超1000萬(wàn)度

其中,商湯以能源大模型為核心,打破數(shù)據(jù)孤島,實(shí)現(xiàn)智能預(yù)測(cè)與高頻調(diào)度;同時(shí)攜手寧德時(shí)代打造具備智能控制能力的大規(guī)模儲(chǔ)能系統(tǒng),為算力負(fù)載波動(dòng)提供靈活、穩(wěn)定的電力支撐。

二、能源大模型賦能:創(chuàng)新算法架構(gòu),讓負(fù)荷預(yù)測(cè)更精準(zhǔn)

商湯自研能源大模型采用多模態(tài)MoE架構(gòu),基于海量行業(yè)知識(shí)文本、能源結(jié)構(gòu)化數(shù)據(jù)、算力監(jiān)控指標(biāo)等數(shù)據(jù)訓(xùn)練而來(lái),并充分融合能源行業(yè)知識(shí)庫(kù),可精準(zhǔn)預(yù)測(cè)復(fù)雜場(chǎng)景的能源需求,并做出準(zhǔn)確決策:

給數(shù)據(jù)中心裝上AI大腦,商湯亮出“算電協(xié)同”方案,全年節(jié)電超1000萬(wàn)度

(1)打通數(shù)據(jù)閉環(huán),實(shí)現(xiàn)全鏈路精準(zhǔn)映射:打造“算力-電力”映射模型,通過(guò)獨(dú)創(chuàng)的“能量塊”數(shù)據(jù)模型與“算電功耗模型”,打通從AI訓(xùn)練任務(wù)、算力平臺(tái)、服務(wù)器硬件與配電系統(tǒng)的全鏈路數(shù)據(jù),實(shí)現(xiàn)“任務(wù)-算力-功耗”的精準(zhǔn)映射。

(2)創(chuàng)新“能量塊”,復(fù)雜場(chǎng)景精準(zhǔn)預(yù)測(cè):通過(guò)將能源本征數(shù)據(jù)、用戶(hù)用能特性、能源平衡規(guī)則等信息與算力服務(wù)器綁定為“能量塊”作為基礎(chǔ)TOKEN,并基于多輪預(yù)訓(xùn)練結(jié)果優(yōu)化調(diào)整算法架構(gòu),全面提升復(fù)雜場(chǎng)景下的預(yù)測(cè)精度與泛化能力。

(3)高頻次動(dòng)態(tài)調(diào)度,實(shí)現(xiàn)最優(yōu)能源平衡:以15分鐘為周期進(jìn)行高頻次預(yù)測(cè),并以5分鐘為周期進(jìn)行決策修正迭代,基于實(shí)時(shí)能源狀態(tài)與負(fù)載預(yù)測(cè),自動(dòng)生成最優(yōu)調(diào)度策略,并通過(guò)跨系統(tǒng)聯(lián)動(dòng)執(zhí)行,實(shí)現(xiàn)精準(zhǔn)的算力預(yù)測(cè)、負(fù)荷預(yù)測(cè)、策略生成與修正。

整體上,能源大模型可提前預(yù)測(cè)算力負(fù)載趨勢(shì),并綜合電價(jià)信號(hào)、綠電比例、儲(chǔ)能狀態(tài)、電網(wǎng)需求等因素,進(jìn)行跨系統(tǒng)聯(lián)合動(dòng)態(tài)求解,實(shí)現(xiàn)“算隨電用、電隨算動(dòng)”的主動(dòng)調(diào)度,將數(shù)據(jù)中心從“剛性負(fù)荷”轉(zhuǎn)變?yōu)椤翱烧{(diào)資源”。

目前,基于能量塊的模型能源需求預(yù)測(cè)準(zhǔn)確率已經(jīng)達(dá)到88%以上,決策準(zhǔn)確率已達(dá)到93%以上。隨著算法與儲(chǔ)能設(shè)備的持續(xù)迭代優(yōu)化,預(yù)測(cè)準(zhǔn)確率將達(dá)到90%~95%的行業(yè)領(lǐng)先水平,決策準(zhǔn)確率將超過(guò)95%。

三、聯(lián)合寧德時(shí)代打造智慧儲(chǔ)能系統(tǒng),AIDC跑通“算隨電用、電隨算動(dòng)”雙向閉環(huán)

在儲(chǔ)能側(cè),商湯與寧德時(shí)代聯(lián)合打造了規(guī)模達(dá)17.888MW/35.776MWh的新型儲(chǔ)能系統(tǒng),并為其賦予了智慧管理能力,面向大模型訓(xùn)練和推理的高峰波動(dòng)場(chǎng)景進(jìn)行了專(zhuān)項(xiàng)設(shè)計(jì),可有效應(yīng)對(duì)算力集群在高負(fù)載階段出現(xiàn)的瞬時(shí)功率缺口與尖峰波動(dòng),同時(shí)參與削峰填谷和電力市場(chǎng)交易,直接創(chuàng)造經(jīng)濟(jì)價(jià)值。

給數(shù)據(jù)中心裝上AI大腦,商湯亮出“算電協(xié)同”方案,全年節(jié)電超1000萬(wàn)度

這一儲(chǔ)能系統(tǒng)成為智算中心的“電力緩沖池”,具備毫秒級(jí)響應(yīng)能力,可以在萬(wàn)卡級(jí)集群?jiǎn)?dòng)、負(fù)載突增時(shí)提供瞬時(shí)功率支撐,有效應(yīng)對(duì)算力負(fù)載波動(dòng)帶來(lái)的沖擊,保障集群穩(wěn)定運(yùn)行。

它還通過(guò)“分季節(jié)調(diào)度”實(shí)現(xiàn)安全效率平衡,在PUE較低的冬春秋季,采用傳統(tǒng)兩充兩放模式;在高PUE、低冗余的夏季,則切換至由能源大模型驅(qū)動(dòng)的智能調(diào)度模式,確保系統(tǒng)在安全紅線內(nèi)高效運(yùn)行。

得益于系統(tǒng)級(jí)的算電協(xié)同優(yōu)化,由商湯建設(shè)并自持的全國(guó)首個(gè)5A級(jí)智算中心上海臨港AIDC不僅可以根據(jù)算力負(fù)載變化,自動(dòng)優(yōu)化算力調(diào)度,還可通過(guò)能源大模型預(yù)測(cè)用電需求,智能控制儲(chǔ)能系統(tǒng)實(shí)現(xiàn)削峰填谷,在保障穩(wěn)定運(yùn)行的同時(shí)持續(xù)降低能耗和用電成本,成功實(shí)現(xiàn)“算隨電用、電隨算動(dòng)”雙向閉環(huán)。

目前,上海臨港AIDC實(shí)現(xiàn)了整體PUE降低至1.267,PUE比設(shè)計(jì)值降低3%、全年節(jié)電超1000萬(wàn)度、年化電費(fèi)成本節(jié)約7%、碳減排3000噸的運(yùn)營(yíng)成效,帶來(lái)顯著的經(jīng)濟(jì)與社會(huì)效益,成為綠色智算中心“樣板間”。商湯大裝置上海臨港智算中心還獲得“2025年度中國(guó)IDC產(chǎn)業(yè)算電協(xié)同先鋒獎(jiǎng)”。

結(jié)語(yǔ):能源成為AI基礎(chǔ)設(shè)施重要一環(huán)

能源供給在AI基礎(chǔ)設(shè)施建設(shè)過(guò)程中的重要性與日俱增。隨著全球算力需求爆發(fā)式增長(zhǎng),大模型的訓(xùn)練與推理正帶來(lái)前所未有的能源消耗挑戰(zhàn)。產(chǎn)業(yè)不僅需要更高的算力,更需要更高效、更穩(wěn)定、更可持續(xù)的算力供給方式。

未來(lái),商湯大裝置將以能源大模型和系統(tǒng)級(jí)算法為核心引擎,深化產(chǎn)業(yè)合作,打造面向大模型時(shí)代的下一代AI基礎(chǔ)設(shè)施底座,為產(chǎn)業(yè)降本增效與綠色發(fā)展提供持續(xù)動(dòng)能。