芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西8月28日報道,8月27日,上海AI芯片及GPU龍頭企業(yè)沐曦股份回復(fù)科創(chuàng)板IPO首輪審核問詢函。

國產(chǎn)GPU龍頭回應(yīng)一切!

這份文件披露了大量詳實的數(shù)據(jù),不僅包括國產(chǎn)AI芯片最新市場規(guī)模、競爭格局及市場占有率,分析當前國產(chǎn)GPU商業(yè)化拓展的四大難點,還跟國內(nèi)外競爭對手的產(chǎn)品布局及業(yè)績表現(xiàn)進行了直觀對比。

在文件中,沐曦詳細披露自家產(chǎn)品在算力、通信、軟件、商業(yè)化上與同行的差距,并坦言自己在互聯(lián)網(wǎng)企業(yè)客戶開拓方面落后于國內(nèi)友商。

沐曦明確指出其在國內(nèi)AI計算市場的主要競爭對手包括國際巨頭英偉達、AMD,國內(nèi)上市公司寒武紀、海光信息,國內(nèi)未上市公司華為海思、昆侖芯天數(shù)智芯、壁仞科技、燧原科技摩爾線程等。

弗若斯特沙利文預(yù)測,中國AI計算加速芯片市場規(guī)模,今年將達到2398億元,2029年將達到1.34萬億元。

另據(jù)IDC統(tǒng)計,2024年中國數(shù)據(jù)中心加速芯片市場中,出貨量在10000張以上的GPU公司包括英偉達、沐曦股份、天數(shù)智芯。

Bernstein Research預(yù)測到2027年,中國本土AI芯片供應(yīng)商的市場份額將提升至55%

文件顯示,沐曦股份成立于2020年9月,最近一次外部股權(quán)融資對應(yīng)的投后估值為210.71億元,申報前12個月突擊入股股東82名,股東穿透后人數(shù)合計為180名。

當前沐曦有三大產(chǎn)品線:曦云C系列產(chǎn)品主要用于AI訓(xùn)練(訓(xùn)推一體)和通用計算,是其目前的主力產(chǎn)品;曦思N系列產(chǎn)品主要用于AI推理;曦彩G系列主要用于圖形渲染,尚在研發(fā)過程中。

該公司目前處于持續(xù)虧損狀態(tài),2024年凈虧損逾14億元,預(yù)計最早于2026年扭虧為盈。

截至今年8月15日,其在手訂單金額(不含稅)11.40億元。其直接客戶包括新華三、瑞芯智能、算豐、匯天網(wǎng)絡(luò)等。

沐曦還披露了其下一代芯片的最新進展及計劃。

曦云C500系列產(chǎn)品的綜合性能對標英偉達A100,接下來兩代C600系列、C700系列將采用國內(nèi)先進制程工藝

曦云C600系列支持FP8精度,預(yù)計今年年底進入風險試產(chǎn)。曦云C700系列支持FP4精度,今年4月立項,定位對標英偉達H100

本次IPO,沐曦擬募資39億元,測算的各項目內(nèi)部收益率如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

其曦云C600研發(fā)項目投資總額為13.70億元,其中擬使用募資投入金額為8.41億元;曦云C700研發(fā)項目投資總額為20.40億元,其中擬使用募資投入金額為16.18億元;新一代AI推理GPU研發(fā)及產(chǎn)業(yè)化項目是研發(fā)下一代基于先進封裝技術(shù)的云端大模型推理芯片Nx,投資總額為5.78億元,其中擬使用募資投入金額為4.53億元。

一、國產(chǎn)AI芯片點兵點將,華為海思市占率23%

根據(jù)Bernstein Research數(shù)據(jù),以銷售金額口徑計,2024年中國AI加速器市場中,英偉達的市占率約為66%華為海思約為23%AMD約為5%寒武紀、摩爾線程沐曦股份約為1%

國產(chǎn)GPU龍頭回應(yīng)一切!

英偉達產(chǎn)品在硬件架構(gòu)、單卡算力、互連拓撲、軟件生態(tài)、大規(guī)模集群建設(shè)等方面都建立了明顯的領(lǐng)先優(yōu)勢,AMD亦緊隨其后不斷迭代和優(yōu)化產(chǎn)品性能。

在國內(nèi)AI訓(xùn)練市場,沐曦股份的主要競爭對手包括英偉達、AMD、華為海思、寒武紀、海光信息、昆侖芯、平頭哥、天數(shù)智芯、摩爾線程、壁仞科技等。

市場主流計算架構(gòu)以及GPU主要產(chǎn)品類型的基本情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

通用型架構(gòu)的GPU是目前主流的AI芯片計算架構(gòu)。

根據(jù)IDC數(shù)據(jù),2024年中國加速服務(wù)器市場中,GPU服務(wù)器占據(jù)主導(dǎo)地位,約占70%的市場份額。

弗若斯特沙利文數(shù)據(jù)顯示,2024年GPU架構(gòu)的AI芯片在中國AI芯片市場中約占69.9%的市場份額,其他AI芯片(主要包括ASIC及FPGA)約占30.1%,預(yù)計到2029年GPU的市場份額將提升至77.3%。

據(jù)此測算,2024年中國AI芯片市場中GPU的市場規(guī)模約1000億元,以ASIC/DSA為代表的其他AI芯片的市場規(guī)模約425億元。

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦股份、海光信息、天數(shù)智芯、壁仞科技、摩爾線程等國內(nèi)企業(yè)緊跟國際龍頭的技術(shù)路線,采取GPU架構(gòu)積極參與市場競爭,逐步提升國產(chǎn)GPU的市場滲透率。

其他采用專用型架構(gòu)(ASIC/DSA)芯片的競爭格局,相較GPU架構(gòu)更為分散,不同廠商從不同細分領(lǐng)域切入市場,形成差異化競爭。參與者主要包括華為海思、寒武紀,以及具有特定應(yīng)用需求的科技巨頭所孵化或?qū)ν馔顿Y的生態(tài)鏈企業(yè),如昆侖芯、平頭哥、燧原科技等。

根據(jù)弗若斯特沙利文數(shù)據(jù),中國AI智算GPU市場規(guī)模從2020年的142.86億元迅速增至2024年的996.72億元,年均復(fù)合增長率達62.5%,預(yù)計至2029年將提升至10,333.40億元的市場規(guī)模。

國產(chǎn)GPU龍頭回應(yīng)一切!

根據(jù)IDC數(shù)據(jù),2024年中國數(shù)據(jù)中心加速芯片市場中,出貨量在10000張以上的GPU公司(不含ASIC芯片公司)包括英偉達、沐曦股份、天數(shù)智芯。

此外,海光信息、壁仞科技等公司亦在AI計算GPU市場有所布局。

受限于工藝制程,國內(nèi)計算芯片行業(yè)的主流算力水平尚處于英偉達A100產(chǎn)品階段,少數(shù)廠商通過先進封裝(如雙芯粒封裝)等方式能實現(xiàn)接近英偉達H100產(chǎn)品的算力,為國內(nèi)廠商中的最先進水平。

以行業(yè)內(nèi)通常用來衡量GPU芯片在AI訓(xùn)練場景下的算力性能指標FP16/BF16為例,沐曦曦云C500/C550芯片處于英偉達A100的算力區(qū)間,領(lǐng)先國內(nèi)大部分廠商;曦云C588芯片在曦云C550的基礎(chǔ)上實現(xiàn)算力躍升,大幅縮小與英偉達H100的差距,在國內(nèi)處于先進水平。

根據(jù)IDC數(shù)據(jù),訓(xùn)練型AI服務(wù)器中GPU的價值占比可達73%,而推理型AI服務(wù)器中GPU的價值占比約為25%;預(yù)計未來五年內(nèi),國內(nèi)訓(xùn)練和推理算力的年復(fù)合增速將分別達到50%190%。

圖形GPU市場的主要參與者包括海外巨頭英偉達、AMD,國內(nèi)供應(yīng)商主要為景嘉微、摩爾線程、格蘭菲智能科技股份有限公司、瀚博半導(dǎo)體(上海)股份有限公司等。

沐曦在研的圖形渲染產(chǎn)品主要為應(yīng)用于云端渲染的高性能圖形GPU。

二、境外GPU龍頭對華產(chǎn)品銷售政策變化,會給國內(nèi)AI芯片企業(yè)帶來哪些影響?

近年來,受到美國高性能計算芯片出口管制與國內(nèi)政策推動等因素影響,英偉達在中國市場的份額呈現(xiàn)明顯下降趨勢。

2021年至2024年,英偉達收入結(jié)構(gòu)中來源于中國的比例從26.42%下降至13.11%。

英偉達H20系列產(chǎn)品是在2023年10月美國BIS限制出口芯片規(guī)格參數(shù)的政策出臺后,專為中國市場推出的特供版GPU產(chǎn)品,關(guān)鍵參數(shù)如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

H20系列在今年4月15日被美國政府對華禁售,現(xiàn)已取得許可證,將恢復(fù)向中國銷售。英偉達還將推出面向中國市場的全新GPU產(chǎn)品。

根據(jù)回復(fù)文件,這些變化不會對沐曦股份業(yè)績及市場拓展產(chǎn)生重大不利影響,主要原因包括四點:

  • 主要客戶群體與境外龍頭存在較大差異,不構(gòu)成直接競爭;
  • 產(chǎn)品性能客觀上具備替代英偉達H20的能力;
  • 國內(nèi)高性能算力芯片需求缺口較大;
  • 基于供應(yīng)穩(wěn)定性、產(chǎn)品安全性需求帶來的國產(chǎn)替代趨勢下,以沐曦為代表的高性能GPU供應(yīng)商將迎來黃金發(fā)展機遇。

Bernstein Research的調(diào)研結(jié)果顯示,2024年H20在中國市場的主要客戶為互聯(lián)網(wǎng)廠商,字節(jié)跳動、騰訊、阿里巴巴、百度的H20采購量合計占據(jù)87%的份額。

沐曦當前主力產(chǎn)品為用于AI訓(xùn)練(訓(xùn)推一體)場景的曦云C系列GPU。曦云C500系列產(chǎn)品的下游客戶以國家人工智能公共算力平臺、運營商智算平臺、商業(yè)化智算中心以及教科研、金融等行業(yè)客戶為主,與英偉達H20的主要目標銷售市場不存在直接競爭

沐曦綜合多維度參數(shù)對比,認為自家GPU產(chǎn)品客觀上具備替代英偉達H20的能力。

1、單卡算力、顯存容量超H20

曦云C500系列、曦云C600系列產(chǎn)品的單卡算力已超過H20。曦云C600系列產(chǎn)品具備FP8計算單元,支持多精度計算,同時配備了大容量顯存,超過H20的96GB版本,基于MetaXLink高速互連技術(shù),互連帶寬達到了與英偉達4nm制程工藝下產(chǎn)品相當的性能。

2、境外GPU龍頭無法滿足中國AI芯片需求缺口

根據(jù)英偉達2026財年一季報(截至2025年4月),英偉達為H20的庫存計提了約45億美元的減值,折合為數(shù)量約30-40萬張GPU板卡。

根據(jù)IDC數(shù)據(jù),2024年中國加速芯片市場出貨量超過270萬張,剔除H20的庫存消耗后,中國市場仍存在巨大的需求缺口。

3、美國政府“朝令夕改”下,國產(chǎn)替代已成共識

Bernstein Research預(yù)測,面對英偉達對華銷售產(chǎn)品規(guī)格升級空間存在不確定性的情況,國內(nèi)算力需求方將進一步提升對中國本土AI芯片供應(yīng)商的采購份額,預(yù)計到2027年,中國本土AI芯片供應(yīng)商的市場份額將提升至55%。

AI和集成電路是中美科技戰(zhàn)的重要領(lǐng)域。長期來看,為保障算力供應(yīng)的穩(wěn)定,互聯(lián)網(wǎng)廠商同時采購境外龍頭產(chǎn)品與國產(chǎn)廠商基于國產(chǎn)供應(yīng)鏈的產(chǎn)品的 “雙軌制”策略已成大勢所趨。

三、國產(chǎn)GPU商業(yè)化拓展面臨四大難點

當前國產(chǎn)GPU的商業(yè)化拓展面臨4個主要難點。

(1)與國際巨頭相比,產(chǎn)品性價比與存在差距。國內(nèi)企業(yè)在技術(shù)積累、人才密度、經(jīng)營規(guī)模及資金實力各方面與國際巨頭存在明顯差距,疊加制程工藝限制,短期內(nèi)難以突破其高性價比產(chǎn)品構(gòu)筑的全球市場壁壘。

(2)商業(yè)客戶嚴苛的服務(wù)水平要求及準入門檻拉長產(chǎn)品導(dǎo)入周期。以國內(nèi)互聯(lián)網(wǎng)企業(yè)為代表的商業(yè)客戶對GPU產(chǎn)品的綜合性能及穩(wěn)定性要求極高,采購GPU仍以可售的國際產(chǎn)品為主,國產(chǎn)GPU占比較低且多數(shù)集中于推理場景,訓(xùn)練場景需要更大規(guī)模集群測試的時間與資源投入,因此國產(chǎn)GPU產(chǎn)品導(dǎo)入較慢,商業(yè)化進程遲緩。

(3)國產(chǎn)GPU軟件生態(tài)相對薄弱,客戶遷移成本較高。雖然國產(chǎn)GPU依托通用型架構(gòu)優(yōu)勢,具備兼容CUDA的理論基礎(chǔ)及路徑可行性,但生態(tài)適配、迭代和培育建設(shè)是一項長期、復(fù)雜的系統(tǒng)性工程,短時間內(nèi)預(yù)計無法改變國產(chǎn)GPU相較國際產(chǎn)品生態(tài)薄弱的困境。

(4)客戶關(guān)于能否保障供應(yīng)鏈持續(xù)穩(wěn)定有所擔憂。國產(chǎn)GPU的供應(yīng)鏈穩(wěn)定性,也是影響互聯(lián)網(wǎng)企業(yè)等部分客戶采購決策的主要考慮之一。

包括沐曦、寒武紀在內(nèi),國內(nèi)AI芯片公司普遍呈現(xiàn)出下半年收入占比較高的特點,在第四季度尤其集中,受季節(jié)性影響較大。

國產(chǎn)GPU龍頭回應(yīng)一切!

四、單卡算力與英偉達相差一到兩代,互聯(lián)網(wǎng)企業(yè)客戶開拓不及國內(nèi)友商

沐曦股份與境外龍頭的差距包括:

(1)單卡算力:已接近英偉達主流產(chǎn)品,但受限于工藝制程和研發(fā)周期,包括沐曦在內(nèi)的絕大部分國內(nèi)廠商與英偉達最新產(chǎn)品均仍存在一到兩代差距。

(2)集群通信:沐曦自研MetaXLink高速互連技術(shù)達到了與英偉達4nm制程工藝下旗艦產(chǎn)品(H200)相當?shù)幕ミB帶寬性能,是國內(nèi)廠商中率先將與英偉達NVLink技術(shù)的差距縮小到一代以內(nèi)的GPU供應(yīng)商。

(3)軟件生態(tài):全球英偉達CUDA開發(fā)者已達數(shù)百萬。而沐曦MXMACA軟件棧截至2025年7月31日的注冊用戶超過15000人,在軟件生態(tài)的建設(shè)方面存在較大的發(fā)展空間。

(4)產(chǎn)品布局與商業(yè)化:沐曦在經(jīng)營規(guī)模上取得了快速成長,但尚處于發(fā)展初期階段,整體產(chǎn)品數(shù)量、業(yè)績規(guī)模、市場份額、客戶數(shù)量仍然偏小,相較境外龍頭仍存在明顯差距。

在境內(nèi)市場,與國內(nèi)頭部企業(yè)華為海思相比,沐曦在銷售規(guī)模、銷售網(wǎng)絡(luò)、市場知名度、客戶結(jié)構(gòu)、人才規(guī)模等方面還存在差距。

沐曦目前在互聯(lián)網(wǎng)企業(yè)客戶開拓及產(chǎn)品導(dǎo)入方面,相比部分國內(nèi)友商進度有所滯后。

互聯(lián)網(wǎng)企業(yè)的采購決策高度市場化,出于對產(chǎn)品性價比和生態(tài)競爭力的考慮,其第一選擇仍然是國際產(chǎn)品,而在部分推理場景下可能會使用國產(chǎn)算力芯片,但通常也是優(yōu)先選擇自有產(chǎn)品,或者扶持其投資的生態(tài)鏈企業(yè)。

沐曦一方面暫時缺乏互聯(lián)網(wǎng)企業(yè)股東背景及相應(yīng)業(yè)務(wù)支持,另一方面則由于前述友商的產(chǎn)品多數(shù)為ASIC架構(gòu),其通過針對特定任務(wù)進行硬件定制化設(shè)計可實現(xiàn)較高的能效比,因此在模型和算子相對固化的推理場景下更具優(yōu)勢。

五、沐曦為什么越虧越多?

沐曦預(yù)計最早于2026年實現(xiàn)扭虧為盈。具體敏感性分析如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

2022年、2023年、2024年,沐曦的凈利潤分別為-7.77億元、-8.71億元、-14.09億元。

為什么會越虧越多?

影響其損益的各科目金額及占營收比例如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

由上表可見,沐曦持續(xù)虧損的主要影響因素為:1)收入與毛利快速增長,但總體收入規(guī)模較?。?)研發(fā)費用金額較大且持續(xù)增長,銷售毛利規(guī)模不足以覆蓋高額的研發(fā)支出;3)確認了大額的股份支付費用、資產(chǎn)減值損失以及信用減值損失。

2022年、2023年、2024年,沐曦的研發(fā)費用分別為6.48億元、6.99億元、9.01億元,呈現(xiàn)顯著增長態(tài)勢。

其凈利潤扣除股份支付、資產(chǎn)減值損失、信用減值損失后情況如下,2024年虧損7.51億元,較2023年度虧損額7.75億元呈現(xiàn)收窄趨勢。

國產(chǎn)GPU龍頭回應(yīng)一切!

國產(chǎn)AI芯片廠商整體起步相對較晚,過去幾年大多處于技術(shù)突破和產(chǎn)品落地初期階段,處于大規(guī)模量產(chǎn)初期,規(guī)模效益尚未充分顯現(xiàn),需要投入大量資源用于技術(shù)研發(fā)、市場拓展和生態(tài)建設(shè)等,使成本居高不下。

在市場份額還未充分打開、產(chǎn)品認可度仍有待提升的階段,這些持續(xù)的高額投入難以快速轉(zhuǎn)化為營收,成本支出遠超收入,導(dǎo)致過去幾年行業(yè)普遍處于虧損狀態(tài)。

六、主力產(chǎn)品性能對標英偉達A100

2022年、2023年、 2024年、2025年1-3月,沐曦訓(xùn)推一體曦云C系列產(chǎn)品(含板卡和服務(wù)器)收入分別為0元、0.15億元、7.22億元、3.14億元,占同期主營業(yè)務(wù)收入的比例分別為30.09%、97.28%、97.87%,合計形成營收10.51億元,占同期主營業(yè)務(wù)收入合計額的94.31%,是其絕對主力產(chǎn)品。

同期,沐曦核心技術(shù)收入占營收的比例分別為100.00%、96.94%、86.53%、99.02%,占比較高。

國產(chǎn)GPU龍頭回應(yīng)一切!

曦云C500系列產(chǎn)品綜合性能對標英偉達A100,部分應(yīng)用場景下的核心指標已比肩國際主流產(chǎn)品,相較英偉達國內(nèi)可售產(chǎn)品H20在大模型訓(xùn)練場景下更具性能優(yōu)勢,擁有豐富的標量、矢量和張量計算單元,支持FP64、FP32、TF32、FP16、BF16、INT8等混合精度計算。

沐曦的收入來自訓(xùn)推一體系列GPU板卡、訓(xùn)推一體GPU服務(wù)器、智算推理GPU板卡以及IP授權(quán),主要產(chǎn)品類型由智算推理系列向訓(xùn)推一體系列轉(zhuǎn)變。

其訓(xùn)推一體系列產(chǎn)品的收入占比大幅上升,從2023年的30.09%上升至2025年第1季度的97.87%;智算推理系列產(chǎn)品收入占比大幅下降,從2022年的100.00%下降至2025年第1季度的1.25%。

根據(jù)發(fā)展戰(zhàn)略,沐曦核心產(chǎn)品交付形態(tài)將以GPU板卡為主,IP授權(quán)非重點發(fā)展方向。

沐曦當前收入主要來源于AI芯片產(chǎn)品,而同行業(yè)可比公司主營業(yè)務(wù)產(chǎn)品還包括圖形渲染芯片、CPU芯片等。

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦主要在售AI芯片產(chǎn)品型號包括曦云C500、曦云C550、曦思N260、曦思N100,其中曦云C500、曦云C550為主力產(chǎn)品,與同行業(yè)可比公司主要在售的產(chǎn)品型號數(shù)量沒有顯著差異。

寒武紀在其招股說明書中披露,其云端智能芯片的迭代周期通常在2年左右,邊緣智能芯片的迭代周期通常會在2-3年左右。英偉達、AMD的產(chǎn)品迭代周期也需2年左右。

報告期內(nèi),沐曦用3年實現(xiàn)兩款芯片一次流片并成功量產(chǎn),核心產(chǎn)品曦云C500于2023年6月首批芯片回片,2024年2月正式量產(chǎn),正式量產(chǎn)至今尚不足兩年,下一代基于國產(chǎn)供應(yīng)鏈的曦云C600系列已于2025年7月回片

此前,沐曦于2021年上半年先后完成了曦思N100系列和曦云C500系列的研發(fā)立項,2023年4月智算推理GPU芯片曦思N100系列正式量產(chǎn)。

七、曦云700對標H100,支持FP4低精度格式

短期來看,曦云C500系列市場需求良好并持續(xù)穩(wěn)定出貨,預(yù)計未來1-2年內(nèi)仍將是沐曦重要的收入來源

曦云C500系列量產(chǎn)以后,沐曦其他在研產(chǎn)品主要包括基于國產(chǎn)供應(yīng)鏈的訓(xùn)推一體系列曦云C600曦云C700等,專為生成式AI推理市場設(shè)計的Nx系列,以及用于圖形渲染的曦彩G系列產(chǎn)品等。

曦云C600系列、曦云C700系列均采用國內(nèi)先進工藝制程,構(gòu)建了從設(shè)計、制造到封裝測試的國產(chǎn)供應(yīng)鏈閉環(huán),核心技術(shù)自主可控。

已有多家互聯(lián)網(wǎng)廠商、金融機構(gòu)、服務(wù)器OEM廠商表達對曦云C600產(chǎn)品的測試和適配意愿。

(1)曦云C600系列:基于國產(chǎn)先進工藝開發(fā)的通用GPU芯片,構(gòu)建了從設(shè)計、制造到封裝測試的國產(chǎn)供應(yīng)鏈閉環(huán),2024年2月立項,2025年7月完成回片并成功點亮,產(chǎn)品良率及各項測試指標良好,正在進行功能測試,預(yù)計2025年底進入風險量產(chǎn)

曦云C600系列通過先進封裝等方式實現(xiàn)計算性能升級,使用最新一代HBM3e并大幅提升了顯存容量和帶寬,增加了對FP8數(shù)據(jù)格式的支持,尤其是FP8 Tensor及Tensor轉(zhuǎn)置指令,能顯著提高計算效率,更契合當前頭部大模型廠商的訓(xùn)練需求。

不過受限于工藝制程,曦云C600系列的卡間互連帶寬略有下降,同時功耗有所提升。

(2)曦云C700系列:基于國產(chǎn)先進工藝開發(fā)的下一代通用GPU芯片,2025年4月立項,目前正處于軟硬件購置和產(chǎn)品設(shè)計開發(fā)階段,芯片的核心設(shè)計、功能驗證已大部分完成,正進行更深入的性能調(diào)優(yōu)。

曦云C700系列進一步擴展對FP4等低精度的計算支持,定位是未來沐曦國產(chǎn)供應(yīng)鏈的旗艦產(chǎn)品,對標國際主流產(chǎn)品英偉達H100

(3)曦思Nx系列:下一代基于先進封裝技術(shù)的云端大模型推理芯片,專為生成式AI推理市場設(shè)計,計劃采用公司最新的第三代指令集和先進封裝工藝,通過超高顯存帶寬和大容量顯存提高token吞吐量,同時保持低功耗和高能效,大幅降低AI推理成本。相關(guān)產(chǎn)品可廣泛應(yīng)用于國內(nèi)商業(yè)化智算中心,或用于AI PC等端側(cè)低延遲、獨立用戶推理場景,支持從百億萬億各種參數(shù)規(guī)模的模型推理。

(4)曦彩G100系列:面向圖形處理場景,內(nèi)置性能強大的圖形處理器,主要應(yīng)用于云端及邊緣端圖形處理,曦彩G100 GPU IP的設(shè)計和驗證工作已完成。

隨著產(chǎn)品迭代進入“量產(chǎn)一代、在研一代、規(guī)劃一代”的穩(wěn)定周期,基于國產(chǎn)供應(yīng)鏈的曦云C系列產(chǎn)品預(yù)計將實現(xiàn)穩(wěn)定的產(chǎn)品迭代并成為沐曦穩(wěn)定的收入來源。

八、毛利率比寒武紀、海光低

2023年、2024年、2025年1-3月,沐曦綜合毛利率分別為62.88%、 53.43%、55.26%,低于寒武紀和海光信息綜合毛利率平均值。

國產(chǎn)GPU龍頭回應(yīng)一切!

其直銷和經(jīng)銷模式下毛利率與寒武紀、海光信息、龍芯中科、景嘉微、摩爾線程對比如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦在不同產(chǎn)品類型下主要細分產(chǎn)品型號、銷量、收入、單價及毛利率如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

國產(chǎn)GPU龍頭回應(yīng)一切!

報告期各期,沐曦各細分產(chǎn)品毛利率的總體情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

各型號產(chǎn)品銷售單價(不含稅)、毛利率變動情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

報告期內(nèi),沐曦經(jīng)營活動現(xiàn)金流量凈額持續(xù)為負,主要原因是其銷售規(guī)模尚在逐步提升過程中,原材料采購、存貨備貨和研發(fā)投入的資金需求較大,此外沐曦為應(yīng)對供應(yīng)鏈穩(wěn)定性風險,對部分原材料進行了戰(zhàn)略性儲備。

國產(chǎn)GPU龍頭回應(yīng)一切!

各期末,沐曦營運資金分別為6.30億元、9.33億元、25.04億元、92.11億元,流動比率分別為6.60、3.74、3.72、12.23,最近一期末營運資金和流動比率大幅增加,短期償債能力較好。

國產(chǎn)GPU龍頭回應(yīng)一切!

截至2025年3月末,沐曦貨幣資金余額為56.95億元,其中受限貨幣資金為198.06萬元,主要是銀行承兌匯票、保函的保證金;交易性金融資產(chǎn)余額為15.97億元,是該公司已購買未到期的結(jié)構(gòu)性存款。因此,報告期末其可支配資金為72.90億元。

國產(chǎn)GPU龍頭回應(yīng)一切!

經(jīng)測算,預(yù)計沐曦2025年、2026年營運資金需求分別為19.46億元、36.23億元,合計55.69億元。其可支配資金足以覆蓋未來兩年營運資金需求。

九、多款GPU板卡降價,在手訂單11.40億元

2022年-2024年末,沐曦產(chǎn)品平均產(chǎn)銷率分別為21.67%、39.00%、39.82%,低于行業(yè)平均水平,主要原因是沐曦處于前期業(yè)務(wù)快速拓展階段,銷售逐步起量,采取了較高比例的提前備貨策略。

國產(chǎn)GPU龍頭回應(yīng)一切!

2025年3月末,隨著市場需求釋放,沐曦產(chǎn)銷率提升至132.02%。

2023年、2024年、2025年1-3月,沐曦訓(xùn)推一體GPU曦云C500板卡平均銷售單價分別為5.69萬元/張、4.78萬元/張、3.70萬元/張。

國產(chǎn)GPU龍頭回應(yīng)一切!

2025年1-3月,曦云C500板卡平均銷售單價為3.70萬元/張,相較2024年度下降幅度為22.69%,主要受大客戶相關(guān)訂單影響,該客戶根據(jù)其下游集群建設(shè)需要,采購量較大,沐曦給予了價格優(yōu)惠。

若不考慮該客戶訂單的影響,2025年1-3月曦云C500板卡平均銷售單價為4.45萬元/張,相較2024年度下降幅度較小。

2024年和2025年1-3月,曦云C550板卡平均銷售單價分別為4.55萬元/張和5.99萬元/張,2025年一季度平均銷售單價上升31.57%。

報告期內(nèi),沐曦銷售單價下降主要受大客戶優(yōu)惠措施、與部分客戶階段性合同安排等短期因素影響,2025年第2季度、在手訂單平均銷售價格已回升。其2025年第2季度主要產(chǎn)品銷售情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

2025年第2季度,訓(xùn)推一體GPU板卡平均銷售單價為4.75萬元/張,相較2025年第 1季度3.89萬元/張大幅上升,與2024年4.69萬元/張的平均售價相比保持穩(wěn)定且略有上升。

截至2025年8月15日,沐曦在手訂單金額(不含稅)11.40億元,預(yù)計在2025年確認收入的1000萬元以上在手訂單銷售價格情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

截至報告期末,沐曦收入確認金額在1000萬元以上,且終端應(yīng)用于智算集群的GPU板卡/服務(wù)器銷售情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

除上述在報告期內(nèi)已確認收入的智算集群外,沐曦在2025年第2季度已交付并確認收入的主要集群包括:匯天網(wǎng)絡(luò)科技有限公司“項目F(二期)”(128臺GPU服務(wù)器)、上海算豐信息有限公司“項目E(二期)”集群(160臺GPU服務(wù)器)等。

經(jīng)統(tǒng)計使用沐曦報告期內(nèi)銷售產(chǎn)品搭建算力集群且集群規(guī)模在128卡及以上的主要終端項目情況,具體如下表所示:

國產(chǎn)GPU龍頭回應(yīng)一切!

截至本回復(fù)出具日,除項目尚未建設(shè)完畢等情形外,沐曦報告期內(nèi)銷售產(chǎn)品已在上述主要終端項目中實際投入使用,運行良好。

2025年1-3月收入合計24,939.26萬元,其中已投入使用的沐曦產(chǎn)品對應(yīng)收入12,250.99萬元,已投入使用比例較低主要因為項目C(一期)項目(4096卡)尚未完成建設(shè),該項目預(yù)計將于2025年9月投入運營。

十、客戶集中度低于國內(nèi)同行

報告期內(nèi),沐曦客戶集中度較高,前五大客戶主營業(yè)務(wù)收入占當期主營業(yè)務(wù)收入總額的比例分別為100.00%、91.58%、71.09%、88.35%,近兩年低于摩爾線程、海光信息、寒武紀。

國產(chǎn)GPU龍頭回應(yīng)一切!

同期,沐曦經(jīng)銷收入占主營業(yè)務(wù)收入的比例分別為0%、 43.81%、 37.42%、55.71%,高于海光信息、寒武紀、龍芯中科,與摩爾線程較為接近。

國產(chǎn)GPU龍頭回應(yīng)一切!

經(jīng)銷收入占比較高的主要原因,一是處于業(yè)務(wù)拓展期,通過經(jīng)銷模式快速打開市場;二是下游應(yīng)用領(lǐng)域廣泛,通過經(jīng)銷模式可快速觸達終端業(yè)務(wù)需求。

2023年、2024年、2025年1-3月,由沐曦存量客戶貢獻的收入金額占各期主營業(yè)務(wù)收入的比例分別為0%、15.99%、95.10%,客戶復(fù)購率持續(xù)提升。

從沐曦主要終端客戶角度按項目口徑(對應(yīng)直接客戶的單筆或多筆采購訂單)統(tǒng)計客戶復(fù)購情況相對更具有參考性,具體如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

2023年和2024年,沐曦產(chǎn)品曦思N100系列、曦云C500系列產(chǎn)品陸續(xù)正式量產(chǎn),新客戶銷售數(shù)量、金額及占比大幅增長。

國產(chǎn)GPU龍頭回應(yīng)一切!

2025年1-3月,新客戶收入占比下降,主要原因一是老客戶持續(xù)復(fù)購;二是沐曦通過經(jīng)銷商模式擴大了終端客戶覆蓋范圍。

其前5大新增客戶主營業(yè)務(wù)收入情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦持續(xù)拓展新客戶,截至2025年8月12日,累計已有230余家客戶正在或已測試沐曦GPU板卡,其中2024年12月末在測試客戶家數(shù)為26家、2025年6月末在測試客戶家數(shù)為43家,呈穩(wěn)步增長態(tài)勢。

該公司應(yīng)收賬款壞賬準備計提比例總體高于同行業(yè)可比公司計提比例,計提政策較為謹慎。

國產(chǎn)GPU龍頭回應(yīng)一切!

截至2025年7月末,報告期內(nèi)沐曦多筆金額較大的逾期應(yīng)收賬款已完成收回,期后回款比例已明顯提升。

國產(chǎn)GPU龍頭回應(yīng)一切!

十一、供應(yīng)商集中度較高,存貨規(guī)??焖僭鲩L

報告期內(nèi),沐曦前五大供應(yīng)商采購金額占當期采購總額的比例為95.67%、95.01%、91.30%、93.87%,供應(yīng)商集中度較高,前五大供應(yīng)商采購占比相對穩(wěn)定,不存在對單一供應(yīng)商采購比例超過50%的情況。

受行業(yè)慣例、采購周期、國際形勢等因素影響,為保障未來產(chǎn)品供應(yīng),沐曦向晶圓、HBM內(nèi)存等重要原材料供應(yīng)商進行提前訂貨并預(yù)付較高比例的貨款,導(dǎo)致預(yù)付賬款規(guī)模較大。

報告期內(nèi),沐曦現(xiàn)金流量表中購買商品、接受勞務(wù)支付的現(xiàn)金與采購總額、預(yù)付款項、應(yīng)付賬款變化金額等的匹配性關(guān)系如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

其預(yù)付款項規(guī)模、占比與同行業(yè)可比公司的對比情況如下:

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦核心原材料晶圓、HBM采購周期(從下單至交付)平均為6個月左右,提前備貨比例較高。

面臨AI芯片市場需求激增的情況,報告期內(nèi),其存貨規(guī)??焖僭鲩L。

同行業(yè)可比公司也采取了增加存貨儲備的策略,2024年末,寒武紀存貨余額同比增加493.11%,海光信息存貨余額同比增加396.05%,摩爾線程存貨余額同比增加119.43%。

國產(chǎn)GPU龍頭回應(yīng)一切!

龍芯中科的主營產(chǎn)品為CPU、景嘉微的主要產(chǎn)品為圖形GPU,與沐曦產(chǎn)品類型存在差異,存貨余額變化相對而言受到AI算力需求激增的驅(qū)動較小。

同行業(yè)可比公司中,寒武紀的存貨跌價準備計提比例明顯高于其他公司。剔除寒武紀之后,2022年末、2023年末、2024年末,其余四家同行業(yè)可比公司存貨跌價準備計提比例平均值分別為5.88%、7.73%、10.01%。

國產(chǎn)GPU龍頭回應(yīng)一切!

十二、手握四大優(yōu)勢,正推動萬卡集群落地

沐曦全系列產(chǎn)品采用統(tǒng)一的GPU計算架構(gòu),迄今已自主研發(fā)了兩個大代際、五個小代際流處理器架構(gòu),計劃通過發(fā)展先進封裝、互連通信等技術(shù),扎根國內(nèi)需求市場,與境外龍頭錯位競爭。

回復(fù)文件顯示,沐曦在境內(nèi)市場的具體競爭優(yōu)勢如下:

① 產(chǎn)品優(yōu)勢

根據(jù)多家行業(yè)權(quán)威的國家實驗室、計算中心、研究所的測試結(jié)果,沐曦GPU產(chǎn)品在通用性、單卡性能、集群性能及穩(wěn)定性、生態(tài)兼容與遷移效率等方面具備較強的核心競爭力,綜合技術(shù)實力領(lǐng)先行業(yè)。

  • 單卡性能:處于國內(nèi)第一梯隊。
  • 集群性能:自研MetaXLink具備國內(nèi)稀缺的高帶寬卡間互連能
    力,可實現(xiàn)2-64卡多種互連拓撲,并且在智算集群的線性度、穩(wěn)定性、利用率等方面具有較強的產(chǎn)品表現(xiàn)。
  • 軟件生態(tài):自主構(gòu)建的MXMACA軟件棧擁有統(tǒng)一、完整且高效的全棧式工具鏈,涵蓋應(yīng)用開發(fā)、功能調(diào)試和性能調(diào)優(yōu)等核心環(huán)節(jié),同時高度兼容GPU行業(yè)國際主流CUDA生態(tài),能夠開放擁抱全球開發(fā)者豐富的開源成果,具有較高的易用性和遷移效率,在通用性和靈活性上具備獨特的競爭力。

國產(chǎn)GPU龍頭回應(yīng)一切!

沐曦堅持推動MXMACA軟件棧開源共享,致力于打造中國版GPU開放編程接口標準,推動解決跨GPU平臺的應(yīng)用兼容難題,是國內(nèi)少數(shù)提供核心軟件生態(tài)和源代碼開源、提供版本SDK公開下載渠道、提供英文開發(fā)文檔資料的GPU公司。

該軟件棧支持超過6000個CUDA應(yīng)用以及多種開源技術(shù),包括AI訓(xùn)練框架(PyTorch/PaddlePaddle等)、AI推理框架(vLLM/SGLang等)、高性能算子庫(BLAS/DNN等)和超過1000個開源模型。

② 市場優(yōu)勢

陸續(xù)量產(chǎn)的智算推理曦思N系列GPU產(chǎn)品、訓(xùn)推一體曦云C系列GPU產(chǎn)品推動沐曦業(yè)績快速爆發(fā),近三年營收年均復(fù)合增長率高達4074.52%。2024年,沐曦營收為7.43億元,業(yè)績規(guī)模和市場份額在國內(nèi)同行業(yè)公司中位列前茅。

沐曦主要客戶普遍在其后續(xù)項目(如有)中對其產(chǎn)品進行了復(fù)購并進一步加大了采購規(guī)模。

沐曦是國內(nèi)少數(shù)真正實現(xiàn)多個千卡集群大規(guī)模商業(yè)化應(yīng)用的GPU供應(yīng)商,集群線性度、計算資源利用率、穩(wěn)定性和異構(gòu)混訓(xùn)能力行業(yè)領(lǐng)先,并正在研發(fā)和推動萬卡集群落地,已成功支持128B MoE大模型等完成全量預(yù)訓(xùn)練。

截至報告期末,沐曦GPU產(chǎn)品累計銷量超過25000顆,產(chǎn)品相繼應(yīng)用部署于10余個智算集群,算力網(wǎng)絡(luò)覆蓋國家人工智能公共算力平臺、運營商智算平臺和商業(yè)化智算中心,區(qū)域橫跨北京、上海、杭州、長沙、中國香港等地區(qū),并逐漸向更多區(qū)域延伸,下游應(yīng)用領(lǐng)域覆蓋教科研、金融、交通、能源、醫(yī)療健康、大文娛等行業(yè)。

在應(yīng)對國家人工智能公共算力平臺等標桿客戶組織的每次產(chǎn)品性能測試比選過程中,沐曦能夠根據(jù)客戶的技術(shù)標準要求和考察內(nèi)容變化,快速迭代、優(yōu)化公司產(chǎn)品的軟硬件技術(shù)組合方案。

③ 自主可控優(yōu)勢

沐曦實現(xiàn)了核心環(huán)節(jié)全流程自主研發(fā),并率先導(dǎo)入國產(chǎn)供應(yīng)鏈,是國內(nèi)少數(shù)幾家全面系統(tǒng)掌握了GPU架構(gòu)、 GPU IP、先進制程GPU芯片及其基礎(chǔ)系統(tǒng)軟件研發(fā)、設(shè)計和量產(chǎn)等全流程核心技術(shù)的企業(yè)之一。

沐曦是國內(nèi)少數(shù)堅持“從零到一”自主研發(fā)核心GPU IP的芯片設(shè)計企業(yè),已形成了全面覆蓋計算(AI訓(xùn)練、推理、通用計算)和渲染場景的核心GPU IP,打造了由超過600條(XCORE1.0計算GPU、 XCORE 1.5計算GPU)、800條(XCORE2.0 渲染GPU)指令組成自主安全可控的MXMACA指令集。

制造工藝方面,沐曦較早啟動了國產(chǎn)供應(yīng)鏈布局,與國內(nèi)晶圓廠、封測廠、EDA/IP等廠商技術(shù)合作與攻關(guān),提早規(guī)劃、設(shè)計、導(dǎo)入了基于國產(chǎn)供應(yīng)鏈的產(chǎn)品,并率先完成了生產(chǎn)落地,能夠確保后續(xù)產(chǎn)品高質(zhì)量及可持續(xù)的供應(yīng)與交付。

首款國產(chǎn)供應(yīng)鏈產(chǎn)品曦云C600已完成回片點亮并正式發(fā)布,性能測試結(jié)果及市場反響良好。沐曦預(yù)計該產(chǎn)品未來將在信創(chuàng)市場實現(xiàn)規(guī)?;瘧?yīng)用,同時也已受到多家互聯(lián)網(wǎng)企業(yè)的高度關(guān)注。

④ 持續(xù)創(chuàng)新優(yōu)勢

沐曦成為國內(nèi)首批FP8、FP4等低精度數(shù)值格式和相關(guān)指令集引入后續(xù)迭代產(chǎn)品架構(gòu)的企業(yè),能有效支持以DeepSeek、階躍星辰、月之暗面等為代表的頭部大模型廠商的最新訓(xùn)練與推理需求。

報告期內(nèi),基于自主創(chuàng)新的DragonFly互連拓撲,沐曦已成功打造64卡光互連超節(jié)點產(chǎn)品3D-Mesh 64卡超節(jié)點產(chǎn)品等。

沐曦還實現(xiàn)了單機柜128卡超高密度部署,實測在千卡集群上執(zhí)行128B MoE大模型訓(xùn)練任務(wù)無故障時間超14天(訓(xùn)練任務(wù)按需結(jié)束),能夠支持千億參數(shù)大模型的訓(xùn)練、微調(diào)及高效推理。

此外,沐曦是全球少數(shù)幾家掌握了復(fù)雜多級緩存結(jié)構(gòu)的GPU企業(yè),顯存容量、顯存帶寬等性能參數(shù)在國內(nèi)同行業(yè)企業(yè)中均位居前列,也是全球較早研發(fā)超高帶寬顯存(UBM)控制器接口的企業(yè),將大幅提高GPU產(chǎn)品的帶寬和容量。

結(jié)語:國產(chǎn)AI芯片公司正迎來黃金發(fā)展期

國內(nèi)GPU產(chǎn)業(yè)起步較晚,沐曦雖已取得一定技術(shù)突破,但在硬件性能和軟件生態(tài)方面與英偉達仍存在一定差距,尚處于市場跟隨階段。

當前國際貿(mào)易新態(tài)勢促使國內(nèi)GPU市場需求缺口不斷擴大,亟待有競爭力的國產(chǎn)GPU來填補。各家國產(chǎn)AI芯片公司正在國內(nèi)積極布局發(fā)力,共同爭奪市場份額。

國產(chǎn)AI芯片廠商一方面要與國際巨頭的既有優(yōu)勢相抗衡,另一方面還要在國內(nèi)同行競爭中脫穎而出,需要投入大量資金用于提升技術(shù)水平、打造高性能產(chǎn)品、拓展銷售渠道以及構(gòu)建自身的生態(tài)體系等。