芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西1月2日報(bào)道,剛剛,上海GPU龍頭企業(yè)壁仞科技在港交所掛牌上市,成為港股“國產(chǎn)GPU第一股”,也是2026年港股市場首只上市新股。

其發(fā)行價(jià)為每股19.60港元(約合人民幣17.60元),開盤價(jià)上漲82.14%至每股35.70港元(約合人民幣32.05元),市值為855.42億港元(約合人民幣768億元)。

截至9點(diǎn)35分,壁仞科技股價(jià)為每股41.80港元(約合人民幣37.52元),最新市值為1002億港元(約合人民幣899億元)。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

這家創(chuàng)立于2019年的國產(chǎn)AI芯片代表公司,在2022年收入為49.9萬元,2024年增至3.37億元,年復(fù)合增長率達(dá)2500%。截至2025年12月15日,其在手銷售訂單約12.41億元,將轉(zhuǎn)化為未來收入。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

▲2022年~2024年壁仞科技營收、經(jīng)調(diào)整凈利潤、研發(fā)支出變化(芯東西制圖)

這些數(shù)字對應(yīng)的,是一家中國AI芯片公司持續(xù)投入、持續(xù)交付、持續(xù)增收的狀態(tài)。

在國內(nèi)AI芯片賽道,壁仞科技取得了許多技術(shù)實(shí)績:是中國首家采用2.5D芯粒(Chiplet)技術(shù)封裝雙AI計(jì)算裸晶的公司,在業(yè)內(nèi)率先支持先進(jìn)互連規(guī)范,產(chǎn)品支持DeepSeek、Qwen、Llama等主流開源大模型,在萬億參數(shù)大語言模型和多模態(tài)模型訓(xùn)練及推理等重點(diǎn)場景下展現(xiàn)了技術(shù)成熟度。

其代表性投資方,有上海國投先導(dǎo)基金、上海人工智能產(chǎn)業(yè)投資基金、廣州產(chǎn)投、知識城集團(tuán)等國資平臺,啟明創(chuàng)投、華登、高瓴創(chuàng)投等創(chuàng)新科技及半導(dǎo)體投資基金,以及平安集團(tuán)、珠海格力等產(chǎn)業(yè)投資方。

基于自研GPGPU架構(gòu),壁仞科技完成了從芯片設(shè)計(jì)、軟件平臺到系統(tǒng)級交付的閉環(huán),正在跑通一條可持續(xù)的自主高端算力路線。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

一、研發(fā)占比高達(dá)83%,發(fā)明專利申請數(shù)為中國GPGPU公司第一

在GPU行業(yè),高研發(fā)占比并不少見。

壁仞科技的一個(gè)財(cái)報(bào)亮點(diǎn)是“三高”:研發(fā)人員比例高達(dá)83%,研發(fā)費(fèi)用占比超過70%,發(fā)明專利申請數(shù)量在國內(nèi)GPGPU公司中排名第一。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

截至2025年12月15日,壁仞科技在全球多個(gè)國家和地區(qū)累計(jì)申請專利1500余項(xiàng),位列中國GPGPU公司第一;獲得專利授權(quán)600余項(xiàng),位列中國GPGPU公司前列;發(fā)明專利授權(quán)率達(dá)100%,位列國內(nèi)企業(yè)發(fā)明專利授權(quán)率榜首。

這為其長期發(fā)展壘起了一面堅(jiān)固的專利墻。

相比ASIC、FPGA等路線,GPGPU具有更高的通用性和靈活性,占據(jù)AI芯片主流市場。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

為了提升AI計(jì)算速度,GPGPU引入了專門硬件單元,并持續(xù)升級內(nèi)存大小、帶寬、互連、通用靈活性及能效。

壁仞科技則是中國首批在商業(yè)化產(chǎn)品中使用PCIe 5.0、CXL、高性能DRAM、雙裸晶芯粒(Chiplet)等設(shè)計(jì)的GPGPU公司之一,同時(shí)亦專注于3D堆疊技術(shù)、CPO(共封裝光學(xué))等先進(jìn)技術(shù)的研發(fā),以增強(qiáng)AI計(jì)算系統(tǒng)性能及可擴(kuò)展性,降低大模型訓(xùn)練及部署成本。

該公司是首家也是唯一一家受邀在國際頂級芯片設(shè)計(jì)會(huì)議Hot Chips上發(fā)言的中國GPGPU公司,并且是中國最早實(shí)現(xiàn)千卡集群商用的GPGPU公司之一、中國首家在單一服務(wù)器中實(shí)現(xiàn)8塊GPU卡點(diǎn)對點(diǎn)全網(wǎng)狀拓?fù)涞腉PGPU公司,還兩度摘得世界人工智能大會(huì)最高榮譽(yù)SAIL獎(jiǎng)(卓越人工智能引領(lǐng)者獎(jiǎng))。

在MLPerf Inference 2.1的封閉組別競賽中語言處理模型BERT及圖像分類模型ResNet50成績方面,壁仞科技GPGPU芯片及搭載該芯片的服務(wù)器均獲得量產(chǎn)芯片組別中的第一名。

壁仞科技CTO洪洲負(fù)責(zé)監(jiān)督及制定產(chǎn)品技術(shù)發(fā)展方向,亦是壁仞科技GPGPU芯片的首席架構(gòu)師。

他在GPGPU的設(shè)計(jì)及工程方案有近30年經(jīng)驗(yàn),擁有北京大學(xué)理學(xué)學(xué)士學(xué)位、清華大學(xué)工程學(xué)碩士學(xué)位、美國紐約州立大學(xué)水牛城分校理學(xué)碩士學(xué)位,曾擔(dān)任S3工程總監(jiān)、英偉達(dá)主架構(gòu)師、S3 Graphics硬件架構(gòu)副總裁、華為美國研究中心Futurewei Technologies首席架構(gòu)師。

壁仞科技COO張凌嵐負(fù)責(zé)壁仞科技產(chǎn)品的項(xiàng)目管理及生產(chǎn)與質(zhì)量控制。

他在半導(dǎo)體行業(yè)擁有超過23年經(jīng)驗(yàn),擁有浙江大學(xué)電氣工程學(xué)士學(xué)位、美國南加州大學(xué)電機(jī)工程碩士學(xué)位、美國加州大學(xué)伯克利分校工商管理碩士學(xué)位,曾擔(dān)任AMD GPU SoC架構(gòu)師、三星電子美國研發(fā)中心高級研發(fā)經(jīng)理、Higon Austin R&D Center Corporation深度運(yùn)算副總裁。

在他們的帶領(lǐng)下,壁仞科技持續(xù)完善其智能計(jì)算整體解決方案的五大支柱:自研GPGPU架構(gòu)、SoC設(shè)計(jì)、硬件系統(tǒng)、軟件平臺、集群部署優(yōu)化。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

二、自研GPGPU架構(gòu)引入多項(xiàng)創(chuàng)新,下一代芯片將支持FP8、FP4精度

從架構(gòu)、封裝到系統(tǒng)設(shè)計(jì),壁仞科技的技術(shù)選擇始終圍繞一個(gè)前提展開:

在既定工藝條件下,算力還能如何繼續(xù)放大?

自2019年啟動(dòng)第一代GPGPU架構(gòu)研發(fā)以來,壁仞科技已推出BR106、BR166、BR110等多款芯片,覆蓋云端訓(xùn)練、云端推理、邊緣推理場景。

后續(xù),BR20X系列計(jì)劃在2026年商業(yè)化上市,將增強(qiáng)對FP8、FP4等數(shù)據(jù)格式的支持;BR30XBR31X系列計(jì)劃在2028年商業(yè)化上市。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

這些均基于壁仞科技自主研發(fā)的統(tǒng)一GPGPU架構(gòu)。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

▲壁仞科技GPGPU架構(gòu)設(shè)計(jì)

在制程條件受限的情況下,壁仞科技選擇通過“雙裸晶 + 2.5D封裝”來擴(kuò)展算力規(guī)模,探索出一條持續(xù)提升單卡性能的可行之路。

例如,通過共封裝2個(gè)BR106芯片裸晶4個(gè)DRAM,壁仞科技利用芯粒技術(shù)和裸晶間互連技術(shù),推出性能更高的BR166芯片產(chǎn)品,其性能達(dá)到BR106的2倍,兩顆裸晶之間的D2D雙向帶寬達(dá)896GB/s

壁仞科技在GPGPU架構(gòu)里加入了很多創(chuàng)新:

(1)通用靈活性及AI加速性均表現(xiàn)出色:使用經(jīng)典的單指令多線程(SIMT)架構(gòu),高效處理復(fù)雜的并行計(jì)算。

(2)先進(jìn)的張量核架構(gòu):專用張量引擎T-core采用特殊設(shè)計(jì),可大幅降低矩陣運(yùn)算過程中從DRAM中重復(fù)檢索數(shù)據(jù)的頻率,支持?jǐn)?shù)據(jù)循環(huán),降低AI矩陣計(jì)算的帶寬需求,從而大大提高能效及計(jì)算效率。

(3)帶組播的異步數(shù)據(jù)傳輸:組播技術(shù)允許從DRAM讀取一次數(shù)據(jù),然后同時(shí)將其提供給不同的計(jì)算內(nèi)核,可顯著提高大型矩陣計(jì)算速度,同時(shí)降低能耗。

(4)近內(nèi)存計(jì)算:芯片融合了NUMA、UMA、L2 Reduction等存儲(chǔ)技術(shù),能將數(shù)據(jù)自動(dòng)靠近計(jì)算核心存儲(chǔ),并通過L2實(shí)現(xiàn)歸約計(jì)算,減少從遠(yuǎn)程DRAM獲取數(shù)據(jù)的需要,從而提高數(shù)據(jù)檢索效率。

這些設(shè)計(jì)使其架構(gòu)能適應(yīng)不斷擴(kuò)展的模型規(guī)模、參數(shù)量與復(fù)雜度,提供高性能、通用靈活性、能效與可擴(kuò)展性,最終幫助客戶降低總擁有成本(TCO)。

三、不僅拼高性能,還要拼穩(wěn)定多元交付

要讓芯片運(yùn)行成功,離不開一套完備的SoC設(shè)計(jì)方法論。

壁仞科技在SoC架構(gòu)、內(nèi)存系統(tǒng)、多GPU互連、SoC測試、SoC設(shè)計(jì)流程及芯片封裝設(shè)計(jì)方面均有技術(shù)積累,亦是業(yè)內(nèi)支持先進(jìn)互連規(guī)格的領(lǐng)先者,目標(biāo)指向量產(chǎn)穩(wěn)定性和持續(xù)交付能力。

例如,壁仞科技SoC架構(gòu)可根據(jù)芯片的AI應(yīng)用場景及目標(biāo)細(xì)分市場,靈活配置不同數(shù)量具備各類異構(gòu)計(jì)算模塊的SPC核,并據(jù)此界定內(nèi)存系統(tǒng)及互連結(jié)構(gòu);內(nèi)存系統(tǒng)能提高AI應(yīng)用程序的有效帶寬訪問,并減少內(nèi)存訪問的延遲;多級分區(qū)技術(shù)和模塊復(fù)用技術(shù)在布局和布線方面簡化了復(fù)雜模塊的物理設(shè)計(jì),提高了芯片設(shè)計(jì)的規(guī)模。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

▲壁仞科技SPC結(jié)構(gòu)圖

在互連方面,自研BLink技術(shù)可實(shí)現(xiàn)GPU卡之間的連接,最大雙向數(shù)據(jù)傳輸速率高達(dá)每通道64GB/s,共4至8條通道;率先在中國推出商用GPU光互連技術(shù),推動(dòng)全光網(wǎng)絡(luò)及共封裝光學(xué)技術(shù)發(fā)展。

面向交付,壁仞科技提供PCIe(外圍組件高速互連)板卡、OAM(開放式加速器模組)、服務(wù)器等多種產(chǎn)品形態(tài),是中國首批成功開發(fā)、原型驗(yàn)證及量產(chǎn)高性能OAM及通用底板的GPGPU公司之一。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

PCIe適合需要平衡性能和成本的客戶,OAM適用于需要最高性能的客戶,服務(wù)器則是即用型算力。服務(wù)器可互連為超節(jié)點(diǎn),并進(jìn)一步擴(kuò)展為服務(wù)器集群。

其下一代產(chǎn)品會(huì)升級到700W風(fēng)冷1000W液冷,UBB可使用內(nèi)部P2P接口連接8張具有多種拓?fù)涞腛AM卡,還將設(shè)計(jì)更靈活、更強(qiáng)大的SerDes連接,以縱向擴(kuò)展系統(tǒng)。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

數(shù)據(jù)中心GPU最終落地拼得不是單卡性能,而是為集群擴(kuò)展性設(shè)計(jì),這也是芯片公司能否跨越商業(yè)化拐點(diǎn)的關(guān)鍵。

壁仞科技通過將自有的硬件系統(tǒng)及軟件平臺與合作伙伴提供的服務(wù)器、存儲(chǔ)及網(wǎng)絡(luò)設(shè)備等其他硬件基礎(chǔ)設(shè)施相集成,開發(fā)了大規(guī)模智能計(jì)算集群的全面解決方案。

四、為開發(fā)者兜底,軟件和集群才是真正的壁壘

算力系統(tǒng)的穩(wěn)定性,在實(shí)際落地中會(huì)被放大。對于一家GPU企業(yè),自研軟件平臺既是充分發(fā)揮計(jì)算及通信能力的關(guān)鍵,又是擴(kuò)大生態(tài)城池的基礎(chǔ)。

壁仞科技選擇的軟件路徑,是兼顧降低遷移成本與保留自主演進(jìn)空間。

剛剛,壁仞科技敲鐘上市!GPU在手訂單超12億,拿下多個(gè)國產(chǎn)第一

其自研計(jì)算軟件平臺BIRENSUPA提供編程接口、算法庫、訓(xùn)練與推理框架及完整工具鏈,并兼容第三方GPGPU計(jì)算軟件平臺,使遷移至壁仞科技GPGPU產(chǎn)品的成本顯著降低。

BIRENSUPA編程模型兼容業(yè)界主流GPGPU編程模型,自研GPGPU編譯器通過將高級代碼轉(zhuǎn)換為壁仞科技專有指令集來優(yōu)化資源利用率并提高效率,還有一系列自研庫,可加速不同應(yīng)用領(lǐng)域。

在模型層面,壁仞科技對DeepSeek、Qwen、Llama等主流開源模型進(jìn)行原生優(yōu)化,可簡化AI解決方案的開發(fā)與部署流程。其Model Zoo托管針對BIRENSUPA進(jìn)行原生優(yōu)化的AI模型,支持客戶部署預(yù)訓(xùn)練模型或根據(jù)參考實(shí)現(xiàn)開發(fā)自身模型。

同時(shí),壁仞科技正在與清華大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)、浙江大學(xué)等知名高校開展了超過30項(xiàng)聯(lián)合項(xiàng)目,持續(xù)培育本土GPU開發(fā)者生態(tài)。

在集群層面,壁仞科技BIRENCUBE集群管理平臺旨在管理廣泛的AI硬件基礎(chǔ)設(shè)施,將自有硬件、軟件與服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)備整合,形成端到端解決方案,能夠幫助客戶構(gòu)建包含成千上萬塊GPGPU芯片的GPU集群系統(tǒng)。

其智能計(jì)算集群解決方案在可靠性及性能、通用靈活性及兼容性上領(lǐng)先:

  • 千卡集群訓(xùn)練30天以上無中斷,5天以上無故障;
  • 業(yè)界首創(chuàng)三級異步檢查點(diǎn),提高可靠性,減少存取開銷;
  • 千卡集群5分鐘內(nèi)將千億參數(shù)模型恢復(fù)至最后檢查點(diǎn),速度行業(yè)領(lǐng)先;
  • 損失函數(shù)在多次連續(xù)訓(xùn)練后實(shí)現(xiàn)零誤差,并在1個(gè)月的訓(xùn)練周期后持續(xù)下降;
  • 支持主流大模型、性能領(lǐng)先、千卡集群線性加速比達(dá)到95%;
  • 大模型的自動(dòng)化并行優(yōu)化、具有業(yè)界首創(chuàng)的異步卸載以克服內(nèi)存瓶頸;
  • 全面的模型支持,與上下游合作伙伴共同構(gòu)建支持50余種大模型的生態(tài)系統(tǒng);
  • 開放生態(tài),兼容三類異構(gòu)軟件加速平臺;
  • 通過直連光互連、光電路交換等多種互連方式,支持具有高擴(kuò)展性及靈活拓?fù)浣Y(jié)構(gòu)的超節(jié)點(diǎn),可更高效地運(yùn)行大模型。

2024年,壁仞科技深化與戰(zhàn)略客戶的合作,贏得了商業(yè)化AIDC千卡GPU集群等里程碑項(xiàng)目,并將其GPGPU集群部署于5G新通話及其他應(yīng)用場景,與中國三大電信運(yùn)營商均建立合作伙伴關(guān)系,在大規(guī)模應(yīng)用場景中持續(xù)驗(yàn)證其可靠性與競爭力。

截至2025年6月22日,壁仞科技已服務(wù)9家財(cái)富中國500強(qiáng)企業(yè),其中有5家上榜財(cái)富世界500強(qiáng),已戰(zhàn)略性拓展AI數(shù)據(jù)中心、電信、AI解決方案、能源及公用事業(yè)、金融科技及互聯(lián)網(wǎng)等關(guān)鍵行業(yè)。

結(jié)語:國產(chǎn)GPU走向規(guī)模化落地

與國際巨頭相比,國產(chǎn)GPU在生態(tài)成熟度、開發(fā)者規(guī)模、軟件工具鏈成熟度等方面存在客觀差距,但隨著海外GPU供給不再穩(wěn)定,下游行業(yè)開始接受CUDA非唯一解,國產(chǎn)GPU也從可用走向可規(guī)?;?。

在資本市場中,真正同時(shí)具備GPGPU架構(gòu)、自研軟件平臺和系統(tǒng)級交付能力的公司并不多。壁仞科技在較早階段就將架構(gòu)、封裝、軟件、系統(tǒng)并行推進(jìn),這為其大規(guī)模集群和長期演進(jìn)奠定基礎(chǔ)。

相較于全球競爭對手,這些技術(shù)積累加上在中國的本地化專業(yè)知識及實(shí)地客戶支持能力,使壁仞科技能夠與重點(diǎn)行業(yè)的大型客戶建立戰(zhàn)略合作關(guān)系,深入理解并滿足獨(dú)特需求。

上市之后,市場看到的,將是這些工程選擇在更長周期內(nèi)的表現(xiàn)。