芯東西(公眾號(hào):aichip001)
作者 | ?ZeR0
編輯 | ?漠影
芯東西1月22日?qǐng)?bào)道,今日,浙江杭州GPU芯片公司曦望(Sunrise)正式宣布,一年內(nèi)已完成近30億元融資,將用于下一代推理GPU研發(fā)、規(guī)?;慨a(chǎn)及生態(tài)共建。
該公司匯聚了三一集團(tuán)旗下華胥基金、范式智能、杭州數(shù)據(jù)集團(tuán)、正大機(jī)器人、協(xié)鑫科技等產(chǎn)業(yè)投資方,以及IDG資本、高榕創(chuàng)投、無(wú)極資本、中金資本、普華資本、松禾資本、易方達(dá)資本、工銀投資、心資本等知名VC/PE機(jī)構(gòu),并獲得誠(chéng)通混改基金等國(guó)資背景資本加持。
曦望成立于2020年,前身是商湯科技大芯片部門,目前團(tuán)隊(duì)約300人,主要來(lái)自于NVIDIA、AMD、昆侖芯、商湯等企業(yè),核心技術(shù)骨干平均擁有15年行業(yè)經(jīng)驗(yàn)。
曦望聯(lián)席CEO王勇是前AMD、昆侖芯核心架構(gòu)師,擁有20年芯片研發(fā)經(jīng)驗(yàn),2020年加入商湯后,帶領(lǐng)百人團(tuán)隊(duì)成功主導(dǎo)了曦望兩代芯片的研發(fā)和量產(chǎn)。
另一位聯(lián)席CEO王湛則是百度創(chuàng)始團(tuán)隊(duì)成員、原集團(tuán)副總裁,曾帶領(lǐng)百度搜索8000人團(tuán)隊(duì),2025年初加入曦望,負(fù)責(zé)公司產(chǎn)品化和商業(yè)化。
王湛稱,曦望的目標(biāo)是極致降低大模型推理成本與門檻,讓算力變得普惠且可廣泛獲取。
據(jù)悉,曦望選擇了差異化的技術(shù)路徑,摒棄了傳統(tǒng)訓(xùn)推一體GPU為訓(xùn)練優(yōu)化的設(shè)計(jì)思路,聚焦推理場(chǎng)景進(jìn)行原生架構(gòu)重構(gòu)——在調(diào)度、緩存、片上SRAM、互聯(lián)及編譯器路徑上做深度優(yōu)化,結(jié)合LPDDR內(nèi)存技術(shù),從根源降低單位Token推理成本。
同時(shí),該公司擁有全棧自研指令集、GPGPU IP及編譯工具鏈,手握200余項(xiàng)核心專利,具備百人團(tuán)隊(duì)“一次流片成功”的經(jīng)歷。
公開(kāi)信息顯示,曦望數(shù)年投入20億元研發(fā),已形成三代芯片產(chǎn)品矩陣,覆蓋從視覺(jué)推理到大模型全場(chǎng)景推理的需求。
其2026年即將推出的S3芯片,主打高推理性價(jià)比,在單位Token成本、能耗上實(shí)現(xiàn)數(shù)量級(jí)降低,原生支持FP8/FP4低精度推理,目標(biāo)直指“百萬(wàn)Token一分錢”的行業(yè)新基準(zhǔn)。
之前,曦望在2020年量產(chǎn)的S1視覺(jué)推理芯片,適配千余種CV模型,已實(shí)現(xiàn)IP授權(quán)索尼、小米等頭部客戶。
2024年量產(chǎn)的S2芯片,對(duì)標(biāo)主流A/H系列GPU,兼容CUDA生態(tài),已成功適配DeepSeek、Qwen等主流模型。
在曦望看來(lái),對(duì)算力廠商、AI原生應(yīng)用開(kāi)發(fā)者而言,推理能效、SLA穩(wěn)定性與Token成本,才是決定業(yè)務(wù)毛利率與用戶體驗(yàn)的核心指標(biāo)。
因此,曦望選擇聚焦真實(shí)場(chǎng)景的單位經(jīng)濟(jì)性,成為現(xiàn)有算力系統(tǒng)的 “推理分流與成本優(yōu)化層”,與本土芯片廠商合作為客戶構(gòu)建推理加速專區(qū),形成獨(dú)特的競(jìng)爭(zhēng)生態(tài)。