亚洲美女黄色片免费,欧美一二区免费乱码视频,亚洲熟女乱色一区二区三区视频

芯東西（公眾號：aichip001）
作者 | ?ZeR0
編輯 | ?漠影

芯東西1月28日報道，1月27日，浙江杭州GPU創(chuàng)企曦望（Sunrise）披露未來三年產(chǎn)品路線圖，發(fā)布新一代推理GPU芯片啟望S3，并推出面向大模型推理的寰望SC3超節(jié)點方案及推理云計劃。

啟望S3支持從FP16到FP4的多精度靈活切換，是國內(nèi)首款采用LPDDR6顯存方案的GPGPU芯片，號稱取得了相比上一代“10倍以上”的推理性價比提升。

根據(jù)曦望“量產(chǎn)一代、發(fā)布一代、預(yù)研一代”的節(jié)奏規(guī)劃，高性價比推理GPU芯片啟望S3今年上市，高性能推理GPU芯片啟望S4將于2027年上市，安全可控推理GPU芯片啟望S5將于2028年上市。

過去8年，曦望研發(fā)投入累計達20億元，成功量產(chǎn)了S1和S2，今天發(fā)布S3，目標將中國的推理成本拉到“百萬token一分錢”的新水平。

除了啟望S3芯片及超節(jié)點產(chǎn)品之外，S3的產(chǎn)品矩陣還包括智望系列PCIe計算卡和OAM計算模塊、辰望系列PCIe服務(wù)器以及OAM服務(wù)器、寰望系列AI計算集群、熙望系列AI PC或AI液冷工作站。

一、脫胎商湯大芯片部門，IP授權(quán)索尼小米，去年完成約30億元戰(zhàn)略融資

曦望成立于2020年5月，前身是商湯科技大芯片部門，團隊超過300人，主要來自英偉達、AMD、昆侖芯、商湯等企業(yè)，核心技術(shù)骨干平均有15年的行業(yè)經(jīng)驗。

“我們是一家更懂AI的GPU芯片公司，而且是國內(nèi)第一家All in推理的GPU芯片公司?！标赝麻L徐冰說。

曦望的使命是把大模型推理做到極致，要讓AI推理真正變得便宜穩(wěn)定，而且隨處可用。

負責研發(fā)的曦望聯(lián)席CEO王勇，是前AMD、昆侖芯的核心架構(gòu)師，有20年芯片研發(fā)經(jīng)驗。2020年加入商湯后，他帶領(lǐng)百人團隊主導了曦望兩代芯片的研發(fā)和量產(chǎn)，均實現(xiàn)一次性成功點亮。

另一位聯(lián)席CEO王湛，是百度創(chuàng)始團隊成員、原集團副總裁，曾帶領(lǐng)百度搜索8000人團隊，有豐富的產(chǎn)品化經(jīng)驗及商業(yè)化的操盤經(jīng)驗，2025年初加入了曦望，負責產(chǎn)品化及商業(yè)化，同時牽頭打造更有戰(zhàn)斗力的組織文化。

過去一年，曦望累計完成了約30億元戰(zhàn)略融資，股東既有商湯、三一、杭州數(shù)據(jù)集團、范式、正大等行業(yè)龍頭，又有多家國資平臺及頂尖風投機構(gòu)。

2025年，曦望推理GPU芯片交付量已突破1萬片，收入大幅增長，拿下多個頭部客戶的訂單。

“我們拒絕做跑分黨，不希望用benchmark來定義芯片，而是希望能夠做到幫客戶賺錢的算力。”王勇說。

王勇談道，曦望擁有全棧資源的GPGPU架構(gòu)，覆蓋從自研指令集、GPGPU IP、SoC到硬件系統(tǒng)，更早提出了用大容量DDR來替代HBM、用高性價比的大模型推理芯片來替代訓推一體芯片的概念，在戰(zhàn)略上率先All in推理GPU市場。

其團隊從2018年開始研發(fā)第一代啟望S1視覺推理芯片，2020年實現(xiàn)上萬片量產(chǎn)。S1已實現(xiàn)IP授權(quán)給索尼和小米，分別用在索尼AI攝像頭及小米手機上。

2020年，曦望開始打造高性能GPGPU芯片啟望S2，對標當時的國際巨頭旗艦GPU。S2在2021年流片，在2023年實現(xiàn)產(chǎn)品化，在DeepSeek滿血版適配上達到了國際巨頭80%的推理性能，在國內(nèi)處于第一梯隊。

同時，曦望在軟件棧上做到了95%的CUDA兼容，基本上能做到客戶的推理業(yè)務(wù)無縫遷移。

據(jù)王勇透露，曦望已積累很多典型客戶，比如適配了商湯全系列小浣熊模型，與中國電子旗下長城集團一起打造了基于國產(chǎn)CPU+GPU的國產(chǎn)信創(chuàng)一體機，與范式、星凡星啟、玄武智能一起拓展更多的GPU垂直應(yīng)用等。

二、啟望S3：支持FP4、采用LPDDR6，單位token推理成本減少90%

徐冰說，為實現(xiàn)極致的成本效益，曦望拋棄了傳統(tǒng)訓推一體GPU為訓練準備的冗余設(shè)計，不追求峰值TFLOPS這種紙面數(shù)據(jù)，把真實業(yè)務(wù)場景中每個token的成本、能耗以及SLA穩(wěn)定性作為所有設(shè)計決策的根本出發(fā)點。

他強調(diào)，這三大指標直接決定了最終的業(yè)務(wù)毛利率，直接影響了終端客戶群體的用戶體驗。

據(jù)王勇分享，曦望S3針對大模型做了極致的性能優(yōu)化，取得了10倍以上的推理性價比提升，力爭在這一代產(chǎn)品的整個生命周期里形成百億級收入。

S3是一款面向大模型推理深度定制的GPGPU芯片。其單芯片推理性能提升5倍，支持從FP16到FP8、FP6、FP4等多精度靈活切換，釋放低精度推理效率，這種設(shè)計更貼合當前MoE和長上下文模型在推理階段的需求。

其核心研發(fā)特點包括：

1、追求極致PPA。在架構(gòu)上，揚棄了一些訓練相關(guān)的貴重組件，采用了一些較新的、針對推理極致優(yōu)化的架構(gòu)和技術(shù)組件；在IP上，跟進最新GPU IP架構(gòu)，選用國際巨頭最先進的第三方高速接口IP。

2、采用目前合規(guī)的、最先進的國際工藝節(jié)點。

3、國內(nèi)首款采用LPDDR6的GPGPU推理芯片。曦望團隊做了很多架構(gòu)研究，發(fā)現(xiàn)LPDDR6才是當前推理的最優(yōu)解，相比LPDDR5帶寬提升1倍以上、容量大幅提升，致使啟望S3顯存容量較上一代訓推一體芯片提升4倍。

除了算力和訪存之外，曦望研究了大模型的本身特點，發(fā)現(xiàn)大模型有一個黃金的算力訪存比，并在啟望S3上遵循這一原則，達到算力訪存比的“甜點”，不浪費一分算力和帶寬。

在DeepSeek V3/R1滿血版等主流大模型推理場景中，S3的單位token推理成本較上一代產(chǎn)品下降約90%。

三、寰宇SC3超節(jié)點方案：全液冷、256卡互聯(lián)，支持模塊化交付

圍繞S3，曦望同步發(fā)布了面向大模型推理的寰望SC3超節(jié)點解決方案，同樣追求極致性價比。

寰望SC3從一開始即面向千億、萬億級參數(shù)多模態(tài)MoE推理的真實部署需求進行設(shè)計，支持單域256卡一級互聯(lián)，可高效支撐PD分離架構(gòu)與大EP（Expert Parallelism）規(guī)模化部署，顯著提升推理階段的系統(tǒng)利用率與穩(wěn)定性，適配長上下文、多并發(fā)、多專家并行等復(fù)雜推理場景。

交付形態(tài)上，寰望SC3采用全液冷設(shè)計，具備極致PUE表現(xiàn)，支持模塊化交付與快速部署。

在大EP部署的情況下，其吞吐率相比非大EP部署可提高20~25倍，能取得非常好的推理效果。

王勇稱，在同等推理能力量級下，該方案可將整體系統(tǒng)交付成本從行業(yè)常見的億元級降低至千萬元級，實現(xiàn)1個數(shù)量級的下降。

曦望也在卡間互聯(lián)上做了較多工作，可做到16到256卡的超節(jié)點產(chǎn)品，將多個超節(jié)點通過直出的RDMA連接時，還能構(gòu)建千卡甚至幾千卡的互聯(lián)集群。

軟件方面，曦望構(gòu)建了與CUDA兼容的基礎(chǔ)軟件體系，覆蓋驅(qū)動、運行時API、開發(fā)工具鏈、算子庫和通信庫，降低推理應(yīng)用的遷移門檻。

該體系適配DeepSeek、通義千問、商湯日日新、騰訊混元3D等國內(nèi)外百余種大模型，已適配ModelScope平臺90%以上主流大模型形態(tài)。

四、推理云平臺：與合作伙伴共建，邁向“百萬token一分錢”

曦望圍繞芯片+系統(tǒng)+生態(tài)來做整體布局，一方面提供推理GPU卡標準的一體化的服務(wù)器，整機、集群方案，另一方面與商湯、范式等AI龍頭，以及各類算力廠商和芯片廠商深度合作，打造推理加速專區(qū)，讓推理服務(wù)可以長期、穩(wěn)定、可持續(xù)。

現(xiàn)場，曦望與商湯、范式宣布啟動共建“百萬Token一分錢”合作，并與杭鋼數(shù)字科技、浙江算力科技等本地算力平臺聯(lián)手，將推理基礎(chǔ)設(shè)施鋪到浙江，輻射全國。

與此同時，曦望與三一、協(xié)鑫、游族等十幾家生態(tài)伙伴集中簽約，曦望把極致推理真正嵌入到制造、能源、C端、機器人等具體場景。

后續(xù)，曦望還計劃開啟推理即服務(wù)的新模式。

曦望聯(lián)席CEO王湛談道，基于自研GPU和全棧優(yōu)化，曦望打造了新一代AI原生智算平臺。

（1）軟硬件深度協(xié)同：曦望GPU內(nèi)核、通信庫都是自研的，所以軟硬件協(xié)同能實現(xiàn)物理級優(yōu)化，可實現(xiàn)從底層芯片到上層平臺的全棧優(yōu)化。

曦望采用量化壓縮技術(shù)，使其既保持高精度算力的質(zhì)量，又能夠利用到低精度算力的效能，在實測中，精度損失極小，性能提升250%以上。

（2）資源極致彈性：通過云化的方式，采用GPU池化、動態(tài)擴縮容、智能負載預(yù)測等技術(shù)，實現(xiàn)算力資源的池化與按需供給。

（3）開箱即用：提供集成的模型市場開發(fā)工具，大幅降低技術(shù)門檻。

（4）穩(wěn)定可靠：平臺由專業(yè)人員維護，提供大量工具，具備高可用、安全隔離和智能運維的能力，有狀態(tài)遙測、健康度分析、自動部署、故障快速隔離4大特點。

基于該平臺，曦望商業(yè)模式進一步升級，將與合作伙伴共建推理云平臺，形成芯片和生態(tài)共建的雙輪驅(qū)動，使客戶能夠享有一體化、高效益、零門檻的算力服務(wù)。

通過GPU池化與彈性調(diào)度，曦望將底層算力整合為統(tǒng)一的推理算力池，并以MaaS（Model as a Service）作為核心入口，使企業(yè)無需關(guān)注底層硬件配置與集群運維，即可按需調(diào)用大模型推理能力。

這一體系也成為“百萬Token一分錢”推理成本合作的重要技術(shù)基礎(chǔ)。

在圓桌對話環(huán)節(jié)，王勇補充說，曦望設(shè)定的“百萬token一分錢”目標，將會在S3、S4及S5階段中逐步達成。

另據(jù)煒燁智算董事長兼CEO周韡韡分享，煒燁智算參與了曦望與中交的藍翼大模型的適配工作，經(jīng)測算，目前曦望每百萬token的價格約為人民幣0.57元，已經(jīng)非常有競爭力，相比之下市場上現(xiàn)有算力價格通常在人民幣7~14元之間。

綜上，曦望致力于提供高性價比、極致能效的綠色算力，其商業(yè)模式是芯片硬實力+云基建軟實力，形成“token as a service”，既提供公共的token服務(wù)，又提供定制化的token服務(wù)，還有混合token服務(wù)，以滿足不同客戶需求。

結(jié)語：讓算力用得上、用得好、用得起

會上，中國工程院院士、浙江大學信息學部主任吳漢明分享說，推理算力價值的實現(xiàn)離不開協(xié)同，需要芯片設(shè)計、系統(tǒng)集成、軟件開發(fā)到產(chǎn)業(yè)應(yīng)用的全鏈條協(xié)作。

徐冰認為，推理的戰(zhàn)略價值，決定的是國家和企業(yè)在AI下半場的競爭力，誰掌握高效、可控、可持續(xù)的推理基礎(chǔ)設(shè)施，誰就能主導AI的落地速度。

他談道，曦望致力于做好三件事：讓算力更便宜，讓部署更簡單，讓生態(tài)更開放。在推理時代，曦望要做讓算力變得便宜、穩(wěn)定、隨處可用的核心底座。

“我們堅信，隨著AI推理紅利全面釋放，曦望一定能走出一條中國企業(yè)自主發(fā)展推理GPU的特色之路，真正實現(xiàn)國產(chǎn)AI芯片從跟跑到差異化領(lǐng)跑的關(guān)鍵跨越?！毙毂f。

亚洲精品一区二区三区老狼,在线国产中文字幕视频网,国产毛片特级Av片,欧美日韩亚洲精品成人,美女视频一直看一直爽,亚洲人妻av一区二区在线观看,天天碰天天日天天摸,亚洲一级黄色片在线观看,麻豆av入口在线观看

一、脫胎商湯大芯片部門，IP授權(quán)索尼小米，去年完成約30億元戰(zhàn)略融資

二、啟望S3：支持FP4、采用LPDDR6，單位token推理成本減少90%

三、寰宇SC3超節(jié)點方案：全液冷、256卡互聯(lián)，支持模塊化交付

四、推理云平臺：與合作伙伴共建，邁向“百萬token一分錢”

結(jié)語：讓算力用得上、用得好、用得起

相關(guān)推薦

亚洲精品一区二区三区老狼,在线国产中文字幕视频网,国产毛片特级Av片,欧美日韩亚洲精品成人,美女视频一直看一直爽,亚洲人妻av一区二区在线观看,天天碰天天日天天摸,亚洲一级黄色片在线观看,麻豆av入口在线观看

一、脫胎商湯大芯片部門，IP授權(quán)索尼小米，去年完成約30億元戰(zhàn)略融資

二、啟望S3：支持FP4、采用LPDDR6，單位token推理成本減少90%

三、寰宇SC3超節(jié)點方案：全液冷、256卡互聯(lián)，支持模塊化交付

四、推理云平臺：與合作伙伴共建，邁向“百萬token一分錢”

結(jié)語：讓算力用得上、用得好、用得起

相關(guān)推薦

一、脫胎商湯大芯片部門，IP授權(quán)索尼小米，去年完成約30億元戰(zhàn)略融資

二、啟望S3：支持FP4、采用LPDDR6，單位token推理成本減少90%

三、寰宇SC3超節(jié)點方案：全液冷、256卡互聯(lián)，支持模塊化交付

四、推理云平臺：與合作伙伴共建，邁向“百萬token一分錢”

結(jié)語：讓算力用得上、用得好、用得起