芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西12月25日報道,今日,美國AI芯片獨角獸Groq宣布,Groq的聯(lián)合創(chuàng)始人Jonathan Ross、總裁Sunny Madra以及Groq團(tuán)隊的其他成員將加入英偉達(dá)。

Groq今日發(fā)文宣布,其與英偉達(dá)達(dá)成一項非獨家授權(quán)協(xié)議,授權(quán)英偉達(dá)使用Groq的推理技術(shù)。該協(xié)議體現(xiàn)了雙方共同致力于擴大高性能、低成本推理技術(shù)的應(yīng)用范圍。作為該協(xié)議的一部分,Groq團(tuán)隊成員將加入英偉達(dá),以幫助推進(jìn)和擴大授權(quán)技術(shù)的規(guī)模。

Groq將繼續(xù)作為一家獨立公司運營,Simon Edwards將擔(dān)任CEO。GroqCloud將繼續(xù)正常運營,不會中斷。

重磅!黃仁勛罕見出手,歐美AI芯片獨角獸集體謝幕

這篇公告未透露協(xié)議的具體價格。

另據(jù)外媒報道,Groq投資方之一Disruptive的CEO Alex Davis透露,英偉達(dá)已同意以200億美元(約合1402億元)現(xiàn)金收購Groq的資產(chǎn)。

需注意的是,英偉達(dá)并沒有收購Groq,只是付費獲得使用Groq技術(shù)的授權(quán)。

而為了協(xié)助英偉達(dá),Groq公司把CEO都換了。

外媒獲得的一封英偉達(dá)創(chuàng)始人兼CEO黃仁勛在發(fā)給員工的電子郵件寫道:“雖然我們正在吸納優(yōu)秀人才加入我們的團(tuán)隊,并獲得Groq的知識產(chǎn)權(quán)許可,但我們并沒有收購Groq這家公司?!?/p>

我們計劃將Groq的低延遲處理器集成到英偉達(dá)AI工廠架構(gòu)中,擴展該平臺以服務(wù)于更廣泛的AI推理和實時工作負(fù)載。”黃仁勛稱,這一協(xié)議將擴大英偉達(dá)的能力。

重磅!黃仁勛罕見出手,歐美AI芯片獨角獸集體謝幕

有趣的是,Groq創(chuàng)始人兼CEO?Jonathan Ross曾是谷歌TPU創(chuàng)始成員。在谷歌成功利用其TPU芯片進(jìn)行AI訓(xùn)練及推理后,將Ross等Groq成員收入麾下,似乎是英偉達(dá)敞開懷抱、擁抱專用AI芯片的一次高效行動。

AI推理芯片的技術(shù)路線趨于多樣化。相比強但貴的GPU,專用AI推理芯片具備其經(jīng)濟(jì)合理性??磥恚ミ_(dá)并不打算把雞蛋都放在GPU這一個籃子里,而是不斷拓寬自身的技術(shù)與生態(tài)半徑。

令人唏噓的是,當(dāng)年盛極一時的“歐美AI芯片四小龍”已各奔東西:Graphcore被軟銀收購,Cerebras撤回上市申請,SambaNova被曝談判賣身英特爾,Groq聯(lián)合創(chuàng)始人及高管加入英偉達(dá)。

這似乎反映出在歐美市場,AI芯片作為獨立創(chuàng)業(yè)形態(tài)的階段性終結(jié)。

而中國AI芯片產(chǎn)業(yè)正呈現(xiàn)一片繁榮的景象,前有寒武紀(jì)、摩爾線程、沐曦股份穩(wěn)居科創(chuàng)板市值榜前四,后有壁仞科技、天數(shù)智芯等急追猛趕,即將登陸港交所。還有更多中國AI芯片企業(yè)在趕考IPO的路上加快腳步。

AI芯片創(chuàng)業(yè)何其顛沛,時也,運也。

一、Groq預(yù)計今年營收35億,聯(lián)創(chuàng)發(fā)文感慨結(jié)束十年篇章

Groq由一群前工程師于2016年創(chuàng)立,主要研發(fā)云端AI推理芯片。

這家創(chuàng)企在今年9月完成了7.5億美元(約合人民幣53億元)的融資,估值達(dá)到69億美元(約合人民幣484億元),當(dāng)時計劃利用這筆資金擴大其數(shù)據(jù)中心容量。

該輪融資的投資者包括貝萊德、紐伯格伯曼、三星、思科,以及Altimeter和1789 Capital。美國總統(tǒng)唐納德·特朗普的大兒子小唐納德·特朗普是1789 Capital的合伙人。

Groq已大幅下調(diào)向投資者提供的業(yè)績預(yù)期,將其預(yù)計的2025年營收從20億美元(約合人民幣140億元)大幅削減至5億美元(約合人民幣35億元),下調(diào)超過15億美元(約合人民幣105億元)

財務(wù)文件顯示,Groq去年的收入為9000萬美元(約合人民幣6億元)。該公司告知投資者,其2026年收入將增至近12億美元(約合人民幣84億元),到2027年將超過19億美元(約合人民幣133億元)

Groq聯(lián)合創(chuàng)始人Chamath Palihapitiya在社交平臺X上曬圖感慨,當(dāng)年Jonathan Ross說服他挑戰(zhàn)巨頭,打造新型芯片,而AI時代即將到來。他們當(dāng)時沒有公司,只有1份投資意向書和3個人,接下來的1個月盡可能多地從谷歌威斯康星分部招募TPU團(tuán)隊的成員。

之后,這家公司經(jīng)歷了各種考驗和磨難,包括將Ross從CTO升職為CEO,以及Ross和Palihapitiya之間不可避免的矛盾和修復(fù)關(guān)系。

“今天,我們結(jié)束了這段近十年的篇章,Jonathan將與英偉達(dá)開啟新的篇章。”Palihapitiya寫道。

他稱贊說:“Jonathan不僅是谷歌時期TPU的締造者,更是一位技術(shù)天才,其成就堪稱史詩級。他還組建了一支強大的團(tuán)隊,有Sunny Madra和Gavin Sherry這樣的人才為他提供支持。他們在英偉達(dá)也會創(chuàng)造輝煌。”

重磅!黃仁勛罕見出手,歐美AI芯片獨角獸集體謝幕

二、比技術(shù)授權(quán)更值得關(guān)注的,是Groq的芯片設(shè)計思路

Groq研發(fā)的定制AI推理芯片LPU,聲稱能以比GPU更快的速度運行大語言模型及其他前沿模型,并在架構(gòu)層面能效可比GPU最高提升10倍。Groq當(dāng)前的芯片組采用格芯14nm工藝制造,并向4nm工藝邁進(jìn)。

英偉達(dá)看中的,不止是Groq的芯片,而是其背后的前沿技術(shù)理念和資產(chǎn)。

LPU有四大核心設(shè)計原則:軟件優(yōu)先、可編程流式架構(gòu)、確定性計算和網(wǎng)絡(luò)、片上存儲器。

(1)軟件優(yōu)先:目標(biāo)是簡化軟件開發(fā)人員最大化硬件利用率的工作,并將盡可能多的控制權(quán)交到開發(fā)人員手中。遵循這一理念,Groq在完成編譯器架構(gòu)設(shè)計后,才開始做芯片設(shè)計。

(2)可編程流式架構(gòu):支持芯片內(nèi)部及芯片間的流水線式流程。擁有充足的芯片間帶寬,使數(shù)據(jù)傳送帶能夠在芯片間像在芯片內(nèi)部一樣流暢高效地傳輸,無需等待計算或內(nèi)存資源。

重磅!黃仁勛罕見出手,歐美AI芯片獨角獸集體謝幕

▲基于LPU的系統(tǒng)

對比之下,GPU采用多核“中心輻射式”架構(gòu),其低效的數(shù)據(jù)分頁機制在芯片內(nèi)和芯片間的計算單元和內(nèi)存單元之間來回傳輸數(shù)據(jù),需要大量的開銷。

此外,GPU還需要利用機架內(nèi)部和機架之間的多層外部交換機和網(wǎng)絡(luò)芯片進(jìn)行通信,這進(jìn)一步加劇了軟件調(diào)度的復(fù)雜性。

(3)確定性計算和網(wǎng)絡(luò):LPU架構(gòu)是確定性的,這意味著每個執(zhí)行步驟都可以精確到最小執(zhí)行周期(也稱為時鐘周期)。LPU數(shù)據(jù)傳送帶也在芯片間運行,因此連接芯片會形成更大的可編程流水線,數(shù)據(jù)流由軟件在編譯期間靜態(tài)調(diào)度,且每次程序運行時都以相同的方式執(zhí)行。

(4)片上存儲器:LPU將內(nèi)存和計算功能集成在芯片上,大幅提升了數(shù)據(jù)存儲和檢索速度,同時消除了時序波動。其片上SRAM的內(nèi)存帶寬高達(dá)80TB/s以上,而GPU片外HBM的帶寬約為8TB/s。僅此一項差異就使LPU的速度提升高達(dá)10倍,再加上LPU無需往返于單獨的內(nèi)存芯片來檢索數(shù)據(jù),這進(jìn)一步提升了其性能。

分析師Max Weinbach在社交平臺X上評價說:“SRAM的速度是HBM的10倍,而HBM需要臺積電的CoWoS封裝,這是一個很大的瓶頸,而且成本極其昂貴。如果能夠繞過對HBM和CoWoS的需求,芯片印制速度就會更快。如果板載集成NVLink C2C,LPU的擴展能力將遠(yuǎn)超Groq現(xiàn)在能做到的?!?/p>

“這樣就無需使用美光/三星/海力士的產(chǎn)品,消除了許多內(nèi)存瓶頸,也解決了CoWoS帶來的臺積電瓶頸問題。這對英特爾來說也是好事,因為他們在18A和18A-PT上都有相當(dāng)不錯的SRAM位單元?!彼麑懙馈?/p>

三、非典型收購:挖創(chuàng)始人和核心團(tuán)隊,拿技術(shù)授權(quán)

把創(chuàng)始人和部分員工收入麾下,英偉達(dá)這操作是不是看起來有點眼熟?

據(jù)外媒此前報道,英偉達(dá)在9月份促成了一筆類似但規(guī)模較小的交易,斥資超過9億美元(約合人民幣63億元)聘請了這家AI硬件初創(chuàng)公司Enfabrica的CEO Rochan Sankar及其他員工,并獲得了該公司的技術(shù)許可。

在硅谷,重金挖人才和拿技術(shù)授權(quán)的“變相收購”,已成為科技巨頭吸納頂尖人才和技術(shù)的重要手段。

過去兩年,亞馬遜、Meta、谷歌、微軟等科技巨頭也曾通過各種類型的許可協(xié)議,聘請頂尖人才。

例如去年3月,微軟挖走AI聊天機器人初創(chuàng)公司Inflection AI的聯(lián)合創(chuàng)始人Mustafa Suleyman、Karén Simonyan及其他員工。

去年6月,亞馬遜聘請了AI初創(chuàng)公司Adept的幾位聯(lián)合創(chuàng)始人,并達(dá)成了對Adept技術(shù)的非獨家授權(quán)協(xié)議,約1/3的Adept員工隨之加入亞馬遜。

去年8月,AI陪伴應(yīng)用創(chuàng)企Character.AI的兩位聯(lián)合創(chuàng)始人以及核心技術(shù)團(tuán)隊被谷歌以27億美元(約合人民幣189億元)的收購協(xié)議挖走。

同月,亞馬遜宣布聘請美國高級倉庫機器人系統(tǒng)創(chuàng)企Covariant的三位聯(lián)合創(chuàng)始人,并獲得該公司AI模型的非獨占許可。

今年6月,Meta斥資近150億美元收購AI數(shù)據(jù)標(biāo)注初創(chuàng)公司Scale AI 49%股權(quán),Scale AI聯(lián)合創(chuàng)始人兼CEO Alexandr Wang(汪滔)加入Meta,Scale AI仍保持獨立運營。

同月,AMD宣布與加拿大AI芯片創(chuàng)企Untether AI達(dá)成協(xié)議,將Untether AI整個AI硬件與軟件工程團(tuán)隊吸納到AMD內(nèi)部。

今年7月,谷歌斥資24億美元(約合人民幣168億元),挖走AI代碼生成初創(chuàng)公司W(wǎng)indsurf的CEO Varun Mohan、聯(lián)合創(chuàng)始人Douglas Chen以及部分研發(fā)成員,并將支付24億美元(約合人民幣172.2億元)作為選擇Windsurf技術(shù)的非獨家許可。

如今,這個“不是收購,勝似收購”的操作名單,又添上了一家巨頭的名字——英偉達(dá)。

四、被曝交易金額高達(dá)1400億,英偉達(dá)“撒錢”已形成巨大AI生態(tài)網(wǎng)絡(luò)

Groq和黃仁勛都強調(diào)了最新達(dá)成的協(xié)議不是收購。不過Groq投資方曝出的“200億美元”交易數(shù)據(jù)也可參考,這一數(shù)據(jù)并未得到交易任何一方的確認(rèn)。

據(jù)外媒報道,Groq投資方之一Disruptive的CEO Alex Davis透露,英偉達(dá)已同意以200億美元(約合1402億元)現(xiàn)金收購高性能AI加速芯片設(shè)計商Groq的資產(chǎn)。

他透露說,自Groq于2016年成立以來,他的公司已向Groq投資超過5億美元。Davis稱,在英偉達(dá)接洽之前,Groq并沒有尋求出售。

如果真有200億美元這么一回事,這將是英偉達(dá)迄今罕見的大手筆交易。

此前英偉達(dá)最大的一筆收購發(fā)生在2019年,當(dāng)時它以69億美元(約合人民幣484億元)的價格收購了以色列網(wǎng)絡(luò)芯片設(shè)計公司Mellanox。

截至今年10月底,英偉達(dá)擁有606億美元(約合人民幣4250億元)的現(xiàn)金和短期投資,高于2023年初的133億美元(約合人民幣933億元)。

隨著現(xiàn)金儲備增加,英偉達(dá)持續(xù)加大對芯片初創(chuàng)公司和更廣泛生態(tài)系統(tǒng)的投資。

今年其投資網(wǎng)絡(luò)愈發(fā)錯綜復(fù)雜,不僅涵蓋OpenAI、xAI、Mistral AI、TML、Perplexity、Cohere等AI獨角獸,Crusoe、CoreWeave、Lambda、Together AI等AI基礎(chǔ)設(shè)施公司,還有英特爾等芯片巨頭。(黃仁勛“撒錢”創(chuàng)紀(jì)錄!英偉達(dá)超級AI帝國崛起,但沒帶中國玩

五、歐美AI芯片四小龍命運各異,AI推理芯片收購潮正在升溫

Groq并不是唯一一家在AI熱潮中獲得關(guān)注的芯片初創(chuàng)公司。

去年7月,英國AI芯片獨角獸Graphcore被日本軟銀集團(tuán)收購。

據(jù)外媒今年6月報道,美國AI視覺感知芯片龍頭安霸半導(dǎo)體(Ambarella)正在考慮包括潛在出售在內(nèi)的多種選擇。

美國AI芯片獨角獸Cerebras Systems于2024年底提交了IPO申請,原計劃今年上市,但在今年10月宣布完成一輪約11億美元(約合人民幣77億元)融資、估值約81億美元(約合人民幣568億元)后,撤回了其IPO申請。

今年11月,據(jù)外媒報道,英特爾正在就收購美國AI芯片獨角獸SambaNova進(jìn)行初步談判,商討收購條款。SambaNova巔峰時期估值達(dá)到50億美元(約合人民幣350億元),但這家創(chuàng)企如今可能會面臨估值大幅削減的境地。

在歐美市場,AI算力需求高度集中于極少數(shù)客戶,科技大廠又均有自研AI芯片布局,余下的市場規(guī)模難以撐起AI芯片獨立上市的敘事。這些AI芯片創(chuàng)企的產(chǎn)品進(jìn)入可用但難以獨立規(guī)?;拇翱谄冢x擇被收購也是合乎邏輯之舉。

與此同時,大公司對芯片創(chuàng)企的收購正在升溫:今年2月,恩智浦宣布以3.07億美元(約合人民幣22億元)收購美國邊緣AI芯片創(chuàng)企Kinara,Meta被曝計劃收購韓國AI芯片創(chuàng)企FuriosaAI;6月,AMD宣布收購加拿大AI芯片創(chuàng)企Untether AI的員工團(tuán)隊;10月,Meta被曝計劃收購美國AI推理芯片創(chuàng)企Rivos……

這些交易的共性就是對AI推理芯片的青睞。

過去兩年,AI芯片競爭從算力敘事轉(zhuǎn)向可部署、可交付、可控成本的工程問題,推理規(guī)模持續(xù)爆發(fā)式增長,幾乎所有大廠都必須關(guān)心“每token成本”。

這些趨勢直接推動大公司出手收購,吸收多元技術(shù)思路和人才,補齊自身能力拼圖。

結(jié)語:AI推理將成為AI商用主陣地

經(jīng)過多年發(fā)展,當(dāng)前被視作“顛覆者”的AI芯片創(chuàng)企們,紛紛迎來了如何長期生存的現(xiàn)實大考:上市、被收購,或者想辦法拿到能持續(xù)兌現(xiàn)增長的超級客戶訂單。

如今AI芯片競爭正在進(jìn)入系統(tǒng)效率與軟件協(xié)同競爭的階段,真正的壁壘不再只是晶體管和算力,而是包括編譯層、軟件調(diào)度邏輯和開發(fā)者心智。

已經(jīng)在數(shù)據(jù)中心占據(jù)主導(dǎo)地位的英偉達(dá),一直是構(gòu)建這些壁壘的高手。

通過將新型LPU技術(shù)融入其龐大的產(chǎn)品矩陣,英偉達(dá)展現(xiàn)出靈活應(yīng)變、不斷補充血液的一貫策略。

隨著科技大廠自主研發(fā)的底層硬件增多,整個行業(yè)都在競逐構(gòu)建更強的計算基礎(chǔ)設(shè)施,AI推理將成為AI商用的主要算力消耗和利潤壓力來源。

前瞻嗅覺敏銳的英偉達(dá),長期在構(gòu)建一個更完備的AI計算產(chǎn)品“軍火庫”,提前把可能有利于加速AI產(chǎn)業(yè)發(fā)展的各種技術(shù)方向納入自身的能力池。這種對風(fēng)向的預(yù)判、對生態(tài)的控盤能力,才是英偉達(dá)最難以被復(fù)制的地方。