智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣

智東西8月26日報道,近日,谷歌母公司Alphabet風投部門CapitalG、英偉達正在洽談投資以色列AI基礎設施提供商VAST Data,融資金額或達到數(shù)十億美元,或將成為以色列科技公司史上最大規(guī)模融資。這家創(chuàng)企的估值將躍升至300億美元(折合人民幣約2148億元)。

這家被谷歌、英偉達爭著送錢的創(chuàng)企,到底什么來頭?

2016年成立的VAST Data已成為眾多大模型企業(yè)青睞的香餑餑,核心原因是傳統(tǒng)數(shù)據(jù)存儲架構無法滿足大模型訓練、推理的新需求,VAST Data面向AI時代推出了統(tǒng)一數(shù)據(jù)平臺,將結構化和非結構化數(shù)據(jù)集成在一起,讓AI處理數(shù)據(jù)能更高效、更便宜。

馬斯克旗下大模型創(chuàng)企xAI、獲英偉達39.6億美元投資的CoreWeave、全球頭部動畫公司迪士尼及其子公司皮克斯、美國電信巨頭威瑞森通信公司、視頻通話平臺Zoom等諸多全球知名企業(yè)都被這家創(chuàng)企列入客戶名單。

值得一提的是,其與諸多客戶簽訂的都是5~7年的長期合同,?隨之而來的就是年收入的爆炸式上漲。根據(jù)VAST Data官網(wǎng)的公開數(shù)據(jù),截至2025年1月31日年度,VAST Data營收同比增長3.6倍。這一營收增速甚至超過了英偉達和OpenAI。2025財年英偉達營收同比增長114%,此前據(jù)彭博社報道,OpenAI預計2025年收入將同比增長三倍至127億美元(折合人民幣約909億元)。

據(jù)路透社援引熟悉財務狀況的匿名消息人士報道,VAST?Data聯(lián)合創(chuàng)始人、CEO雷寧·哈拉克(Renen Hallak)曾提到,該公司已經(jīng)實現(xiàn)連續(xù)五年自由現(xiàn)金流為正。截至2025年1月,該公司ARR(年度經(jīng)常性收入)達到2億美元(折合人民幣約14.3億元),預計明年ARR將增長至6億美元(折合人民幣約43億元)

與此同時,這家創(chuàng)企還與被曝新融資的兩家“金主”關系匪淺,VAST Data將自家軟件平臺集成到了谷歌云上,英偉達創(chuàng)始人、CEO黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX等國際大會上多次為VAST Data送好評,稱其是大規(guī)模AI模型部署的關鍵推動者。

在創(chuàng)投圈,這家創(chuàng)企也早已站到投資人的聚光燈下,此前共拿下5輪融資,融資總額達到3.81億美元(折合人民幣約27.3億元),彼時估值達到91億美元(折合人民幣約652億元),其中戴爾和英偉達連續(xù)多輪注資。

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

▲VAST?Data融資情況

AI驅動數(shù)據(jù)以前所未有的規(guī)模增長,這對數(shù)據(jù)處理的基礎設施提出了更高要求,使得構建數(shù)據(jù)處理AI基礎設施的VAST Data迎來發(fā)展機遇。

一、手握10億美金訂單,xAI、CoreWeave、迪士尼都是客戶

VAST?Data的四位創(chuàng)始人都在存儲領域積累深厚。

CEO雷寧·哈拉克(Renen Hallak)、CTO沙查爾·芬布利特(Shachar Finblit)、營銷副總裁杰夫·登沃思(Jeff Denworth)和CTO阿隆·霍列夫(Alon Horev)共同于2016年創(chuàng)立了這家公司。

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

▲VAST?Data聯(lián)合創(chuàng)始人杰夫·登沃思(Jeff Denworth)(左一)、沙查爾·芬布利特(Shachar Finblit)(中)、CEO雷寧·哈拉克(Renen Hallak)(右二)

哈拉克曾在戴爾EMC推出的全閃存企業(yè)級存儲陣列XtremIO部門擔任研發(fā)副總裁,從項目啟動到實現(xiàn)超過10億美元的營收;芬布利特和霍列夫均曾在IBM等公司任職,登沃思在先進計算和大規(guī)??蓴U展的大數(shù)據(jù)和云存儲方面擁有超20年的技術經(jīng)驗。

彼時,哈拉克在XtremIO感受到了AI用于大規(guī)模分析的數(shù)據(jù)存儲挑戰(zhàn),但在戴爾的部門沒有施展拳腳的空間,因此他決定離開從0開始打造一種新架構。后續(xù),他與另外三位聯(lián)合創(chuàng)始人一拍即合。

用一句話概括VAST?Data的業(yè)務體系,就是將存儲、數(shù)據(jù)庫和容器化計算引擎服務統(tǒng)一為一個單一的、可擴展的VAST Data軟件平臺,并且該平臺從底層架構設計之初就專為現(xiàn)代數(shù)據(jù)中心和云中的AI、GPU加速工具而構建。

具體來看,其能實現(xiàn)對電子郵件、日志、PDF文件和多媒體內容等非結構化數(shù)據(jù)的實時訪問,通過將非關鍵數(shù)據(jù)轉移到成本更低的閃存中存儲,然后使用速度更快、價格更高的閃存,讓GPU在模型訓練過程中能夠快速訪問大量數(shù)據(jù)。

得益于AI相關需求的日益增長,眾多大模型相關企業(yè)、其他賽道頭部企業(yè)等紛紛向VAST Data拋來橄欖枝,除了開篇提到的大模型領域炙手可熱的xAI、CoreWeave等,還有英偉達投資的云計算基礎設施公司Lambda和阿聯(lián)酋AI公司G42子公司Core42,以及NASA、美國能源部、波士頓兒童醫(yī)院、旅游公司Booking Holdings等其他賽道企業(yè),均是VAST?Data的客戶。

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

▲VAST?Data部分客戶名單

且與許多依賴短期合同的軟件公司不同,VAST?Data會與客戶簽訂5至7年的長期合同,這使得公司的客戶流失率極低累計軟件預訂量已超過10億美元(折合人民幣約716億元)。

從融資層面看,VAST?Data此前累計融資金額已經(jīng)超過3.81億美元,估值為90億美元,老虎環(huán)球、高盛等頂級投資機構,英偉達、戴爾等頭部公司均在其投資人之列。值得一提的是,此次曝出參與此輪融資的是Alphabet的獨立增長基金CapitalG,該基金的投資目的是盈利,而不是戰(zhàn)略投資,這也在一定程度上說明投資者對VAST?Data盈利能力的認可。

那么,VAST?Data的產(chǎn)品到底有什么過人之處?

二、專為AI需求構建,自研分布式系統(tǒng)架構

能夠低成本高效處理數(shù)據(jù),一直是AI發(fā)展的命門之一。

傳統(tǒng)的數(shù)據(jù)存儲依賴于分層,用低成本存儲方案處理長期存儲的數(shù)據(jù),用高端方案存儲更常使用的數(shù)據(jù)。

但數(shù)據(jù)管理的難點在于,傳統(tǒng)架構下,跨全球數(shù)據(jù)中心傳輸PB乃至EB規(guī)模的數(shù)據(jù)已變得愈發(fā)難以處理;傳統(tǒng)數(shù)據(jù)架構并非為滿足當今AI對海量、多樣化數(shù)據(jù)集和高性能隨機I/O的需求而設計;當下的解決方案成本過高,在管理和激活數(shù)據(jù)時,迫使企業(yè)需要在性能、規(guī)模、彈性和成本之間做取舍。

因此需要構建為AI專門設計的數(shù)據(jù)處理架構。

VAST?Data的做法是消除傳統(tǒng)存儲的分層模式,將結構化、半結構化和非結構化數(shù)據(jù)存儲在一個地方加速數(shù)據(jù)檢索、降低模型訓練和推理成本,其最大的優(yōu)勢就是能讓xAI、CoreWeave部署的數(shù)萬塊甚至數(shù)十萬塊GPU不會因等待存儲而閑置。

他們是如何做到的?

該公司提出了首個分布式系統(tǒng)架構DASE(Disaggregated Shared-Everything),作為專為AI需求設計的專有框架,其將存儲、計算和數(shù)據(jù)庫層統(tǒng)一為一個單一的、全球一致的系統(tǒng),且與堆疊不同工具的公有云提供商不同,VAST的AI操作系統(tǒng)消除了性能折衷,支持實時分析、遞歸計算和無縫混合云操作。

具體來看,DASE的解耦(Disaggregated)支持將數(shù)據(jù)存儲和計算資源分離,可獨立靈活地擴展每個組件;共享一切(Shared-Everything)意味著數(shù)據(jù)可以在所有存儲節(jié)點之間訪問,同時為所有節(jié)點提供統(tǒng)一數(shù)據(jù)視圖。

而依托這一架構構建的VAST Data Platform,可以支持1萬個GPU集群,每秒處理量達TB級別。

VAST Data Platform這一操作系統(tǒng)由諸多組件構成:

VAST DataSpace允許從邊緣到云、跨越數(shù)百個地點的數(shù)據(jù)訪問、交易和保護,類似于操作系統(tǒng)的全局資源管理器;VAST DataStore就是通用存儲平臺,堪比操作系統(tǒng)中的文件系統(tǒng);VAST DataBase負責索引功能,可提供實時查詢、分析數(shù)據(jù)的多項功能。VAST DataEngine則扮演著動態(tài)計算和執(zhí)行層的角色,VAST InsightEngine是其內部的數(shù)據(jù)精煉工具,利用AI嵌入模型將原始非結構化數(shù)據(jù)轉化為具有上下文的數(shù)據(jù),并將其作為RAG(檢索增強生成)工具。

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

▲VAST Data AI操作系統(tǒng)架構

今年下半年,VAST Data將補上數(shù)據(jù)處理AI操作系統(tǒng)核心服務的最后一塊拼圖,AI Agent部署和編排系統(tǒng)VAST AgentEngine。這意味著VAST Data的平臺已經(jīng)集成了接收數(shù)據(jù)、實時存入存儲以及向尋找信息的Agent提供數(shù)據(jù)的全流程能力。

從具體的合作客戶來看,今年2月,xAI官宣的搭載超過20萬塊英偉達GPU的超級計算集群Colossus,其背后的數(shù)據(jù)平臺就由VAST Data打造,使得Colossus的AI工作負載的總擁有成本(TCO)降低了50%;2023年9月,VAST Data與CoreWeave宣布達成戰(zhàn)略合作,CoreWeave基于VAST Data的平臺構建了全球英偉達加速計算云,能夠管理和保護為生成式AI、高性能計算(HPC)和視覺特效(VFX)任務所需的大量數(shù)據(jù)。

VAST Data從0開始為AI構建的系統(tǒng),將存儲、數(shù)據(jù)庫和虛擬化計算引擎服務統(tǒng)一其中。這也說明,面對AI行業(yè)的新發(fā)展機遇,VAST Data已經(jīng)從最初的存儲公司定位,向著更廣泛的應用空間擴展。

三、深度綁定谷歌、英偉達,新融資或為IPO信號

此次被曝注資的兩家巨頭,都與VAST Data進行了深度綁定。

首先是英偉達,今年3月,VAST Data獲得英偉達認證存儲資質。黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX的主題演講中提到VAST?Data。他認為,AI時代數(shù)據(jù)是驅動行業(yè)的原材料,英偉達正與全球存儲頭部一起,構建新一代的企業(yè)基礎設施,企業(yè)需要其在混合數(shù)據(jù)中心中部署和擴展AI Agent。VAST Data就是與英偉達合作的企業(yè)之一。

2024年底,黃仁勛與哈拉克一起錄制了一段關于AI未來的十分鐘播客,黃仁勛談到他曾在法國巴黎的VivaTech大會上提到的實現(xiàn)模型持續(xù)改進的數(shù)據(jù)飛輪(data flywheel),當下擴展企業(yè)AI、從訓練轉向實時推理的轉變,對VAST Data來說是一個絕佳的機會。他對于此前和VAST?Data的合作感到非常自豪。

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

▲黃仁勛與哈拉克錄制AI播客

去年9月,VAST Data還與英偉達合作構建了實時RAG工具InsightEngine,可以利用NIM微服務實現(xiàn)實時數(shù)據(jù)檢索,已經(jīng)在金融交易、自動駕駛、物流等領域實現(xiàn)了企業(yè)級應用。

其次是谷歌,今年4月,VAST Data平臺已全面集成到谷歌云中,企業(yè)可以在單個高性能平臺上統(tǒng)一AI訓練、RAG管道、高通量數(shù)據(jù)處理和非結構化數(shù)據(jù)湖,這實現(xiàn)了跨混合環(huán)境的AI訓練、RAG和推理,可以繞過公有云提供商的壁壘。

值得一提的是,除了與頭部客戶深度綁定外,這家創(chuàng)企與思科、超微和HPE的OEM合作使其能獲得較低的硬件成本,同時保持軟件溢價,達到高毛利和快速客戶獲取的優(yōu)勢。

在現(xiàn)金流充足的情況下,外媒也認為VAST Data獲得新融資或證明了其進行IPO前準備工作的進程加快,去年這家創(chuàng)企還聘請了全球電商平臺ShopifyCFO艾米·沙佩羅(Amy Shapero)。

結語:乘AI東風,VAST?Data營收激增

數(shù)據(jù)、算力等AI基礎設施平臺構建的重要性與日俱增,盡管英偉達、微軟和谷歌等科技巨頭憑借GPU、云平臺占據(jù)了這一賽道的頭部市場,但以VAST Data為代表的AI創(chuàng)企業(yè)務增長、估值飆升也證明了這不僅是一場巨頭游戲。

而在巨頭環(huán)伺的AI競賽下,VAST?Data這類專注于某一垂直賽道的企業(yè),能夠針對數(shù)據(jù)存儲需求的變化,在大模型發(fā)展瞬息萬變的當下,打造完全面向AI時代企業(yè)核心需求的數(shù)據(jù)處理平臺,從而收獲大批客戶以及收益。

來源:路透社、VAST?Data官網(wǎng)、CTech