智東西(公眾號(hào):zhidxcom)
作者 | 王涵
編輯 | 漠影

智東西6月24日?qǐng)?bào)道,獨(dú)立數(shù)據(jù)庫廠商OceanBase今日在媒體溝通會(huì)上宣布,其云數(shù)據(jù)庫OB Cloud已實(shí)現(xiàn)AI能力的開發(fā)部署及生態(tài)集成,并已服務(wù)零售、金融、物流等行業(yè)的數(shù)十家頭部企業(yè),推動(dòng)AI落地。

在今年的3月27日,OceanBase舉行了首屆合作伙伴大會(huì),在會(huì)上OceanBase稱“AI將成為其未來重要的發(fā)展方向。此次OB Cloud對(duì)AI能力的部署集成與行業(yè)應(yīng)用,被視為OceanBase AI戰(zhàn)略落地的第一步。

“云數(shù)據(jù)庫與AI天然契合。”O(jiān)ceanBase副總裁、公有云事業(yè)部總經(jīng)理尹博學(xué)這樣解釋,一方面,云數(shù)據(jù)庫的彈性擴(kuò)展、成本優(yōu)化、高可用等特性,為AI工作負(fù)載提供堅(jiān)實(shí)底座;另一方面,AI對(duì)多模態(tài)數(shù)據(jù)的高效調(diào)用需求,推動(dòng)云數(shù)據(jù)庫強(qiáng)化向量檢索、多模融合等能力。

“推理過程中,向量檢索與標(biāo)量查詢相結(jié)合式的數(shù)據(jù)檢索,可以緩解大語言模型的幻覺現(xiàn)象?!币W(xué)介紹到,OB Cloud將向量索引、全文索引和模糊索引集成為“all in one”的存儲(chǔ)化引擎,可以幫助客戶在簡潔高效的技術(shù)棧上,提高效率并降低成本。

據(jù)悉,OB Cloud云基座涵蓋了國內(nèi)外主流的6家云廠商,可以獲得開箱即用的云服務(wù)。從去年第二季度到今年第二季度,一年里OB Cloud的開服區(qū)域從30提升到50,提升了67%;可用區(qū)從100+提升到170+,其可靠性和容災(zāi)能力大幅度提升??梢栽诓煌牡赜颉⒉煌膰?、不同的基礎(chǔ)設(shè)施上,AI應(yīng)用的可獲得性變得更便捷,OB Cloud也能夠在各種地域、各種云上為AI應(yīng)用提供支撐和服務(wù)。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

▲OceanBase副總裁、公有云事業(yè)部總經(jīng)理尹博學(xué)

一、成本直降95%,OB Cloud性能超ES9.0

如今的AI應(yīng)用涉及海量的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù),單一數(shù)據(jù)類型的存儲(chǔ)和查詢已經(jīng)沒有辦法滿足業(yè)務(wù)需求。與此同時(shí),更大的挑戰(zhàn)來自高維向量數(shù)據(jù),推薦系統(tǒng)、圖像搜索、語義理解等AI場景,需要處理的數(shù)據(jù)不僅體量龐大,而且計(jì)算復(fù)雜。

企業(yè)對(duì)于數(shù)據(jù)庫的向量能力的要求也越來越高,而OB Cloud可以將多模態(tài)數(shù)據(jù)通過嵌入模型轉(zhuǎn)化成向量進(jìn)行儲(chǔ)存,實(shí)現(xiàn)更加高效的數(shù)據(jù)存儲(chǔ)與調(diào)用。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

對(duì)于非結(jié)構(gòu)化數(shù)據(jù)處理,OceanBase資深技術(shù)專家張易稱,OB Cloud主要通過加強(qiáng)文本檢索和向量檢索來達(dá)到更優(yōu)的性能。同時(shí)在非結(jié)構(gòu)化之上,目前正在通過AI函數(shù)的功能,鏈接模型以及數(shù)據(jù)的能力,從而能夠達(dá)到一條SQL串接整個(gè)的結(jié)構(gòu)化以及非結(jié)構(gòu)化處理的工作流。

在 RAG 技術(shù)應(yīng)用中,其核心處理流程與行業(yè)主流架構(gòu)具有一致性。該流程首先對(duì)用戶問題進(jìn)行理解與改寫,將自然語言查詢轉(zhuǎn)化為適配系統(tǒng)處理的格式;繼而在知識(shí)庫檢索環(huán)節(jié)中,完成知識(shí)片段的召回與排序優(yōu)化,確保向大模型輸入高相關(guān)性信息;最終由大模型基于處理后的內(nèi)容生成答案并反饋給用戶。

值得關(guān)注的是,該方案對(duì)全流程各環(huán)節(jié)進(jìn)行了細(xì)粒度拆解,通過對(duì)問題解析、知識(shí)檢索、模型交互等每個(gè)節(jié)點(diǎn)的獨(dú)立調(diào)優(yōu)與協(xié)同串聯(lián),實(shí)現(xiàn)了整體回答準(zhǔn)確率與處理效率的系統(tǒng)性提升。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

▲OceanBase資深技術(shù)專家張易

OB Cloud向量算法庫叫做VSAG,目前已經(jīng)開源。在國際主流的Benchmark上,VSAG向量的性能大概是目前Sota水平的90%以上。

此外,在數(shù)據(jù)層面,OB Cloud基于向量算法組織了內(nèi)存索引、磁盤索引和混合索引來應(yīng)對(duì)向量的存儲(chǔ)和計(jì)算的需求。最后是算力層,目前OB Cloud正在構(gòu)建基于GPU的向量索引。

在算法方面,張易還提到,一方面向量數(shù)據(jù)會(huì)隨著用戶增長而不斷攝入,一方面用戶對(duì)數(shù)據(jù)的需求也會(huì)越來越大。為了既實(shí)現(xiàn)增量又要滿足海量,OB Cloud讓檢索實(shí)時(shí)可見,并引進(jìn)磁盤IVF+HNSW混合索引,單機(jī)可支撐10億向量檢索。

同時(shí),在AI領(lǐng)域,在json等半結(jié)構(gòu)化數(shù)據(jù)處理方面,OB也做了大量的工作。目前在json的存儲(chǔ)優(yōu)化方面,已有的版本跟主流的MongoDB相比,成本僅為1/3。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

OB和其他的向量數(shù)據(jù)庫還有一個(gè)比較大的區(qū)別,即從OB整個(gè)向量數(shù)據(jù)庫到向量算法全部都是自研的。OceanBase資深技術(shù)專家張易稱,從整體性能上看,自研的OB Cloud的向量性能已經(jīng)達(dá)到主流開源數(shù)據(jù)庫水平。

據(jù)螞蟻內(nèi)部統(tǒng)計(jì),OB Cloud對(duì)資源的要求高1~2個(gè)數(shù)量級(jí),同等召回率和性能的條件下,OB Cloud的成本可以下降95%,在研版本的性能超ES 9.0 BBO 16%。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

在最近的幾個(gè)月,OceanBase引入RabitQ來解決傳統(tǒng)HNSW算法占用內(nèi)存較多的問題。內(nèi)部統(tǒng)計(jì),在不同的工作負(fù)載、同樣的查詢以及召回?cái)?shù)據(jù)等量的情況下,引入RabitQ的OB Cloud會(huì)比和傳統(tǒng)計(jì)算的數(shù)據(jù)存取高,對(duì)資源的要求也高1到2個(gè)數(shù)量級(jí)。同時(shí)與同時(shí)引進(jìn)了RabitQ算法的主流產(chǎn)品ES9.0做了對(duì)比,OB Cloud的BBQ高16%左右。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

據(jù)悉,OB Cloud正在“TP+向量”與“向量+多模態(tài)”的方向上進(jìn)行探索。從螞蟻集團(tuán)內(nèi)部實(shí)踐及行業(yè)趨勢(shì)來看,文本檢索領(lǐng)域正經(jīng)歷技術(shù)迭代升級(jí):數(shù)年前單一向量技術(shù)即可解決語義檢索需求,近年來已發(fā)展為向量與全文檢索結(jié)合的模式。而當(dāng)前業(yè)界數(shù)據(jù)表明,向量、全文與稀疏向量的融合應(yīng)用能進(jìn)一步提升召回率。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

基于此,技術(shù)團(tuán)隊(duì)正推進(jìn)兩方面優(yōu)化:一方面將稀疏向量、稠密向量與全文的多路檢索能力集成至數(shù)據(jù)庫內(nèi)核,使用戶通過單條 SQL 即可實(shí)現(xiàn)混合檢索;另一方面嘗試將向量 Embedding 模型嵌入數(shù)據(jù)庫,使用戶僅需插入原始數(shù)據(jù),無需關(guān)注向量處理過程,從而實(shí)現(xiàn)數(shù)據(jù)插入與查詢的一體化易用性體驗(yàn)。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

二、PowerRAG:一站式解決方案,提升回答準(zhǔn)確率與處理效率

OceanBase公有云高級(jí)產(chǎn)品專家馮禮在會(huì)上稱,在 AI 落地中,RAG(檢索增強(qiáng)生成)是企業(yè)優(yōu)先采用的核心場景,通過知識(shí)庫、知識(shí)檢索與大模型結(jié)合,解決大模型 “幻覺” 問題,使其基于企業(yè)內(nèi)部數(shù)據(jù)作答。

傳統(tǒng)RAG搭建需復(fù)雜選型向量庫、文本庫等數(shù)據(jù)底座,上層依賴開源框架開發(fā),運(yùn)維與集成成本高?,F(xiàn)推出的PowerRAG多模一體化方案整合多元檢索能力,在此基礎(chǔ)上實(shí)現(xiàn)全流程模塊集成,以一站式方案降低成本,其核心流程涵蓋問題理解、知識(shí)庫檢索及大模型交互,通過環(huán)節(jié)優(yōu)化提升效率。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

▲OceanBase公有云高級(jí)產(chǎn)品專家馮禮

新產(chǎn)品PowerRAG正在形成“集成知識(shí)庫+知識(shí)檢索+大模型”式的多模一體化數(shù)據(jù)解決方案。該產(chǎn)品可以將文檔輸入到知識(shí)庫形成切片,通過向量嵌入模型以向量模式存儲(chǔ),用戶通過提問檢索答案,再將答案通過大語言模型輸出給用戶。PowerRAG還可以對(duì)文檔的段落、表格和圖片等不同的多模態(tài)數(shù)據(jù)采取不同的解析策略。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

OceanBase AI助手以及AI驅(qū)動(dòng)的智能運(yùn)維服務(wù)(OAS)就是該產(chǎn)品的落地實(shí)踐結(jié)果。目前,PowerRAG可以在OB Cloud官網(wǎng)進(jìn)行體驗(yàn)。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

三、DB – LLMOps新范式,解決企業(yè)AI規(guī)?;涞厝靥魬?zhàn)

“AI不再是工具,而是平臺(tái)級(jí)基礎(chǔ)設(shè)施的接替者。”O(jiān)ceanBase公有云事業(yè)部解決方案總監(jiān)戴濤稱,企業(yè)AI規(guī)?;涞厝齻€(gè)核心挑戰(zhàn):數(shù)據(jù)治理與架構(gòu)適配、成本和性能博弈、企業(yè)級(jí)數(shù)據(jù)安全。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

▲OceanBase公有云事業(yè)部解決方案總監(jiān)戴濤

面對(duì)這三個(gè)挑戰(zhàn),OceanBase可以幫助企業(yè)從結(jié)合自身優(yōu)勢(shì)產(chǎn)生AI應(yīng)用新范式:DB-LLMOps。該范式是圍繞企業(yè)數(shù)據(jù)和大模型的應(yīng)用程序的生命周期管理平臺(tái)或者工具。企業(yè)可以充分利用企業(yè)與數(shù)據(jù)的長處和特征,引入大模型的能力,共同完成整個(gè)企業(yè)開發(fā)、AI開發(fā)架構(gòu)范式的變化。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

另外,戴濤強(qiáng)調(diào),在向量技術(shù)的實(shí)際應(yīng)用中,檢索場景始終是核心切入點(diǎn)。傳統(tǒng)檢索模式以全文檢索、結(jié)構(gòu)化檢索為主,但隨著大模型技術(shù)的引入,檢索需求正經(jīng)歷深度變革:向量檢索、語義檢索、模型重排序及RAG等技術(shù)的融合,使檢索邏輯從單一規(guī)則匹配轉(zhuǎn)向語義理解與智能優(yōu)化的復(fù)合模式。

當(dāng)前企業(yè)面臨的檢索場景呈現(xiàn)顯著復(fù)雜化特征:從數(shù)據(jù)形態(tài)看,圖像、文本、音頻、視頻等多模態(tài)數(shù)據(jù)的檢索需求并存;從應(yīng)用維度看,跨語料、跨專業(yè)、跨學(xué)科的復(fù)雜檢索場景日益普遍。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

此類需求的升級(jí)推動(dòng)向量數(shù)據(jù)庫成為關(guān)鍵解決方案,其通過高維向量表征與語義相似度計(jì)算,可有效應(yīng)對(duì)多模態(tài)數(shù)據(jù)關(guān)聯(lián)分析、跨領(lǐng)域知識(shí)匹配等復(fù)雜檢索場景,為企業(yè)解決傳統(tǒng)檢索技術(shù)在語義理解與跨維度檢索中的瓶頸問題。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

在企業(yè)落地案例中,向量數(shù)據(jù)庫助力以圖搜圖功能實(shí)現(xiàn)高效應(yīng)用。例如,三維家家居設(shè)計(jì)企業(yè),其借助向量數(shù)據(jù)庫對(duì)大量家居素材圖片進(jìn)行Embedding嵌入,用戶上傳圖片后,系統(tǒng)可快速檢索匹配相關(guān)設(shè)計(jì)素材,輔助設(shè)計(jì)師生成AI裝修視覺圖。

跨境電商企業(yè)卡佩希通過向量數(shù)據(jù)庫實(shí)現(xiàn)多模態(tài)檢索,客服可基于用戶的圖片或文字需求描述,快速檢索并推薦相關(guān)女裝商品,提供混合檢索服務(wù)。在視頻推薦場景中,合作企業(yè)當(dāng)貝基于用戶觀看記錄的向量表征,通過語義匹配推送風(fēng)格相似的內(nèi)容,將向量檢索能力延伸至廣告推薦領(lǐng)域。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

在RAG場景落地中,伯俊科技利用OB向量能力構(gòu)建企業(yè)知識(shí)庫,沉淀專業(yè)知識(shí),后續(xù)將延伸至文件導(dǎo)購、AI配貨等場景。貨拉拉以RAG為底座,一方面通過圖片、代碼等模式識(shí)別實(shí)現(xiàn)資損代碼識(shí)別,輔助用戶賠償建議判斷;另一方面打造數(shù)倉AI答疑功能,支持自然語言SQL查詢,為客戶提供數(shù)據(jù)倉庫問題解答。

在企業(yè)問數(shù)場景落地中,銀泰通過處理自然語言,將其轉(zhuǎn)化為RAG化、向量化內(nèi)容,為企業(yè)管理層提供實(shí)時(shí)問題診斷。該方案涵蓋從自然語言到SQL的轉(zhuǎn)化,訓(xùn)練企業(yè)特殊語料,搜索數(shù)據(jù)后供經(jīng)營者決策。同時(shí),銀泰還應(yīng)用RAG功能,對(duì)外提供智能問答,對(duì)內(nèi)構(gòu)建知識(shí)庫。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

在企業(yè)Agent領(lǐng)域應(yīng)用中,OB的一體化技術(shù)架構(gòu)具備顯著優(yōu)勢(shì):其混合查詢能力支持標(biāo)量與向量一體化檢索,多模態(tài)交互特性可處理多元數(shù)據(jù)。高并發(fā)、低延遲性能適配企業(yè)實(shí)時(shí)需求,數(shù)據(jù)隔離與多租戶機(jī)制則保障了企業(yè)級(jí)應(yīng)用的安全性與資源管理效率,為企業(yè)構(gòu)建AI底座提供核心支撐。

成本降95%性能超ES9.0,OceanBase推GPU加速的向量數(shù)據(jù)庫

最后,戴濤總結(jié)稱,企業(yè) AI 規(guī)?;涞乜煞秩酵七M(jìn):

第一步:單場景從0到1切入,建議以知識(shí)庫為入口,選擇高價(jià)值、短鏈路場景,借助PowerRAG產(chǎn)品快速搭建驗(yàn)證。

第二步:漸進(jìn)式場景擴(kuò)展,針對(duì)業(yè)務(wù)與 IT 團(tuán)隊(duì)認(rèn)知差異,通過Design Thinking工作坊協(xié)同挖掘AI場景,完成小規(guī)模應(yīng)用構(gòu)建,實(shí)現(xiàn)從1到10的能力延伸。

第三步:構(gòu)建 AI 業(yè)務(wù)中臺(tái),整合Agent、RAG及一體化數(shù)據(jù)庫,形成標(biāo)準(zhǔn)化平臺(tái),支持業(yè)務(wù)與輕IT人員快速開發(fā)創(chuàng)新應(yīng)用,推動(dòng)業(yè)務(wù)與IT雙輪驅(qū)動(dòng),最終實(shí)現(xiàn)從AI賦能到AI原生的升級(jí)。

結(jié)語:AI正重塑企業(yè)智能生產(chǎn)力

OceanBase副總裁、公有云事業(yè)部總經(jīng)理尹博學(xué)將OB Cloud的AI能力優(yōu)勢(shì)總結(jié)為四點(diǎn),分別是具備天然的一體化架構(gòu),一套數(shù)據(jù)庫支持事務(wù)處理(TP)、實(shí)時(shí)分析(AP)、AI工作負(fù)載,用戶面向AI無需引入額外技術(shù)棧;多模向量一體化,原生支持向量、標(biāo)量、空間、文本等多模數(shù)據(jù)的混合檢索,簡化AI應(yīng)用復(fù)雜度;提供開箱即用的RAG服務(wù),“0門檻”構(gòu)建現(xiàn)代RAG應(yīng)用;Bring AI to Data,一體化架構(gòu)實(shí)現(xiàn)數(shù)據(jù)的新鮮度與智能的實(shí)時(shí)性融合。

據(jù)了解,目前OB Cloud的AI能力已在零售、金融、物流等眾多行業(yè)的數(shù)十家頭部企業(yè)中落地驗(yàn)證。除上述提到的合作伙伴外,OB Cloud在攜程落地“以圖搜圖”的搜索及個(gè)性化推薦場景;支撐中國聯(lián)通軟研院、九訊云等實(shí)現(xiàn)RAG智能問答的高效混合檢索;助力支付寶等企業(yè)打造更智能的“問數(shù)”與Agent協(xié)同應(yīng)用。

值得一提的是,OceanBase已與LlamaIndex、LangChain、Dify、支付寶百寶箱等60余家AI應(yīng)用開發(fā)與生態(tài)開放平臺(tái)深度集成,并支持大模型生態(tài)協(xié)議MCP,在全球范圍內(nèi)構(gòu)建完整的AI技術(shù)生態(tài)鏈。據(jù)了解,OB Cloud與這些AI生態(tài)伙伴也實(shí)現(xiàn)深度對(duì)接,共同加速行業(yè)智能化升級(jí)。

“未來的數(shù)據(jù)底座必須同時(shí)具備云的彈性、AI的智能以及多云環(huán)境下的韌性?!闭缫W(xué)稱,AI正重塑企業(yè)智能生產(chǎn)力。