智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影

智東西5月31日報道,今日,在2024向星力·未來數(shù)據(jù)技術(shù)峰會上,大數(shù)據(jù)基礎(chǔ)軟件龍頭星環(huán)科技面向企業(yè)構(gòu)建大模型和應(yīng)用生成式AI的需求,發(fā)布最新AI基礎(chǔ)設(shè)施產(chǎn)品Transwarp Knowledge Hub星環(huán)知識平臺(以下簡稱TKH), 提供企業(yè)級多模態(tài)知識存儲及服務(wù),并推出一款一站式多場景語料開發(fā)工具TCS(Transwarp Corpus Studio)、大模型運營平臺Transwarp Sophon LLMOps。

基于無涯大模型,星環(huán)知識平臺TKH打造了無涯·問知、無涯·問數(shù)、無涯·金融、無涯·工程等AI原生應(yīng)用,可廣泛應(yīng)用于金融、能源、制造、工程等多個領(lǐng)域,通過精準的數(shù)據(jù)分析和知識管理,滿足企業(yè)不同類型的知識應(yīng)用需求,提升企業(yè)業(yè)務(wù)效率和競爭力。

星環(huán)科技發(fā)布了企業(yè)版、AI PC版企業(yè)級垂直領(lǐng)域問答產(chǎn)品無涯·問知In?nity Intelligence。無涯·問知公有云服務(wù)也正式發(fā)布,首批邀請用戶已經(jīng)可以在線測試。

同時,星環(huán)科技推出企業(yè)智能業(yè)務(wù)分析洞察平臺無涯·問數(shù),讓用戶用自然語言輕松進行數(shù)據(jù)分析,解決傳統(tǒng)BI(商業(yè)智能)使用門檻高、效率低的挑戰(zhàn)。

星環(huán)科技創(chuàng)始人、CEO孫元浩宣布,星環(huán)科技的定位從Data Infra進一步延伸到AI Infra,為企業(yè)客戶打造AI基礎(chǔ)設(shè)施,打造覆蓋語料處理、模型訓練、知識庫建設(shè)等的一整套工具鏈,幫助企業(yè)快速建立行業(yè)大模型,快速使用AIGC。

孫元浩告訴智東西,在支持生成式AI的數(shù)據(jù)管理方面,企業(yè)可能會用到向量數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫、圖數(shù)據(jù)庫、實時數(shù)據(jù)庫等不同類型,這些都是為AI提供數(shù)據(jù)的主要方式,現(xiàn)在很難說哪類比重會更高。

對于用戶而言,已構(gòu)建數(shù)據(jù)倉庫的基礎(chǔ)較大,結(jié)合大模型直接問數(shù)據(jù)庫比較立竿見影,需求相對多。向量數(shù)據(jù)庫預(yù)計會加速增長,語音、圖片、視頻必須要用向量數(shù)據(jù)庫,文檔建議也變成向量數(shù)據(jù)庫以拓展檢索范圍。知識圖譜構(gòu)建要求較大,但同樣是必要的補充。當關(guān)系圖譜不足時,星環(huán)提供了實時數(shù)據(jù)庫,還有傳感器分析。

面向AI PC布局,孫元浩認為AI PC是提高生產(chǎn)力的必需品,他透露說星環(huán)希望在本地做到千億參數(shù)模型,可能今年年底就可以做到。

一、今年全球?qū)⑸?59.2ZB數(shù)據(jù),企業(yè)落地AI面臨4類挑戰(zhàn)

AI大模型正在催生新一輪技術(shù)創(chuàng)新與產(chǎn)業(yè)變革,將為金融、制造、交通、政務(wù)等眾多行業(yè)企業(yè)數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展帶來新動能。

生成式AI出現(xiàn)后,深度學習從以前的可能幾千萬、上億的樣本數(shù)量的大樣本機器學習,演變成現(xiàn)在小樣本機器學習,讓行業(yè)大模型應(yīng)用范圍變得更廣,讓模型能夠思考、學習,理解自然語言,完成更多的工作。

當前市場以通用基礎(chǔ)大模型為主,通識能力強,但缺少行業(yè)專業(yè)知識。讓企業(yè)的AI應(yīng)用從早期直接調(diào)用通用大模型發(fā)展到建立自己的AI基礎(chǔ)設(shè)施,打造行業(yè)或特定領(lǐng)域、任務(wù)的專用大模型,助力生產(chǎn)力革新和產(chǎn)業(yè)升級,已經(jīng)成為企業(yè)關(guān)注的核心。

在峰會上,IDC中國副總裁鐘振山分享了一些IDC調(diào)研結(jié)果。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

IDC預(yù)測,全球2024年將生成159.2ZB數(shù)據(jù),2028年將增加1倍以上,達到384.6ZB,復(fù)合增長率為24.4%,分布在不同的數(shù)據(jù)庫中。DataSphere 2024最新預(yù)測還呈現(xiàn)了3D特征:分布式、多樣化、動態(tài)。未來兩年里,預(yù)計組織中的數(shù)據(jù)量、數(shù)據(jù)速度、數(shù)據(jù)多樣性均會提升。

為了實現(xiàn)生成式AI,企業(yè)需要管理多方數(shù)據(jù)源,被調(diào)查企業(yè)中50%使用數(shù)據(jù)倉庫支持生成式AI,35%使用向量數(shù)據(jù)庫,33%使用數(shù)據(jù)湖,33%使用支持向量搜索能力的NoSQL數(shù)據(jù)庫。

從落地形式來看,企業(yè)更多選擇私有化方式來訓練、推理和部署大模型。在實施AI技術(shù)時,企業(yè)或機構(gòu)經(jīng)歷過/預(yù)計會經(jīng)歷成本、缺乏具備學習和使用AI所需技能的員工、缺少專項技能人才、缺少AI治理&風險管理、缺少AI監(jiān)管規(guī)則等方面的挑戰(zhàn)。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

總體來看,企業(yè)落地AI面臨4個主要挑戰(zhàn):1)高投入成本與專業(yè)人才匱乏,是企業(yè)落地AI最大的阻礙;2)數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)不足,需要商業(yè)落地、安全性、可持續(xù)發(fā)展和數(shù)據(jù)管理;3)缺乏統(tǒng)一數(shù)據(jù)管理底座,海量、多元、非結(jié)構(gòu)化數(shù)據(jù)高頻流動;4)缺少知識庫的支撐,知識的存儲、共享和流動。

二、定位延伸至AI Infra,為企業(yè)提供全流程開發(fā)工具鏈

從需求上看,目前通用大模型數(shù)量快速增加,并不斷升級迭代、提質(zhì)增效,但卻不能適應(yīng)企業(yè)AI應(yīng)用的需求。

企業(yè)對行業(yè)大模型需求增加,迫切需要降低使用門檻,更加普惠地使用大模型、生成式AI技術(shù),以解決企業(yè)內(nèi)部人才、算力、數(shù)據(jù)等不足的挑戰(zhàn)。發(fā)展面向特定領(lǐng)域或任務(wù)的領(lǐng)域大模型,不斷提升模型準確度,成為一條切實可行的發(fā)展途徑。

每個國家都需要主權(quán)AI,企業(yè)同樣需要自身的AI Infra來打造行業(yè)大模型,從而更快速便捷地用大模型釋放數(shù)據(jù)價值。

針對企業(yè)的AI Infra建設(shè),星環(huán)科技通過自主研發(fā),可向用戶提供一站式企業(yè)級大模型生產(chǎn)及應(yīng)用全流程開發(fā)工具鏈,讓大模型快速落地。

星環(huán)科技擁有從語料到模型再到應(yīng)用的完整的AI Infra工具集,覆蓋語料開發(fā)和管理、大模型訓練與持續(xù)提升、多模態(tài)知識工程、多模知識存儲與服務(wù)、原生AI應(yīng)用構(gòu)建編排和應(yīng)用服務(wù)等重要階段,提供提示詞工程、檢索增強、智能體構(gòu)建等大模型應(yīng)用快速構(gòu)建和提升、模型推理優(yōu)化、模型安全和持續(xù)提升技術(shù)。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

星環(huán)科技AI Infra工具支持異構(gòu)算力、語料、知識、大模型應(yīng)用的統(tǒng)一管理,為數(shù)據(jù)和語料資產(chǎn)的集約化提供了一站式平臺,且具備企業(yè)級的組織空間管理能力。

通過該工具,企業(yè)能夠準確、高效地將擁有的多種來源的多模語料轉(zhuǎn)換為高質(zhì)量的專業(yè)領(lǐng)域知識,源源不斷支撐專業(yè)知識庫問答、業(yè)財數(shù)據(jù)分析、智能投研、設(shè)備預(yù)測性維護等豐富的使用場景和應(yīng)用,讓企業(yè)構(gòu)筑知識壁壘,實現(xiàn)“人工智能+”業(yè)務(wù)的落地和創(chuàng)新。

后續(xù)星環(huán)科技將通過自主研發(fā),不斷完善AI從基礎(chǔ)設(shè)施到應(yīng)用的產(chǎn)業(yè)鏈條,為客戶提供端到端的全套AI解決方案。

三、企業(yè)界垂直領(lǐng)域問答產(chǎn)品無涯·問知:四大應(yīng)用場景,將數(shù)據(jù)和資料轉(zhuǎn)換為知識

星環(huán)科技發(fā)布了企業(yè)級垂直領(lǐng)域問答產(chǎn)品無涯·問知In?nity Intelligence,有企業(yè)版、AI PC版、云端版,包括四大應(yīng)用場景:

1)企業(yè)可以基于星環(huán)知識庫TKH,建立企業(yè)自己的知識庫應(yīng)用;

2)企業(yè)算力不足時,可采用安裝了天涯·問知的AI PC,在本地直接訪問天涯·問知;

3)中小企業(yè)用戶不用自己構(gòu)建知識庫,可直接利用星環(huán)科技無涯·問知公有云服務(wù);

4)個人可利用AI PC或者公有云服務(wù),訪問天涯·問知服務(wù)。

無涯·問知是一款基于星環(huán)自研預(yù)訓練模型無涯Infinity和向量數(shù)據(jù)庫Hippo、圖數(shù)據(jù)庫StellarDB構(gòu)建的企業(yè)級垂直領(lǐng)域問答知識庫應(yīng)用。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

該產(chǎn)品基于星環(huán)科技大模型底座,結(jié)合個人知識庫、企業(yè)知識庫、法律法規(guī)、財經(jīng)等多種知識源,充分利用了星環(huán)科技自研大模型底座的自動化知識工程特性,使其在處理和分析數(shù)據(jù)方面具有顯著的優(yōu)勢,允許用戶上傳文檔、表格、圖片等多源數(shù)據(jù),并支持與外部數(shù)據(jù)源的對接,使用戶能夠構(gòu)建屬于自己的專屬領(lǐng)域大模型。

借助這一工具,用戶可基于自身私域知識庫進行更為個性化和深入的數(shù)據(jù)分析。

該產(chǎn)品支持不限長度的音視頻圖文等多模態(tài)數(shù)據(jù)快速入庫,且支持自動化文檔切片及向量化處理,配合自研的RAG框架,可實現(xiàn)知識的精準召回,可用于市場研究分析、企業(yè)供應(yīng)鏈分析、法律風險預(yù)警、智能寫作等業(yè)務(wù)場景中。

面向個人用戶,星環(huán)科技推出無涯·問知AI PC版本,可在搭載英特爾新一代CPU的主流個人電腦(AI PC)上基于集成顯卡和NPU流暢運行。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

無涯·問知AI PC版本提供本地化的向量庫,支持多種格式、不限長度的文件資料入庫,并支持影、音、圖、文等多模態(tài)數(shù)據(jù)和資料的“知識化”處理,以及相應(yīng)的“語義化”查詢和應(yīng)用能力,能夠?qū)闪炕臄?shù)據(jù)進行精準的分析和研判。

該工具打通了個人文件資料與企業(yè)知識庫,形成本地和云端的知識聯(lián)動推理,而且能保障個人的數(shù)據(jù)安全。

據(jù)介紹,無涯·問知AI PC版本具備出色的內(nèi)容理解能力,包括對感知和認知層的深度理解,以及對事實、流程、圖譜等高級語意的把握,因此能夠更準確地理解用戶需求。

四、無涯·問數(shù):用自然語言搞定數(shù)據(jù)分析,兼顧安全性與準確性

今日星環(huán)還發(fā)布了一款智能業(yè)務(wù)分析洞察平臺無涯·問數(shù),基于星環(huán)數(shù)據(jù)分析大模型打造,旨在解決傳統(tǒng)BI在數(shù)據(jù)獲取、使用門檻和效率方面的挑戰(zhàn),為決策者和業(yè)務(wù)人員帶來更好的數(shù)據(jù)分析體驗。

該平臺集合了大語言模型、AI和BI的能力,并結(jié)合數(shù)據(jù)分析主體、指標、標簽設(shè)計、數(shù)據(jù)開發(fā)和治理,形成了從自然語言轉(zhuǎn)數(shù)據(jù)查詢語言并返回數(shù)據(jù)表或數(shù)據(jù)圖表的完整流程。

非專業(yè)用戶可在無涯·問數(shù)平臺上使用自然語言輕松查詢數(shù)據(jù),無需掌握數(shù)據(jù)庫編程語言,有效解決取數(shù)需求開發(fā)鏈路長、指標二義性、缺乏數(shù)據(jù)挖掘能力、數(shù)據(jù)分析高度依賴人工經(jīng)驗等傳統(tǒng)數(shù)據(jù)分析痛點,簡化了用戶與數(shù)據(jù)交互的方式,讓數(shù)據(jù)分析變得更加便捷和直觀。

在安全性上,無涯問數(shù)結(jié)合NL2SQL和可視化能力,將模型輸出結(jié)果解析為易于理解的界面化配置,并從多個維度提供全面的數(shù)據(jù)安全管控,在更快、更高效獲取數(shù)據(jù)的同時,保證查詢過程的安全性和結(jié)果數(shù)據(jù)的可解釋性。

在傳統(tǒng)BI場景中,缺乏經(jīng)驗的分析師難以給出高質(zhì)量的分析報告,且靠人力經(jīng)驗積累的業(yè)務(wù)邏輯、業(yè)務(wù)洞察無法沉淀為企業(yè)知識庫。

無涯問數(shù)針對數(shù)據(jù)安全保障有一系列精細的數(shù)據(jù)安全和權(quán)限控制措施,可以結(jié)合企業(yè)自由數(shù)據(jù)進行模型訓練,理解行業(yè)黑化和業(yè)務(wù)邏輯,在智能分析場景下提供更高的模型準確率和分析方法論等知識輸入。

針對數(shù)據(jù)一致性,無涯問數(shù)通過先進的指標和標簽?zāi)K解決取數(shù)渠道和計算口徑不一致的情況,提供包括針對數(shù)據(jù)、指標和標簽的智能業(yè)務(wù)洞察范圍,并滿足客戶數(shù)據(jù)來源準確和分析口徑統(tǒng)一的需求;確保數(shù)據(jù)分析結(jié)果的可靠性,支持數(shù)據(jù)驅(qū)動的決策制定。

在應(yīng)用場景上,無涯·問數(shù)提供分析儀表盤和智能問數(shù)能力,讓決策者/管理者以自然語言提問快速自助獲取目標數(shù)據(jù);預(yù)定義指標計算口徑,依托數(shù)據(jù)分析大模型理解用戶的分析意圖,讓數(shù)據(jù)分析人員實現(xiàn)對話即分析;通過頁面配置的方式快速完成數(shù)據(jù)準備,讓數(shù)據(jù)開發(fā)人員,快速整合多種數(shù)據(jù)。

五、星環(huán)知識平臺TKH:幫企業(yè)高效構(gòu)建AI Infra

星環(huán)科技整合大數(shù)據(jù)、AI等技術(shù),推出一款知識平臺Transwarp Knowledge Hub(TKH),為企業(yè)提供一個全面、高效、智能的數(shù)據(jù)處理和知識管理解決方案。

TKH旨在為企業(yè)打通從AI基礎(chǔ)設(shè)施到大數(shù)據(jù)、AI等研發(fā)應(yīng)用的完整鏈條,實現(xiàn)企業(yè)內(nèi)部所有資料知識化,能統(tǒng)管企業(yè)Al Infra算力、語料、模型、應(yīng)用,助力企業(yè)打造安全可控的AI Infra、快速使用AIGC。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

星環(huán)知識平臺TKH包括知識存儲與服務(wù)、語料開發(fā)與知識構(gòu)建、大模型基礎(chǔ)服務(wù)等幾個重要部分。

第一,TDH for AI,打造新一代一站式多模型數(shù)字底座。

TKH提供企業(yè)級多模態(tài)知識存儲與服務(wù),助力企業(yè)打造新一代一站式多模型數(shù)字底座。基于Transwarp Data Hub for LLM知識管理平臺的多模型統(tǒng)一技術(shù)架構(gòu),支持關(guān)系型數(shù)據(jù)、向量數(shù)據(jù)、全文檢索、圖數(shù)據(jù)、時序數(shù)據(jù)等的統(tǒng)一存儲管理,滿足各類場景下多模態(tài)數(shù)據(jù)的統(tǒng)一存儲管理與服務(wù),大幅簡化知識庫的知識存儲與服務(wù)層架構(gòu),降低開發(fā)與運維成本。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

星環(huán)科技新推出的產(chǎn)品可以讓企業(yè)的數(shù)據(jù)底座實現(xiàn)四個一體化:湖倉集一體化、多模型處理一體化、歷史數(shù)據(jù)與實時數(shù)據(jù)處理一體化、本地集群和云平臺一體化。

其中,大數(shù)據(jù)基礎(chǔ)平臺TDH 9.4的多?;铀貯I分析;倉集資源隔離架構(gòu),在混合業(yè)務(wù)場景下依然保持極致性能;湖倉一體架構(gòu),大幅降低TCO;同份數(shù)據(jù)跑批查詢與混合負載,實時備份強在線業(yè)務(wù)容災(zāi);同時支持多模型存諸架構(gòu)、大模型海量訓練數(shù)據(jù)存儲、多模型混合檢索召回增強、Python生態(tài)等。

分布式向量數(shù)據(jù)庫Hippo支持文本、圖片、音視頻等轉(zhuǎn)化后的百億級向量數(shù)據(jù)的存儲、索引和管理,支持多種索引,具有全文檢索+向量檢索以及稀疏向量+稠密向量的混合檢索等能力。Hippo 2.0可實現(xiàn)百億級向量存儲,提供靈活索引支持、20倍內(nèi)存成本下降和向量全文混合檢索等特性。

分布式圖數(shù)據(jù)庫StellarDB提供萬億級圖數(shù)據(jù)存儲、毫秒級點邊查詢和10+層深度鏈路分析等能力,支持豐富的圖算法和圖機器學習,創(chuàng)新的動態(tài)時序圖能力更便捷地挖掘數(shù)據(jù)變化規(guī)律和預(yù)測分析。新推出的StellarDB 5.1實現(xiàn)了向量/全文模糊檢索、秒級子圖匹配、跨集群數(shù)據(jù)災(zāi)備、RAG增強大模型、GPU算法加速等功能,更穩(wěn)定、安全、易用。

星環(huán)分布式分析型數(shù)據(jù)庫ArgoDB支持標準SQL語法,提供多模分析、實時數(shù)據(jù)處理、聯(lián)邦計算、隱私計算、數(shù)據(jù)脫敏等能力,一站式滿足OLAP分析,實時數(shù)倉、數(shù)據(jù)集市、湖倉集一體等場景。

新推出的ArgoDB 6.1 版本以“增量數(shù)據(jù)實時處理”技術(shù)為基礎(chǔ),定義并發(fā)布“實時數(shù)據(jù)加工”的智能高效新范式;結(jié)合集群級實時同步與數(shù)據(jù)海量版本能力,協(xié)助用戶夠構(gòu)建高可靠的實時可信大集群,以數(shù)據(jù)透明加密、SQL審核/阻斷等安全技術(shù)手段為輔,共建“快好省”湖倉集一體的融合數(shù)據(jù)處理架構(gòu)。

星環(huán)分布式時序數(shù)據(jù)庫Timelyre支持海量時序數(shù)據(jù)庫的存儲與處理,具備每秒千萬級數(shù)據(jù)吞吐、5~20倍無損壓縮和毫秒級檢索能力,支持Python、C++等API,易用的時序分析框架滿足金融智能投研需求。TimeLyre 9.2新增了多模型時序分析、極速分布式回測平臺、投研數(shù)據(jù)中臺、時序數(shù)據(jù)湖引擎等,助力用戶解鎖數(shù)據(jù)深層價值。

星環(huán)分布式文件系統(tǒng)TDFS支持10億級以上的大小文件的存儲,并同時支持對象存儲,基于Raft保障強一致,支持HDFS平滑遷移,標準POSIX協(xié)議支持上層知識等AI場景應(yīng)用無感對接。

第二,語料加工工具與圖譜構(gòu)建工具,助力企業(yè)建立高質(zhì)量模型及應(yīng)用。

語料是決定行業(yè)大模型質(zhì)量的關(guān)鍵因素,語料的質(zhì)量決定了模型的質(zhì)量,同時高質(zhì)量語料也是解決行業(yè)大模型“幻覺”、“可信可控”等核心落地難點的重要手段。

高質(zhì)量行業(yè)專用語料是企業(yè)、機構(gòu)獨特的競爭優(yōu)勢和天然壁壘。星環(huán)科技發(fā)布了一站式多場景語料平臺Transwarp Corpous Sudio(TCS),旨在通過全面的語料生命周期管理,極大提升語料開發(fā)效率,助力企業(yè)或機構(gòu)高質(zhì)量地構(gòu)建大模型及其應(yīng)用。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

TCS覆蓋了語料獲取、清洗、加工、治理、應(yīng)用和管理的全生命周期,具有多種靈活的采集和構(gòu)建方式,能分布式的高效處理海量語料。

這是一個功能全面、易用高效、安全可靠的語料開發(fā)利器,支持20+主流文檔格式、數(shù)據(jù)化學公式、復(fù)雜語料處理、語料自動標注及篩選、多視角體系化資產(chǎn)編目和數(shù)據(jù)治理等。它具有三大核心優(yōu)勢:

1)強大的語料知識化能力,能夠自動標注知識元素、識別知識類型、推薦知識應(yīng)用,并構(gòu)建有針對性的場景知識庫,簡化了知識管理和知識應(yīng)用的過程。

2)易用的語料應(yīng)用化能力,支持將語料快速轉(zhuǎn)化為多種應(yīng)用形態(tài),如自然語言處理、機器學習等,大大降低了應(yīng)用語料的門檻,加速了從數(shù)據(jù)到知識的轉(zhuǎn)化過程。

3)完善的數(shù)據(jù)安全機制,TCS提供了完善的認證權(quán)限管理和加密機制,確保語料數(shù)據(jù)、模型和應(yīng)用的安全可信,滿足企業(yè)對數(shù)據(jù)保護的嚴格要求。

企業(yè)知識庫的建設(shè),讓數(shù)據(jù)可以用自然語言方式進行對話和檢索。企業(yè)可以集中式地管理和利用知識資源,提高運營效率和創(chuàng)新能力。只要企業(yè)保有自己的知識庫,就可以通過微調(diào)得到企業(yè)專屬大模型,實現(xiàn)大模型隨時選、隨時換,且企業(yè)核心競爭力得到保護。

企業(yè)用戶利用TKH提供的星環(huán)圖譜構(gòu)建工具Transwarp Knowledge Studio for LLM,可將企業(yè)內(nèi)部數(shù)據(jù)、個人經(jīng)驗數(shù)據(jù)和公開信息數(shù)據(jù)轉(zhuǎn)化為知識,讓數(shù)據(jù)平臺更加智能化,同時能將AI PC端和云端資源聯(lián)動,確保數(shù)據(jù)安全性。個人經(jīng)驗數(shù)據(jù)的知識轉(zhuǎn)化和不斷的模型微調(diào)讓知識庫建設(shè)更具個性化。

TKS是一套全流程、端到端的知識圖譜構(gòu)建工具集,涵蓋了知識模型定義、多源異構(gòu)數(shù)據(jù)接入、概念與物理數(shù)據(jù)映射、多元化知識的抽取融合、全自動知識構(gòu)建、圖譜綜合查詢等功能,能夠幫助政務(wù)、工業(yè)、能源等多領(lǐng)域客戶高效構(gòu)建領(lǐng)域知識體系,并提供智能應(yīng)用的場景定制化和一站式解決方案。

第三,大模型基礎(chǔ)服務(wù)Infinity和LLMOps,讓大模型快速落地。

在行業(yè)大模型發(fā)展中,企業(yè)面臨技術(shù)復(fù)雜、數(shù)據(jù)和算力稀缺、管理成本高等挑戰(zhàn),已經(jīng)意識到必須建立自己的AI基礎(chǔ)設(shè)施,從而能夠自己對模型進行預(yù)訓練、微調(diào)等。

星環(huán)科技推出大模型運營平臺Transwarp Sophon LLMOps,提供一站式企業(yè)級大模型生產(chǎn)及應(yīng)用全流程開發(fā)工具鏈,助力企業(yè)完成從預(yù)訓練到微調(diào),到強化學習,到持續(xù)模型評估的全生命周期,讓每個企業(yè)都能構(gòu)建自己的專屬大模型。

星環(huán)科技全面戰(zhàn)略升級!幫企業(yè)高效構(gòu)建AI Infra,助攻大模型快速落地

一個Sophon LLMOps平臺可解決企業(yè)在大模型時代語料、模型、應(yīng)用三類資產(chǎn)的持續(xù)積累和加速迭代。

星環(huán)科技自主研發(fā)的無涯大模型Infinity主要功能包括智能問答、文檔問答、智能寫作等,具備自主可控特性,在確保數(shù)據(jù)安全的同時,通過0-1預(yù)訓練,可為各行業(yè)量身定制自有大模型,提供強大的意圖理解、語義召回、數(shù)據(jù)處理和分析能力。

基于無涯大模型底座,星環(huán)科技微調(diào)了三款垂類大模型,包括問答大模型、數(shù)據(jù)分析(代碼生成)大模型、多模態(tài)大模型,以應(yīng)對內(nèi)容生成、數(shù)據(jù)分析圖片及音視頻理解及檢索等多樣的使用場景。

星環(huán)無涯大模型Infinity提供了靈活的部署模式,包括私有化部署(AIPC版、企業(yè)版)、公有云服務(wù)等,提升了大模型數(shù)據(jù)分析能力,在語法正確性、數(shù)據(jù)庫方言、語義正確性等方面有重要突破,能夠精準問答,減少大模型幻覺,并通過多模數(shù)據(jù)來源來提升回答豐富度,通過構(gòu)建自有知識庫來確保企業(yè)數(shù)據(jù)安全。

六、Data Infra產(chǎn)品與服務(wù)持續(xù)完善

星環(huán)科技在推出全新的AI Infra的同時,也在不斷完善Data Infra產(chǎn)品與服務(wù)。

星環(huán)大數(shù)據(jù)云平臺推出TDC 5.0,將原來的多個TDH集群統(tǒng)一納管,統(tǒng)管多個TDH集群,形成物理上分散、邏輯上統(tǒng)一的企業(yè)級一體化大數(shù)據(jù)平臺。

TDC 5.0的優(yōu)勢包括多集群及其基礎(chǔ)設(shè)施、多數(shù)據(jù)應(yīng)用實例統(tǒng)一管理;跨多集群統(tǒng)一調(diào)度資源,均衡多個集群資源使用;跨集群共享存儲組件,實現(xiàn)NoCopy的跨集群數(shù)據(jù)共享;隔離和控制資源配額,快速、靈活地為不同業(yè)務(wù)部門提供多租戶的PaaS服務(wù)。

星環(huán)科技推出了分布式交易型數(shù)據(jù)庫KunDB 4.0,提升了高可用能力與Oracle兼容性,支持跨系統(tǒng)多租戶部署。

星環(huán)大數(shù)據(jù)開發(fā)工具TDS 4.0,增加了數(shù)據(jù)實時同步、數(shù)據(jù)入湖向?qū)?、智能化?shù)據(jù)資產(chǎn)盤點、數(shù)據(jù)資產(chǎn)門戶、數(shù)據(jù)服務(wù)編排等功能。

星環(huán)大數(shù)據(jù)安全與隱私保護工具軟件Transwarp Defensor致力于幫助企業(yè)建設(shè)以數(shù)據(jù)為中心的數(shù)據(jù)安全防護體系,包括了解內(nèi)部敏感數(shù)據(jù)分布情況,能夠幫助管理者發(fā)現(xiàn)潛在風險、監(jiān)管重要數(shù)據(jù)的合規(guī)合理使用等。Transwarp Defensor 4.5,增加了大模型核心資產(chǎn)識別、數(shù)據(jù)資產(chǎn)流轉(zhuǎn)鏈路監(jiān)控、安全策略智能推薦,安全風險預(yù)警與應(yīng)急響應(yīng)。

星環(huán)數(shù)據(jù)要素流通平臺Transwarp Navier通過提供隱私計算環(huán)境,使得數(shù)據(jù)供需雙方可以進行安全的數(shù)據(jù)交易。Transwarp Navier 3.1新增了全鏈路智能合約確保安全合規(guī)、數(shù)據(jù)流通全鏈路行為監(jiān)控與分析、實時告警與阻斷等。

結(jié)語:大模型成為企業(yè)核心能力,新型AI Infra生態(tài)走向繁榮

孫元浩談道,大模型技術(shù)已快速融入企業(yè)生產(chǎn)經(jīng)營的方方面面,在企業(yè)生產(chǎn)效率提升、業(yè)務(wù)職能提效和行業(yè)應(yīng)用場景創(chuàng)新中無處不在,不但重構(gòu)產(chǎn)業(yè),打造企業(yè)的核心競爭力,而且成為企業(yè)的基礎(chǔ)設(shè)施和核心能力,助力企業(yè)打造新質(zhì)生產(chǎn)力。

如今頂尖基礎(chǔ)模型參數(shù)量達到千億級,基于MoE架構(gòu)的稀疏大模型更是達到萬億參數(shù),再加上大模型及生成式AI進入廣泛落地階段,迫切需要發(fā)展新型AI基礎(chǔ)設(shè)施來滿足對算力資源、高性能計算及存儲、數(shù)據(jù)管理、安全可靠、可解釋性等方面的嚴苛要求。

高質(zhì)量的語料資源、高效率AI基礎(chǔ)設(shè)施已成為訓練和部署大模型的關(guān)鍵。星環(huán)科技一系列AI Infra工具及Data Infra產(chǎn)品與服務(wù)的推出,為企業(yè)和機構(gòu)提供了更加全面、易用、安全的開發(fā)利器,有助于幫企業(yè)高效構(gòu)建和管理知識庫、加速實現(xiàn)大模型落地部署,提升數(shù)據(jù)處理、價值挖掘和業(yè)務(wù)決策的效率。