智東西(公眾號:zhidxcom)
作者 | 江宇
編輯 | 漠影

AI很聰明,但記性很差。

你大概也遇到過這樣的場景:第一輪對話里告訴智能客服“我對海鮮過敏”,聊到第十輪,它卻依然熱情推薦海鮮自助。

在企業(yè)服務(wù)里,用戶換一個(gè)渠道、換一個(gè)Agent,之前提供的信息就像從沒出現(xiàn)過一樣,用戶體驗(yàn)被“AI的健忘癥”一再打斷。

對于正在大規(guī)?!吧显啤焙汀吧螦I”的企業(yè)來說,這是每天都會(huì)撞上的真實(shí)業(yè)務(wù)問題:模型上下文窗口有限,多Agent之間形成“記憶孤島”,語義歧義和知識(shí)遺忘在長鏈路服務(wù)中被不斷放大。

如果不能讓AI持續(xù)記住用戶、記住業(yè)務(wù)現(xiàn)場,再強(qiáng)的大模型也很難扛起真實(shí)的服務(wù)指標(biāo)。

這種痛點(diǎn)在全球云廠商的實(shí)踐中已經(jīng)被驗(yàn)證。亞馬遜云科技在今年的Agentic AI基礎(chǔ)設(shè)施實(shí)踐經(jīng)驗(yàn)系列中專門拿出一篇,討論大模型在“記憶”上的先天缺陷,并提出要在Agent體系里單獨(dú)建設(shè)記憶模塊,區(qū)分短期記憶和長期記憶,將“記憶”從附屬能力升級為Agentic AI基礎(chǔ)設(shè)施的一部分。

亞馬遜Agent克服遺忘的“秘訣”,被中國團(tuán)隊(duì)掌握,讓大模型遺忘率趨近于0

▲亞馬遜AWS官方博客

在海外巨頭已經(jīng)將“記憶系統(tǒng)”提升到基礎(chǔ)設(shè)施層的同時(shí),國內(nèi)也開始出現(xiàn)以記憶為主線構(gòu)建產(chǎn)品和架構(gòu)的團(tuán)隊(duì)。

紅熊AI便是其中之一。公司成立于2024年,圍繞多模態(tài)大模型與記憶科學(xué)開展研發(fā),并將這些能力用于為企業(yè)提供智能客服、營銷自動(dòng)化與AI智能體服務(wù)。

12月1日,紅熊AI正式發(fā)布記憶科學(xué)開源產(chǎn)品“記憶熊”(Memory Bear)。

這套系統(tǒng)已接入紅熊AI自研的Agent互動(dòng)服務(wù)平臺(tái),并在原有客服、營銷、教育等多個(gè)業(yè)務(wù)場景中完成了落地。平臺(tái)數(shù)據(jù)顯示,單日最大AI接待量約35萬次,AI自助解決率達(dá)98.4%,人工替代率達(dá)到70%。在接入記憶熊后,多輪對話的token消耗下降97%,大模型知識(shí)遺忘率被壓至0.1%以下與此同時(shí),紅熊AI的業(yè)績也從最初預(yù)期的3000萬元,上調(diào)至1.9億元。

目前,紅熊AI已將記憶熊的核心框架開源,并上線官網(wǎng)MemoryBear.AI,希望把“記憶”做成一項(xiàng)可以被開發(fā)者與企業(yè)直接調(diào)用的基礎(chǔ)能力。

亞馬遜Agent克服遺忘的“秘訣”,被中國團(tuán)隊(duì)掌握,讓大模型遺忘率趨近于0

▲“記憶熊”官網(wǎng)MemoryBear.AI

在國內(nèi)Agent落地還以“問答和工具調(diào)用”為主流路徑的當(dāng)下,紅熊AI算是較早一批把“記憶架構(gòu)”單拎出來做成獨(dú)立產(chǎn)品、并在真實(shí)業(yè)務(wù)場景里跑通指標(biāo)的團(tuán)隊(duì)之一。

一、AI的“記憶缺失”,難以支撐企業(yè)智能服務(wù)

在紅熊AI接入的多個(gè)客服與營銷項(xiàng)目中,其團(tuán)隊(duì)很快發(fā)現(xiàn)一個(gè)共性:不補(bǔ)上“記憶”這一塊,再強(qiáng)的大模型也難以在B端場景中穩(wěn)定扛住業(yè)務(wù)指標(biāo)。

紅熊AI發(fā)現(xiàn),最先暴露出來的是單模型層面的知識(shí)遺忘。大模型依賴有限的上下文窗口來“記住”當(dāng)前對話,早期信息會(huì)在長對話中被不斷擠出,靜態(tài)知識(shí)庫也無法吸收用戶在對話中補(bǔ)充的個(gè)性化信息。

此外,注意力機(jī)制天然存在“近因效應(yīng)”,越靠后的信息越容易被模型抓住,越往前的細(xì)節(jié)越容易被忽略,這就造成了典型的“答完就忘”。同一個(gè)用戶重復(fù)強(qiáng)調(diào)過幾次的偏好和限制條件,只要跨過一定輪次,很容易在后續(xù)回答中消失。

亞馬遜云科技在今年的Agent記憶實(shí)踐文章里也做了類似總結(jié):LLM本質(zhì)是無狀態(tài)的,每次調(diào)用都是一次新的推理,長上下文不僅不能徹底解決記憶問題,反而會(huì)帶來性能下降和Token成本攀升,這一點(diǎn)和紅熊在項(xiàng)目中的經(jīng)驗(yàn)總結(jié)是高度一致。

其次是多Agent之間的記憶斷層,咨詢、售后、推薦等Agent都會(huì)各自維護(hù)獨(dú)立記憶,切換時(shí)狀態(tài)將無法完整繼承,容易引發(fā)決策沖突。

第三類問題來自語義層面的歧義與行業(yè)術(shù)語。企業(yè)服務(wù)里的表達(dá)往往是口語化、多語言混用且高度依賴上下文的,具體指向什么,必須結(jié)合歷史對話才能解釋清楚。如果模型只能在當(dāng)前輪次里做模式匹配,很容易給出模棱兩可甚至錯(cuò)誤的回復(fù)。

正是在這種背景下,紅熊AI意識(shí)到,“記憶”需要被單獨(dú)抽象為一套可設(shè)計(jì)、可治理的系統(tǒng)能力。

與AWS在Agent框架中加入專門記憶模塊的思路類似,紅熊團(tuán)隊(duì)選擇從“重構(gòu)記憶系統(tǒng)”入手,把“記性好不好”這件事交給一塊獨(dú)立的基礎(chǔ)設(shè)施來負(fù)責(zé)。在模型之外再造一套獨(dú)立、可控、可審計(jì)的記憶系統(tǒng),這也是記憶熊的起點(diǎn)。

二、從記憶到認(rèn)知,記憶熊如何把“類人記憶”做成底層能力

記憶熊沒有從堆疊更多參數(shù)入手,而是先把“人怎么記東西”這件事拆開:先搞清楚人類記憶的分類,再去給AI搭一套對應(yīng)的記憶架構(gòu)。

從記憶科學(xué)出發(fā),記憶熊把人類感知記憶、工作記憶、顯性記憶、隱性記憶、情緒記憶逐一映射到AI的多模態(tài)輸入緩存、短期任務(wù)內(nèi)存、結(jié)構(gòu)化知識(shí)庫、行為習(xí)慣模塊和情感加權(quán)記憶等組件。

亞馬遜Agent克服遺忘的“秘訣”,被中國團(tuán)隊(duì)掌握,讓大模型遺忘率趨近于0

▲人類記憶與記憶熊的記憶映射

簡單來說,看到什么、當(dāng)下在處理什么、長期知道些什么、習(xí)慣怎么做決策、以及對不同事件“在意程度”有多高,都會(huì)在系統(tǒng)里有各自的位置和處理方式。

在此基礎(chǔ)上,記憶熊把“人是如何記東西”的認(rèn)知科學(xué)抽象成一整套可工程化的記憶架構(gòu):從多模態(tài)采集出發(fā),到結(jié)構(gòu)化圖譜,再到分級審核與在線應(yīng)用。

亞馬遜Agent克服遺忘的“秘訣”,被中國團(tuán)隊(duì)掌握,讓大模型遺忘率趨近于0

▲Memory Bear . AI記憶熊在線應(yīng)用

企業(yè)可以像接入數(shù)據(jù)庫一樣,為自身的AI系統(tǒng)接入一塊可控、可演進(jìn)的“記憶大腦”。

三、從客服到教育,記憶讓AI大幅度提高在業(yè)務(wù)中的價(jià)值

從紅熊AI披露的項(xiàng)目數(shù)據(jù)看,它已經(jīng)實(shí)打?qū)嶍斪×似髽I(yè)每天幾十萬次交互的業(yè)務(wù)現(xiàn)場。

其Agent互動(dòng)服務(wù)平臺(tái)在激烈競爭壓力下,保持了較高的穩(wěn)定性和服務(wù)質(zhì)量:單日最大AI接待量達(dá)到35萬次,AI自助解決率達(dá)98.4%,人工替代率達(dá)70%,復(fù)雜問題自動(dòng)路由率達(dá)91.7%,模型幻覺率低于0.2%,業(yè)務(wù)回答準(zhǔn)確率穩(wěn)定在99%左右。

亞馬遜Agent克服遺忘的“秘訣”,被中國團(tuán)隊(duì)掌握,讓大模型遺忘率趨近于0

▲紅熊AI Agent互動(dòng)服務(wù)平臺(tái)實(shí)踐效果

這些核心指標(biāo)也反映出“記憶”在提升服務(wù)連續(xù)性與一致性方面已發(fā)揮出一定的作用。

技術(shù)評估上,記憶熊同樣展現(xiàn)出明顯優(yōu)勢。根據(jù)LOCOMO數(shù)據(jù)集測試結(jié)果,記憶熊在單跳、多跳、開放域以及時(shí)序類任務(wù)中的F1、BLEU與Judge分?jǐn)?shù)均優(yōu)于Mem0、Zep、LangMem等主流記憶方案,整體性能處于領(lǐng)先。

在具體行業(yè)場景中,紅熊AI的能力也通過多個(gè)典型應(yīng)用得到驗(yàn)證。從智能客服、營銷自動(dòng)化到教育輔導(dǎo)、企業(yè)內(nèi)部知識(shí)管理等場景中,記憶熊通過跨會(huì)話、跨角色、跨渠道的統(tǒng)一記憶體系,讓Agent始終保持連貫理解與穩(wěn)定決策。

在生態(tài)層面,記憶熊已將核心框架開源至Github,并上線官網(wǎng)MemoryBear.AI,希望與開發(fā)者共同完善記憶科學(xué)技術(shù)體系。

隨著Agent化應(yīng)用越來越多、企業(yè)對“可控記憶”和“組織記憶中樞”的需求增強(qiáng),像記憶熊這樣的記憶平臺(tái)有機(jī)會(huì)成為AI基礎(chǔ)設(shè)施的一環(huán)。

結(jié)語:記憶,能讓AI變得更“有用”

紅熊AI在記憶科學(xué)上的進(jìn)展,把長期被忽視的“記憶”能力打造為可直接依賴的基礎(chǔ)設(shè)施:一端承接多模態(tài)大模型和Agent的推理與生成能力,一端對接企業(yè)真實(shí)的業(yè)務(wù)流程與長期信息,使模型不再在每次交互中從零開始。

對行業(yè)而言,補(bǔ)上“記憶”這一塊,大模型的表現(xiàn)將不再單一受限于上下文長度,而是由一套可持續(xù)積累、可持續(xù)調(diào)用的結(jié)構(gòu)化記憶體系來支撐,使其在復(fù)雜的任務(wù)中保持更穩(wěn)定的有效性。

隨著多模態(tài)大模型、Agent框架與記憶科學(xué)不斷融合,“記憶”這條技術(shù)主線會(huì)向更高層次的能力延展,讓AI從短暫回應(yīng)的工具,逐步演化為能理解、能延續(xù),也能長時(shí)間工作的系統(tǒng)。

AI從“能回答”邁向“長期記憶、持續(xù)反饋”的那一步,很可能就建立在這塊看不見卻持續(xù)發(fā)揮作用的記憶基座之上。