智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月11日報道,今天,美團龍貓LongCat發(fā)布原生“深度研究”智能體了,還是發(fā)揮美團的傳統(tǒng)藝能,主打“AI+本地生活”。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

這個“LongCat深度研究”新功能,目標是成為一個專業(yè)且更懂用戶的吃喝玩樂全攻略AI助手。

它能通過調(diào)用真實工具鏈,完成復雜的生活服務搜索與規(guī)劃任務,生成詳盡報告。

比如對比餐廳、做美食攻略、規(guī)劃路線、避坑預警,乃至制定一份超詳細的自駕游行程。

我體驗后最直接的感受,就生成報告速度快、對比直觀,而且比我自己拍腦袋想的周全多了。

一些我自己做計劃時可能忽略的細節(jié),AI都能考慮到位。比如下面這張表,就是“LongCat深度研究”花幾分鐘生成的報告里自主涵蓋的。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

這背后的底層優(yōu)勢,是美團在本地生活領域長期沉淀的數(shù)據(jù)與行業(yè)積累。

推薦的餐廳,參考美團真實的消費熱度和口碑;推薦的酒店,源自真實的入住評價;景區(qū)路線規(guī)劃,有真實票務數(shù)據(jù)、實時客流監(jiān)測和官方信息做支撐;連充電樁都直連美團接入的實時樁源。

所以,“LongCat深度研究”通過多源真實信息進行分析,生成的結果要更加靠譜。

檢驗也非常便利。報告底部的餐廳、酒店、景點鏈接都能點擊,點開就是對應的大眾點評頁面或參考攻略頁面,可以感受到整個設計完全是從用戶體驗出發(fā)。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

每次研究都會告知大概需要的時長,我每次都只等了幾分鐘。

除了吃喝玩樂外,“LongCat深度研究”也可以用來做學習和工作相關的分析研究,既能分析互聯(lián)網(wǎng)大廠Agent產(chǎn)品,又能整理春節(jié)AI紅包和機器人登春晚戰(zhàn)況。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

“LongCat深度研究”功能在LongCat網(wǎng)頁端已上線,目前一天能用10次。

Web端指路:longcat.ai/

LongCat App安卓版本已上線“探索本地生活”功能,iOS版本即將上線該功能。

同時,LongCat團隊披露了使其深度研究功能更靠譜、更好用、更專業(yè)的三大核心技術。其中在權威評測BrowseComp(加上下文管理)中,“LongCat深度研究”的性能已逼近頂級閉源模型。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

我體驗了挑選餐廳、旅游規(guī)劃、自駕攻略、嚴肅研究等幾種不同日常需求,供參考:

一、挑選餐廳:核心訴求拉表分析,關鍵信息劃重點

跟多數(shù)深度功能一樣,“LongCat深度研究”在收到指令后,不會立即開始執(zhí)行任務,而是先通過幾個問題,再次確認用戶需求,然后才開始推理。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

我提出的要求是:

過年留在北京,想要和父母吃一頓清淡又豐盛的跨年晚飯,幫我精選幾家餐廳并詳細對比

好吃為主,優(yōu)先海淀,性價比高,飲食偏好健康,傾向于交通便利、對菜品的好評度高

它會一次性生成文件和網(wǎng)頁形式的兩份報告。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

兩種形式均可下載。文件版暫時只支持下載Markdown格式,下載Word和PDF格式還未開放。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

網(wǎng)頁形式的交互頁面非常直觀好用,右側可以在目錄導航上點選感興趣的內(nèi)容,而且有大量直觀清晰的表格。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

在給我生成的報告中,內(nèi)容既有一目了然的6家推薦餐廳省流版總結,又有對不同菜系多家餐廳地理位置、環(huán)境特色、人均消費、環(huán)境特色、營業(yè)時間、推薦菜品的劃重點,并且貼心地附上預訂指南和注意事項。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

每一章節(jié)都放上了推薦餐廳橫向對比總結:

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

各類菜系分析完后,還有個整體的推薦餐廳對比:

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

它還準備了停車建議和交通特別提示,并提供了預訂策略和對長輩健康飲食的建議。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

最后一頁又是一份直觀的快速決策指南。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

做出這么一份完整的報告,總共只花了幾分鐘,效率驚人。

報告最后有攻略參考列表,每一條都能點開跳轉到對應的大眾點評頁面。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

不過隨后出現(xiàn)了一個bug。當我在同一個對話框提出新的要求時,“LongCat深度研究”受前面的上下文影響,規(guī)劃出現(xiàn)了混亂。

我讓它生成一家老少春節(jié)去東北玩的旅游行程規(guī)劃,結果它生成的報告主題還是《北京海淀區(qū)跨年晚餐餐廳精選》。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

重新打開一個對話窗口,問題就解決了。

好的地方是,新報告做的更加細致和豐富,餐廳關鍵信息的呈現(xiàn)更突出。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

還有單獨的性價比分析、適老性評估、停車建議對比。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

二、旅游規(guī)劃:行程時間線清晰,還有消費避坑指南

我打開了一個新的對話窗口,提出旅游規(guī)劃要求:

一家老少計劃過年去東北玩一周,預算3萬,飛機和或策劃都考慮,想要住對老人小孩都方便的酒店,想要把東北特色景點或者風土人情都體驗了

成人4位,包括2位老人,小孩2個,春節(jié)期間出發(fā),只要是當?shù)靥厣几信d趣,就是普通老人和小孩的需求和身體狀況

生成的報告也像模像樣,有種白嫖專業(yè)旅游公司的既視感。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

和挑選餐廳一樣,報告上來就先給省流版建議,包括目的地、核心景點、推薦活動、特色美食、交通方式和最佳季節(jié)。

接著就是針對旅行策略、預算分析、穿衣建議、行程規(guī)劃、住宿交通解決方案、特色美食地圖的詳細分析,還有貼心的消費避坑指南與應急預案。

不僅有一張完整形成規(guī)劃圖:

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

還細化到每天的行程規(guī)劃:

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

經(jīng)搜官網(wǎng)核查,冰雪大世界的門票價是對的。

酒店推薦、美食地圖也非常清晰地標出價位。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

從穿衣建議、電子設備防寒、消費避坑提醒到應急預案信息,都考慮得很周全。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

三、自駕攻略:周密考慮天氣和加油站分布,連怎么做決策都手把手教

針對自駕場景,我提出的要求是:

下周一和朋友自駕游去北京郊區(qū)自然景點游玩,幫我規(guī)劃三天的游玩路線,景點要各有各的特色,每條路線上要有加油站、餐廳、超市,每日往返開車時間不超過3小時

北京郊區(qū),住宿地點兩種方案都考慮,只要是自然景點都行,要有方便停車的地方

報告上來先總結了三天天氣預報,不過把日期搞錯了,下周一是2月16日,它寫成了2月17日。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

同樣先給出一個路線總覽,然后再詳細規(guī)劃每日行程,包括核心景點的各類門票費用和建議時長、自駕路況和預計通勤時長、美食推薦,有的行程還提供多種方案選擇。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

連如何做選擇,都手把手教學。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

最后還給出多條路線的沿途加油站分布及建議,并附上車輛準備、旅行裝備的清單。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

四、嚴肅研究:專業(yè)分析信息豐富,聯(lián)網(wǎng)搜索時效性強

我還讓“LongCat深度研究”研究現(xiàn)有互聯(lián)網(wǎng)大廠Agent產(chǎn)品/功能及營銷方式的共性與區(qū)別,分析這些打法預計帶來的收益、成本等影響,要求越全面越好。

它生成的報告覆蓋戰(zhàn)略布局、營銷戰(zhàn)局、商業(yè)影響、未來展望等章節(jié)。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

報告挑了美團、字節(jié)跳動、阿里巴巴、騰訊、百度、快手做對比,并毫不客氣地把美團放在最前面。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

營銷戰(zhàn)局分析中,數(shù)據(jù)很新,涵蓋了近期的春節(jié)紅包大戰(zhàn)。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

不過在后面分析商業(yè)影響和影響展望時,就完全放在宏觀行業(yè)層面,沒有聚焦這幾家互聯(lián)網(wǎng)大廠去做分析。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

最后,報告列出5條結論,中國互聯(lián)網(wǎng)巨頭的AI Agent之戰(zhàn)上價值。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

五、吃喝玩樂攻略靠譜性,超過其它主流AI產(chǎn)品

LongCat組織了來自全國數(shù)十個城市的眾多用戶參與吃喝玩樂攻略的橫向盲測。

題目覆蓋從國內(nèi)外熱門旅游城市到四五線城市,讓各地用戶對熟悉的城市攻略進行評價,以獲得真實判斷。

調(diào)查結果顯示,在衡量攻略有用性的“保存分享率”指標中,LongCat占比達到31.1%,位居第一,超過ChatGPT的16.7%。

在判斷攻略可用程度的“整體可用率”指標中,LongCat占比更是高達61.1%,高于ChatGPT(42.8%)等其他主流AI產(chǎn)品。

六、怎么做到的?背后三大核心技術揭秘

“LongCat深度研究”背后有三大核心成果的支撐:

(1)智能體搜索能力卓越:在權威評測BrowseComp(加上下文管理)中達到73.1分,性能已逼近頂級閉源模型,具備行業(yè)領先的復雜任務決策與推理能力。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

(2)超長程、高并發(fā)任務處理能力:支持最多400輪交互與256K上下文,能持續(xù)理解并拆解極端復雜的個性化需求與長文檔研究。

(3)多智能體專業(yè)化分工閉環(huán):實現(xiàn)從“信息收集(Search Agent)→ 研究分析(Report Agent)→ 可視化呈現(xiàn)(Render Agent)”的全程自動化工作流,交付即用型專業(yè)報告。

1、真實場景+科學訓練,讓AI更懂生活

(1)真實原生的本地生活訓練環(huán)境:依托美團在本地生活領域的原生能力,搭建了一套覆蓋POI搜索、地圖路線規(guī)劃、評論/筆記檢索的真實工具集,讓Agent在與真實環(huán)境的交互中完成訓練。

這一方式確保了訓推環(huán)境的一致性,使Agent在訓練階段即可感知真實場景的復雜性與多變性,從而有效提升其在線上處理實際任務時的表現(xiàn)。

(2)基于Rubrics的高質量數(shù)據(jù)合成:由專家依據(jù)美團本地生活真實業(yè)務數(shù)據(jù)提煉餐廳推薦、旅行規(guī)劃等場景及需求點,整合為系統(tǒng)的Rubrics(評價準則)體系,再通過LLM生成具體Rubrics組合,反向合成高質量Query與Trajectory,最終以Rubrics-as-Reward篩選Trajectory用于SFT與強化訓練。

這一方式將美團本地生活經(jīng)驗注入模型訓練,更好地對齊用戶偏好,讓Agent更懂用戶。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

2、智能生成+自適應渲染,交付清晰好用的專業(yè)報告

(1)“全局規(guī)劃-遞歸生成”的長文構建機制:采用multi-stage漸進式生成架構,先基于全網(wǎng)搜索摘要生成全局“報告大綱”,確保邏輯框架的嚴密性;隨后通過“遞歸生成”(Recursive Generation)策略,將當前章節(jié)大綱、相關搜索文檔與前序章節(jié)上下文聯(lián)合輸入,逐章撰寫。

這一機制有效解決了長文本生成中的邏輯斷層與上下文遺忘問題,既保證了報告的全局連貫性和低幻覺率,又實現(xiàn)了針對特定子話題的深度信息挖掘。

剛剛,美團祭出智能體大招!承包過年吃喝玩樂全攻略

(2)端到端自適應網(wǎng)頁渲染:摒棄傳統(tǒng)的模板填充模式,采用端到端生成技術直接輸出渲染結果。Render Agent能夠理解報告內(nèi)容的語義結構,動態(tài)決定最佳的視覺呈現(xiàn)形式(如自動生成對比表格,決策流程圖或數(shù)據(jù)可視化圖表),讓本地生活信息的呈現(xiàn)從“靜態(tài)文本”進化為“可視化界面”,大幅提升了用戶獲取探店、旅行規(guī)劃等生活決策信息的效率與體驗。

3、多維校驗+跨域融合,確保精準可信的解析與規(guī)劃能力

(1)Rubrics-as-Reward的多維價值對齊:在數(shù)據(jù)清洗與強化學習階段,引入Rubrics-as-Reward機制,建立了包含引用準確率、信息召回率、報告深度、指令遵循度及可讀性在內(nèi)的多維評分體系,對訓練數(shù)據(jù)進行極高標準的清洗與篩選。

這一機制解決了AI搜索產(chǎn)品常見的“幻覺”問題,特別強調(diào)引用準確率,確保每一條本地生活建議(如營業(yè)時間、價格、地址)都有據(jù)可查。

(2)跨域知識融合的合版訓練策略 :采用混合訓練策略,將Report與Render的垂直領域數(shù)據(jù),與通用語料、數(shù)學、代碼等數(shù)據(jù)進行聯(lián)合訓練,利用代碼和數(shù)學數(shù)據(jù)的嚴謹邏輯特征,反向增強生活類報告生成的條理性與任務規(guī)劃能力。

通過“通專結合”,該策略將理工科的強大邏輯推理能力注入到生活決策場景中,使Agent能像分析師一樣 “拆解復雜需求”。

結語:專業(yè)的AI深度研究功能,正逐漸走入尋常百姓家

多家互聯(lián)網(wǎng)大廠正在探索結合自身優(yōu)勢的Agent產(chǎn)品。今天上線的“LongCat深度研究”功能,聚焦于如何讓AI真正理解并解決現(xiàn)實世界的問題,發(fā)揮出美團在生活場景中的專長。

隨著越來越多貼近生活、準確度高的Agent應用上線,AI深度研究的能力將普惠到更多人群,讓工作效率更高,也讓生活更加便利和美好。