智東西(公眾號:zhidxcom)
作者 | 駿達 江宇
編輯 | 漠影

智東西1月10日報道,今天,清華大學基礎模型北京市重點實驗室發(fā)起的“AGI-Next”峰會上,多位國內頭部開源AI實驗室的技術掌舵人罕見同場亮相。智譜創(chuàng)始人兼首席科學家唐杰、月之暗面創(chuàng)始人兼CEO楊植麟、阿里千問大模型技術負責人林俊旸和騰訊總裁辦公室首席AI科學家姚順雨等人,就AGI路徑、Scaling極限、Agent落地與中國AI的長期機會等熱點話題,進行觀點的交流和碰撞。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

這場會議長達三個半小時,充滿學術氛圍:沒有主持人串場,沒有冗長的嘉賓介紹,也沒什么場面話,這是唐杰在辦會時有意而為之的。幾位嘉賓的觀點都十分坦誠,聽完之后,我們總結出了以下8個核心觀點:

1、唐杰:Scaling(模型擴展)仍是有效路徑,但可能是“人類最輕松的偷懶方式”。真正值得探索的是讓模型具備自主Scaling能力。

2、唐杰:DeepSeek出來之后,Chat范式的競爭就基本結束了。

3、楊植麟:Scaling Law本質是把能源轉化為智能,核心在于高效逼近智能上限。

4、楊植麟:模型承載的是價值觀與品味,Scaling是技術、數據與審美的共進,探索前沿智能不會因潛在風險而停止。

5、林俊旸:Manus確實很成功,但套殼是不是未來,這本身也是個話題。

6、林俊旸:未來3-5年內中國團隊做到全球領先的概率,在大概20%,這已經是非常樂觀的估計。

7、姚順雨:垂直整合與模型應用分層兩種模式在分化,模型公司做應用不一定更好。

8、張鈸:當前大模型存在指稱、因果等五大根本缺失。他強調AGI應有“可執(zhí)行、可檢驗”的定義,核心是具備多模態(tài)理解、在線學習、可驗證推理等五項能力。

一、智譜創(chuàng)始人唐杰:讓機器像人一樣思考,AGI仍然需要新的模型架構與學習范式

清華大學教授、智譜創(chuàng)始人唐杰圍繞“讓機器像人一樣思考”這一長期目標,系統(tǒng)梳理了他對AGI路徑的判斷。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

1月8日智譜上市當天,唐杰曾在內部信中提到,“直到今天,包括智譜在內,沒有人能夠給出準確的AGI定義以及如何實現AGI的技術路徑,也許這正是探索AGI的魅力所在。

基于這一判斷,唐杰在本次演講中系統(tǒng)性回溯了近年來基座模型智能化水平的演進,并結合中美開源模型的發(fā)展趨勢,對當前大模型所處階段及其面臨的關鍵分岔進行了分析。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

▲基座模型在典型AI基準測試上的能力演進

他回顧了2025年,談及智譜已在語言、視覺、多模態(tài)智能體等方向開源GLM系列模型,助推中國模型首次集體霸榜開源榜單前五。

盡管如此,唐杰也坦言“我們的差距可能還在拉大”,美國閉源模型仍是不可忽視的對手。

唐杰稱,“我們是在開源上面玩了讓自己感到高興的,而差距并沒有像我們想象得那樣好像在縮小。有些地方,我們可能做的還不錯,但我們還要承認自己面臨的一些挑戰(zhàn)和差距。”

那下一步AGI該如何推進,在他看來,需要回到對人類認知學習過程的理解。他認為,面向未來,大模型仍缺失多項關鍵能力,而這些能力在人類身上遠遠超過大模型。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

唐杰談及,“2025年可能是多模態(tài)的適應年??赡苋虺松倭康膸讉€模型,一下子吸引了很多人,包括智譜在內的很多的多模態(tài)模型都沒有引起關注?!?/p>

他將原生多模態(tài)能力類比為人類的“感統(tǒng)”能力,認為這正是模型下一步需要補齊的能力。

其次,唐杰強調,大模型在記憶和持續(xù)學習能力上仍然存在明顯短板。如何構建從個體記憶到人類整體的“第四級記憶系統(tǒng)”,是未來需要為大模型補齊的基礎設施。

在更高層面,唐杰將反思與自我認知視為極具挑戰(zhàn)、但值得探索的方向。

他將這一判斷放入“人類認知框架”中進行解釋,“人類認知是雙系統(tǒng),系統(tǒng)1和系統(tǒng)2。系統(tǒng)1完成了95%的任務……只有更復雜的推理問題……這時候就變成系統(tǒng)2了?!彼J為,大模型同樣需要構建系統(tǒng)1、系統(tǒng)2以及自學習機制的協同。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

系統(tǒng)一依賴大規(guī)模數據和參數的Scaling,系統(tǒng)二則依賴推理、指令微調與思維鏈,而自學習機制則對應人類在無意識狀態(tài)下的持續(xù)學習能力。

但唐杰也明確提到,單純依靠數據和參數規(guī)模的Scaling已逐漸顯露瓶頸,“我們能不能找到更好的知識壓縮的方法,把知識壓縮到更小的空間里面,這是一個新的問題?!?/p>

他認為,Scaling仍然重要,但必須尋找新的路徑,“Scaling是一個很好的辦法,但Scaling可能是最輕松的辦法,是我們人類偷懶的一個辦法。”真正值得探索的,是讓模型具備自主Scaling能力。

而面向真實世界,唐杰認為大模型還必須具備完成超長任務的能力。

最后,唐杰從計算機本體能力出發(fā),給出了總結:“在我看來計算機有三個能力:第一,計算機的表示和計算;第二,編程;第三,本質上是搜索。”他認為,正是這三種能力的疊加,使計算機具備了走向“超級智能”的潛力。

在對2026年的判斷中,唐杰也給出了較為清晰的技術聚焦方向。他直言,“2026年對我來說更重要的是要專注和做一些比較新的東西?!?/p>

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

在他看來,Scaling仍將繼續(xù),但重點正在發(fā)生變化,“已知的是我們不斷加數據、不斷探索上限。還有Scaling未知,就是我們不知道的新的范式是什么。

圍繞這一未知范式,唐杰強調模型架構層面的創(chuàng)新將成為關鍵,解決超長上下文,還有更高效的知識壓縮問題,并會實現知識記憶和持續(xù)學習。

與此同時,多模態(tài)感統(tǒng)被他視為2026年的重點方向之一。只有具備這一能力,AI才能真正進入長任務、長時效的工作環(huán)境,AI才能實現具身,才能進入物理世界。

在應用層面,唐杰也對AI for Science寄予厚望,“我相信今年可能是AI for Science的一個爆發(fā)年,因為很多能力大大提升,我們可以做更多的事情?!?/p>

二、月之暗面楊植麟:Scaling不止堆算力,下一代模型技術、數據與“品味”會共同進化

月之暗面創(chuàng)始人兼CEO楊植麟認為,自2019年以來,大模型始終遵循同一條第一性原理——Scaling Law,本質是“把能源轉化成智能”。在數據與算力受限的背景下,如何用更少投入獲得更高智能,成為核心命題。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

楊植麟強調,Transformer之所以成為主流架構,關鍵在于其更優(yōu)的Scaling表現。

尤其在長上下文場景中,Transformer相較傳統(tǒng)架構展現出明顯優(yōu)勢,而這正是Agent時代的基礎能力。復雜任務必須依賴超長Context,模型的Position Loss越低,Agent潛力就越大。

圍繞這一判斷,Kimi的預訓練策略聚焦兩條主線:Token效率與長上下文能力。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

在token效率層面,團隊提出了改進的Muon優(yōu)化器Moonlight Muon,實現約2倍Token效率提升,并通過QK-Clip解決Logits爆炸問題,支撐萬億參數模型穩(wěn)定訓練。

在長上下文方向,Kimi-Linear與全新的線性注意力機制,在保證效果的同時大幅提升推理速度,為超長Context任務提供現實路徑。

楊植麟認為,更強的模型先驗可以顯著縮小搜索空間,使AGI“更早發(fā)生”。

他同時提出,模型并非普通工具,而是在塑造一種世界觀。他稱,智能是一個Non-Fungible?Token(非同質化通證),它承載著品味、審美與價值觀。Scaling不只是堆算力,更是技術、數據與“品味”的綜合進化。這正是下一代模型K3要做的事情——新架構、更大規(guī)模合成數據、品味提升等等。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

他借用Kimi與他討論時的話總結道:我們不應因風險而停滯,放棄探索,就等于放棄人類文明的上限。

三、阿里林俊旸:從語言模型到具身智能,千問為何走向Generalist Agent

“原來叫Towards a Generalist Model,后來我改成了Generalist Agent。”林俊旸在演講開場解釋了PPT標題的變化。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

他認為,相比模型本身,Agent是一個更大的概念,像人一樣能夠自主使用工具,在環(huán)境中完成任務,這是他理解中AI應該走的方向。

林俊旸稱,今天的大模型訓練方式已不同于以往?!耙郧坝柧毮P途褪桥鋵斎胼敵觥⒓由先斯俗?,這就是傳統(tǒng)的做法?!钡诮裉?,“只要解決了推理,解決了評估,這個東西就可以擴展,很多事情都能做,我也可以發(fā)揮更多想象力?!?/p>

他坦言,“這也是我一個做語言模型的人,最近敢斗膽揚言‘我要做VLA和機器人’的一個小小原因?!?/p>

在講述通義千問技術團隊的下一步方向時,林俊旸概括了三項重點:

第一,是構建具備視覺輸出與推理能力的Omni模型,把能力真正收斂到多模態(tài)模型中,不只是能接收文本、圖像、語音,也要具備同時生成這些模態(tài)的能力。

第二,是從“訓練模型”轉向“訓練Agent”,特別是通過“多輪強化學習和環(huán)境反饋”,實現面向長時任務的推理能力(long-horizon reasoning)。

第三,是把語言模型進一步轉化為具備行動能力的Embodied模型。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

他認為,從這個角度出發(fā),模型才有可能真正走向Digital Agent,能夠進行GUI操作、調用API,形成完整的執(zhí)行閉環(huán),“如果再往物理世界走,能不能拿起話筒、斟茶倒水,這也是我們很想去做的事情?!?/p>

四、模型分化,范式未定:中國AI的領先之路與關鍵瓶頸

圓桌論壇中,唐杰、林俊旸、姚順雨以及加拿大皇家學院院士、香港科技大學榮休教授楊強四人展開觀點交流與碰撞,他們主要聊了四大問題:模型的分化、AI研究的范式轉變、Agent的未來和中國在全球AI競爭中的位置。

(1)模型正在明顯分化:做Coding、做Chat、做全模態(tài),背后的邏輯是什么?

姚順宇稱,自己有兩大感受。一是To-C和To-B明顯發(fā)生分化。如今,行業(yè)里頂尖的To-C產品以ChatGPT為代表,Claude Code則在B端有優(yōu)勢,但ChatGPT的變化對用戶來說沒有很可感,反倒是Coding革命重塑了計算機行業(yè)的行事邏輯。

在To-C領域,模型并不需要極高的智能上限,很多場景更像是“增強版搜索引擎”。真正的瓶頸不在模型本身,而在于如何為模型提供足夠的Context和環(huán)境信息。

在To-B場景中,邏輯完全不同。海外企業(yè)客戶對最強模型的付費意愿更高,在國內做To-B的難度有點大,騰訊的思路是先把自己服務好,讓模型在公司內部發(fā)揮價值。

姚順宇觀察到的另一大分化是垂直整合與模型、應用的分層。他稱自己的老東家OpenAI在Agent應用上,做得并不一定會比應用公司更好。這是由于模型能力與應用能力并不完全一致。

在To-C產品中,模型與產品強耦合、快速迭代,垂直整合是成立的;但在更復雜的To-B或Agent場景,模型變強只是起點,真正落地還需要大量工程與環(huán)境建設。

林俊旸從千問的角度談道,“分化并非選擇,而是自然發(fā)生”。OpenAI做的更像一個To-C平臺型產品,Anthropic與企業(yè)溝通更深,明顯偏B端。他還提到一個現象,中美在Coding Token的消耗量上存在巨大差距,這種差距往往被低估,這困難反映了兩個市場的區(qū)別。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

楊強則從學術界和工業(yè)界的分化切入,他認為在行業(yè)進入穩(wěn)態(tài)后,學術界可以開始解決工業(yè)界還沒來得及解決的問題,有必要做新的探索,拉齊差距。

主持人提到,智譜某種程度上走了Anthropic的道路,無論是Agent研究,還是Coding。不過,唐杰認為,最本質問題還是提高基礎模型的智能上限。

他舉了一個例子,在大模型剛剛興起時,國內企業(yè)爭相研發(fā),但最終發(fā)布后,業(yè)內10來個大模型的用戶其實不多,如今才逐漸分化,原因是這些模型并沒有真正解決問題。

他認為,DeepSeek出來之后,Chat領域的競爭就基本結束了。智譜經過內部討論決定押注編程,傾注了所有的精力。

(2)AI領域下一個范式轉變是什么,從哪兒來?

姚順雨認為,ASI最重要的能力之一是自主學習。但目前的瓶頸不在方法論,而在于數據與任務設計。ChatGPT通過用戶數據擬合人類聊天風格,本質就是一種自主學習;Claude Code里95%的代碼就是由Claude Code自身撰寫的,這也是自主學習。目前外界對模型能力的感知不明顯,只是因為其受限于場景,并且處于漸變的發(fā)展過程中。

林俊旸認為,目前,強化學習的算力遠未充分Scale,Test-Time Scaling與AI Scientist方向都有巨大潛力。未來,模型的個性化、記憶的進步,都可能會給人們帶來能力出現巨大飛躍的“感受”。但是從業(yè)內視角來看,技術發(fā)展沒有很快,做的工作也較為基礎。

楊強提出,聯邦學習與去中心化協作,是解決隱私、資源不均和大模型協同的重要路徑。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

唐杰則從一個更為基礎的角度分析這一問題——范式轉變究竟源自于什么地方?他認為,去年和前年,工業(yè)界快于學術界是一個事實,許多研究者根本沒有算力。但到現在,很多學校已經有了算力,學術界可以開始做大模型研究、探索模型架構,不再是由工業(yè)界主導的狀態(tài)。學術界有創(chuàng)新的基因,會孵化出種子了。

他補充道,創(chuàng)新的動因是現有范式收益效率的下降。繼續(xù)Scaling是“最笨的辦法”,典型的工程做法,而未來探索智能效率也是一大方向。唐杰比較樂觀,認為2026年肯定會有范式轉變的發(fā)生。

(3)2026年,Agent怎么做?

姚順雨觀察到,Agent賽道同樣出現了B端和C端產品的分化。To B方向已經進入持續(xù)上升通道,且短期內看不到放緩跡象。它并不依賴花哨的創(chuàng)新,而是通過不斷擴大預訓練規(guī)模、扎實做好后訓練,把真實世界任務吃透,模型就會自然變得更聰明,并直接轉化為更高的生產力和商業(yè)價值。

在To B場景下,模型智能、任務覆蓋和收益之間高度正相關,目標極其一致。相比之下,To C中模型能力與DAU等產品指標往往弱相關甚至負相關,反而更難聚焦。

當前To B的生產力型Agent仍處早期階段,下一步關鍵在于環(huán)境與部署,而非模型本身。即使模型停止進化,僅靠大規(guī)模落地部署,也可能帶來10–100倍效率提升,對GDP產生顯著影響。

林俊旸認為,Agent的發(fā)展本質上是一個產品哲學問題。他直言:“Manus確實很成功,套殼是不是未來,這本身也是個話題”。

他更認同“模型即產品”的方向。未來的Agent不應只是外部應用,而是模型本身直接承擔產品能力,研究人員也需要像產品經理一樣,把研究成果做成真實世界可用的系統(tǒng)。

隨著主動學習的發(fā)展,Agent將具備長時間托管式工作的能力,在執(zhí)行通用任務的過程中自行進化、決定行動路徑,這對模型能力上限提出了極高要求,也意味著做基礎模型本身就是在做產品。

進一步來看,Agent的潛力還取決于其與環(huán)境的交互深度,目前主要停留在數字環(huán)境中,未來若能進入真實物理世界、結合機器人與實驗系統(tǒng),才可能真正承擔長周期、高價值任務。

關于通用Agent的機會歸屬,林俊旸認為取決于是否能解決長尾問題:若創(chuàng)業(yè)者是“套殼高手”,在產品層面能做得比模型公司更好,那仍有機會;否則模型公司憑借算力、數據和強化學習,往往能更快覆蓋這些問題。

楊強認為,Agent的核心分化在于“目標”和“規(guī)劃”是否由AI自主完成。他指出,當前階段“目標也是人定義的,規(guī)劃也是由人來做的”,仍然非常初級。真正成熟的Agent,應當能夠通過觀察人類工作、充分利用數據,最終成為由大模型內生的原生系統(tǒng)。

唐杰則強調Agent能否成立取決于價值、成本和速度三點。首先,關鍵在于Agent本身有沒有解決實際問題,否則很容易被簡單的prompt或API替代。

其次是成本約束,如果成本特別大,也是一個問題。最后是時間窗口“如果能拉開半年的時間窗,迅速把應用做出來,才可能形成優(yōu)勢。

在他看來,大模型競爭已進入拼速度、拼時間的階段,Agent等應用仍是方向,但成敗取決于執(zhí)行效率。

(4)3-5年后,中國團隊成為全球最領先的AI團隊的概率有多大,文化、關鍵條件還差在哪兒?

姚順雨認為,中國在工程能力、產業(yè)化和人才密度上具備顯著優(yōu)勢,一旦技術范式被驗證,往往能以更高效率追趕甚至局部超越,未來領先的概率很大。目前的關鍵瓶頸在于算力、光刻機與軟件生態(tài),以及To B市場和國際商業(yè)環(huán)境。

同時,他強調中國真正需要突破的是能否引領“新范式”,這依賴更多敢于長期探索、容忍不確定性的研究文化,而非過度依賴榜單與短期確定性成果。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

林俊旸相對謹慎,他認為中美在算力規(guī)模和研究資源投入上仍存在巨大差距,美國算力要多1-2個數量級。美國能將大量算力用于下一代前沿研究,而他稱國內的交付工作就已經占據了很多算力。

但他也認為“窮則生變”,軟硬件協同、模型與芯片共設計可能孕育新機會。他認為未來3-5年內中國團隊全球領先的概率在大概20%,并且這已經是非常樂觀的估計。

不過,他并不恐懼這種差距,而是建議業(yè)內保持冷靜的心態(tài),并回歸初心,考慮模型能為人類社會帶來什么價值。他稱,就算自家模型不是最強的也能接受。

楊強從歷史視角出發(fā),認為中國在互聯網與應用層曾實現快速追趕,AI作為通用技術同樣具備潛力,尤其在To C領域百花齊放,To B也將通過工程化與知識遷移逐步成熟。

唐杰則指出代際變化帶來的希望:90后、00后更具冒險精神,若營商環(huán)境與資源配置進一步改善、個人長期堅持,中國AI創(chuàng)新仍有現實機會。

五、清華大學張鈸院士:AGI要有“可檢驗”的定義,大模型有五個根本缺失

聽完前面幾位嘉賓的分享,已經91歲的中國人工智能研究先行者、清華大學教授張鈸院士臨場做了一份PPT,回應了“從語言模型到AGI”的幾個關鍵問題。

他認為,大模型雖然能生成流暢語言,但它基于的是近似的語義定義,本質上只是把詞語周圍出現頻率最高的詞,變成向量空間的幾何結構。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

而這種建模方式不可避免地帶來五類缺失:指稱缺失、因果缺失、語用缺失、多義和動態(tài)語境缺失,以及閉環(huán)行為缺失。這些缺失直接影響語言模型做應用的能力。

同樣,面對“從語言模型走向Agent”的行業(yè)趨勢,張鈸院士還提出,應該拋棄模糊、不可執(zhí)行的AGI定義,重新建立一種“可執(zhí)行、可檢驗”的標準。

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

他認為,“大家都說AGI,因為AGI很有吸引力,這里有一個誤導,大家以為做AGI都要做通用,其實AGI確實強調通用,但是跟我們目前想做的事不是一回事,但現在大家都這么用,我們也只好這么用?!?/p>

例如,馬斯克說:“我們人類70%以上的任務,機器都會干,而且達到或者超過人類的水平”。這樣的說法,既無法執(zhí)行,也無法驗證,容易造成誤解。

“什么叫做達到人類水平?時變率超過人類,算不算達到人類的水平,有的人說算,有的人說根本不算,如果魯棒性從其他方面來看差得遠?!彼磫柕馈?/p>

他認為應該有一個“可執(zhí)行、可檢驗”的AGI定義,核心是五個能力:時空一致的多模態(tài)理解與落地、可控的在線學習與適應、可驗證的推理與長期執(zhí)行與規(guī)劃、可校準的反思與元認知,以及跨任務的強泛化。他說,“按照這個定義,應該是可以指導我們往前做的?!?/p>

同時,張鈸院士還提醒,真正需要治理的不是AI本身,而是“研究者和使用者”。他認為,“這里頭,涉及到我們人工智能時代的企業(yè)、企業(yè)家應該擔負什么責任?!?/p>

今天,唐杰、楊植麟、林俊旸、姚順雨同臺交鋒!聊透了2026年AI的重點

他稱,過去并不鼓勵學生創(chuàng)業(yè),但現在認為“大模型改變了一切,最優(yōu)秀的學生應該去搞企業(yè)”。

在他看來,AI時代的企業(yè)家不只是做產品服務,而是要把知識、倫理和技術變成可復用的工具,推動AI像水電一樣服務全社會。他覺得這是一份“光榮而神圣的職業(yè)”。

結語:關于AGI的方向、形態(tài)與邊界,仍在不斷厘清

從“Scaling還夠不夠用”,到“Agent是不是只是套殼”,再到“通用智能能不能被可檢驗地定義”,這場AGI-Next峰會展現了當前中國AI技術領軍者們對下一階段智能路徑的分歧與共識。

可以看到,在模型發(fā)展路線圖上,有人繼續(xù)押注更長上下文、更強推理、更穩(wěn)訓練的工程演進,也有人開始強調新架構、新記憶范式和Embodied模型。

在產品形態(tài)上,有人堅持“模型即產品”,也有人探索更強執(zhí)行力與主動性的具身體系。而在AGI定義本身上,更有學界前輩呼吁回到“可執(zhí)行、可驗證”的概念,拒絕空泛與誤導。

誰能在范式變動中明確方向,在落地節(jié)奏中建立真實優(yōu)勢,或將成為決定接下來幾年AI格局的關鍵變量。