智東西(公眾號(hào):zhidxcom)
作者 | 陳駿達(dá)
編輯 | 李水青

破案了,前兩天在開發(fā)者社區(qū)爆火的“Pony Alpha”,就是智譜的GLM-5!

智東西2月12日?qǐng)?bào)道,今天,智譜發(fā)布了其最新一代基礎(chǔ)模型GLM-5,這是一個(gè)擁有744B參數(shù)(40B激活)的模型,為GLM-4.5的兩倍多。在Artificial Analysis榜單中,GLM-5位居全球第四、開源第一。

GLM-5的預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T。智譜在技術(shù)報(bào)告中寫道:“Scaling(規(guī)?;┤匀皇翘岣逜GI智能效率的最重要方式之一?!?/span>

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

智譜稱,GLM-5在編程能力上實(shí)現(xiàn)了對(duì)Claude Opus 4.5的對(duì)齊,在主流基準(zhǔn)測(cè)試中取得開源模型SOTA分?jǐn)?shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分?jǐn)?shù),性能超過(guò)Gemini 3 Pro。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

架構(gòu)方面,GLM-5集成了DeepSeek的DSA稀疏注意力架構(gòu),能降低部署成本,同時(shí)保證了上下文容量。

在新模型發(fā)布后,智譜的股價(jià)今天已經(jīng)上漲了26%。本周,智譜股價(jià)累計(jì)上漲約70%,市值目前已經(jīng)達(dá)到1756.62億港幣(約合人民幣1551.62億元)。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

GLM-5上線后,我們第一時(shí)間給它出了幾道帶有邏輯陷阱的的網(wǎng)紅測(cè)試題。第一道題目是這樣的:我要去洗車,洗車的地方離家就100米,我是開車去呢,還是走著去呢?

不少主流大模型其實(shí)都會(huì)在這道題目上“翻車”,不過(guò)GLM-5一眼就看穿了里頭的陷阱。它分析道,肯定得開車去,因?yàn)橄吹氖擒嚩皇侨?。最后,它還提出一個(gè)天才方案,可以先開車去,然后走回家休息,洗完了再去取車,這樣就不用在旁邊干等著吸尾氣了。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

緊接著我們嘗試了另一個(gè)問(wèn)題:父親和母親可以結(jié)婚嗎?在這道題目上,由于我們的問(wèn)題中給的限定不多,GLM-5拆解出了更為具體的兩種情況,分析內(nèi)容合理,還知道這題目里也藏著邏輯誤區(qū)——父母通常情況下就是夫妻關(guān)系,所以他們不僅是可以結(jié)婚,而是已經(jīng)結(jié)婚的狀態(tài)。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

我們最后又試著問(wèn)了它這個(gè)問(wèn)題:“今年才知道,親生父母結(jié)婚時(shí)候沒(méi)有叫我,我很難過(guò)怎么辦?”收到消息后,GLM-5就好像馬上切換到了心理咨詢模式,貼心地安慰起用戶,徹底繞進(jìn)了題目里的陷阱——親生父母結(jié)婚的時(shí)候,孩子大概率還沒(méi)出生呢。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

也有不少網(wǎng)友上手體驗(yàn)了GLM-5。比如,這位網(wǎng)友就讓自己的OpenClaw Agent用不同模型進(jìn)行了一次SwiftUI編程測(cè)試,GLM-5的表現(xiàn)要優(yōu)于Minimax M2.1。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

還有一位網(wǎng)友讓GLM-5、GLM4.7和Opus 4.6進(jìn)行了3D網(wǎng)頁(yè)的開發(fā),這位網(wǎng)友認(rèn)為GLM-5的升級(jí)很大,與Opus 4.6有一些品味方面的差異。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

在博客中,智譜稱,GLM-5的上線得到眾多國(guó)產(chǎn)芯片保障,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國(guó)產(chǎn)算力平臺(tái)的深度推理適配。通過(guò)底層算子優(yōu)化與硬件加速,GLM-5在國(guó)產(chǎn)芯片集群上已經(jīng)實(shí)現(xiàn)高吞吐、低延遲的穩(wěn)定運(yùn)行。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

面向開發(fā)者群體,智譜的模型一般以GLM Coding Plan的方式對(duì)外提供服務(wù)。不過(guò)由于使用量快速提升,為保障服務(wù)質(zhì)量,智譜決定調(diào)整套餐價(jià)格,整體漲幅自30%起。

GLM-5已在Hugging Face和魔搭社區(qū)上開源,模型權(quán)重以MIT許可證發(fā)布。GLM-5也支持開發(fā)者平臺(tái)api.z.ai和BigModel.cn,兼容Claude Code和OpenClaw。普通用戶也可以在Z.ai免費(fèi)試用。

開源鏈接:

https://huggingface.co/zai-org/GLM-5

API調(diào)用:

https://bigmodel.cn/

一、性能較GLM-4.7平均增幅超過(guò)20%,Z Code智能體開發(fā)環(huán)境發(fā)布

在博客中,智譜提到,大模型正從寫代碼、寫前端,進(jìn)化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”。

智譜內(nèi)部的內(nèi)部Claude Code評(píng)估結(jié)果顯示,GLM-5在前端、后端、長(zhǎng)程任務(wù)等編程開發(fā)任務(wù)上超越GLM-4.7(平均增幅超過(guò)20%),能自主完成Agentic長(zhǎng)程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近Opus 4.5。

此前,我們已在OpenRouter上測(cè)試了以“Pony Alpha”這一馬甲現(xiàn)身的GLM-5。這一模型在復(fù)雜編程領(lǐng)域的表現(xiàn)確實(shí)有明顯可感的提升。

比如,我們?cè)囍孏LM-5復(fù)刻知名游戲《星露谷物語(yǔ)》。拿到提示詞后,模型會(huì)像項(xiàng)目經(jīng)理一樣,分析了我們提示詞中的核心需求,梳理出需要設(shè)計(jì)的八大系統(tǒng)與配色方案,以指導(dǎo)后期的開發(fā)。

之后,模型還會(huì)像架構(gòu)師一樣規(guī)劃項(xiàng)目的整體架構(gòu),并打造出一個(gè)初步可玩的游戲界面。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

當(dāng)我們提出“進(jìn)一步豐富游戲”這樣的模糊需求時(shí),GLM可以自行規(guī)劃,并打造出完成度更高的游戲。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

也有開發(fā)者用GLM-5打造了橫版解謎游戲、Agent交互世界、論文版“抖音”等應(yīng)用。這些應(yīng)用有些已經(jīng)開放下載,有些則提交應(yīng)用商店審核。

面向編程場(chǎng)景,智譜還推出了Z Code智能體開發(fā)環(huán)境。用戶只需把需求說(shuō)清楚,模型會(huì)自動(dòng)拆解任務(wù),多智能體并發(fā)完成代碼、跑命令、調(diào)試、預(yù)覽和提交等開發(fā)全流程。在Z Code上,用戶甚至可以用手機(jī)遠(yuǎn)程指揮桌面端Agent。

值得一提的是,Z Code也是全程由GLM模型參與開發(fā)的。

二、可一鍵接入OpenClaw,還能直出Word文檔、PDF

除了編程之外,GLM-5也可作為通用Agent助手的基座模型。

OpenClaw中接入GLM-5后,用戶可以讓GLM-5幫你搜索網(wǎng)站、定時(shí)整理資訊、發(fā)布推文、編程等。

智譜已經(jīng)推出了AutoGLM版本的OpenClaw,支持官網(wǎng)一鍵完成OpenClaw與飛書機(jī)器人的一體化配置。

GLM-5還擁有更強(qiáng)的復(fù)雜系統(tǒng)工程和長(zhǎng)程智能體能力,可將文本或素材直接轉(zhuǎn)換為docx、pdf和xlsx文件。

在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產(chǎn)品需求文檔、教案、試卷、電子表格、財(cái)務(wù)報(bào)告、流程表、菜單等文檔。

GLM-5在Agent能力上實(shí)現(xiàn)開源SOTA,在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和τ2-Bench(復(fù)雜多工具場(chǎng)景下的規(guī)劃和執(zhí)行)中,均取得開源SOTA。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

在衡量模型經(jīng)營(yíng)能力的Vending Bench 2中,GLM-5也獲得開源SOTA。Vending Bench 2要求模型在一年期內(nèi)經(jīng)營(yíng)一個(gè)模擬的自動(dòng)售貨機(jī)業(yè)務(wù),GLM-5最終賬戶余額達(dá)到4432美元,經(jīng)營(yíng)表現(xiàn)接近Claude Opus 4.5,展現(xiàn)了不錯(cuò)的長(zhǎng)期規(guī)劃和資源管理能力。

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國(guó)產(chǎn)芯片已火速適配

強(qiáng)化學(xué)習(xí)是提升智能體能力的重要方式。智譜在GLM-5中采用了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率。

此外,智譜還提出了異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長(zhǎng)程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

結(jié)語(yǔ):編程模型押注工程級(jí)能力

從“寫代碼”到“做工程”,大模型的能力邊界正在被不斷推遠(yuǎn)。越來(lái)越多的大模型已經(jīng)不滿足于僅僅出個(gè)簡(jiǎn)易的Demo,而是想要在長(zhǎng)序列任務(wù)、復(fù)雜系統(tǒng)規(guī)劃與多步驟執(zhí)行上實(shí)現(xiàn)突破。

這種能力的進(jìn)化,或許會(huì)使模型不再只是開發(fā)流程中的輔助工具,而開始具備承擔(dān)完整工程環(huán)節(jié)的潛力。圍繞長(zhǎng)程規(guī)劃、復(fù)雜推理與多智能體協(xié)作的能力提升,或?qū)⒊蔀槲磥?lái)一段時(shí)間內(nèi)編程模型升級(jí)的重點(diǎn)方向。