智東西(公眾號:zhidxcom)
作者 | 陳駿達
編輯 | 心緣

MiniMax最強編程模型開源了!

智東西12月26日報道,今天下午,MiniMax開源了其本周二發(fā)布的MiniMax M2.1模型,該模型主打編程能力和辦公場景的可用性,在多語言編程、Agent、復(fù)雜指令方面都有明顯提升。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

MiniMax M2.1采用MoE(混合專家)架構(gòu),參數(shù)量為229B,激活參數(shù)量為10B,與此前開源的MiniMax M2一致。

在編程相關(guān)場景的核心榜單上,MiniMax M2.1相比于前代模型MiniMax M2的得分最高提升了60%(Terminal-bench 2.0)。尤其是在多語言場景上,MiniMax M2.1的表現(xiàn)甚至超過了Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

此外,為了考察模型“從零到一”構(gòu)建完整、可運行應(yīng)用程序的全棧能力,MiniMax構(gòu)建并開源了全新基準測試VIBE。MiniMax-M2.1在VIBE綜合榜單中拿到88.6的平均分,得分接近Claude Opus 4.5,并在幾乎所有子集上都顯著優(yōu)于Claude Sonnet 4.5。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

在辦公場景、長程工具調(diào)用和綜合智能指數(shù)上,MiniMax M2.1 相比M2也表現(xiàn)出穩(wěn)步提升,多項得分打平或超過Claude Sonnet 4.5和Gemini 3 Pro。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

其實,發(fā)布之初,MiniMax就宣布MiniMax M2.1模型將會開源,過去幾天,MiniMax在與多個部署平臺對齊測試,并于今天全面開源權(quán)重。

用戶還可以在MiniMax開放平臺和MiniMax Agent上使用這一模型。MiniMax提供了M2.1和M2.1-lightning兩個版本的API,這兩個API結(jié)果完全一樣,但是后者速度更快,價格翻倍。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

開源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M2.1

https://github.com/MiniMax-AI/MiniMax-M2.1

MiniMax Agent:

https://agent.minimaxi.com/

一、多語言和App開發(fā)成重點,打造3D手勢交互動畫效果驚艷

在編程場景,MiniMax M2.1把多語言和App開發(fā)作為重點。

在M2.1中,MiniMax系統(tǒng)性提升了模型在Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScript等編程語言上的能力。這些語言覆蓋從底層系統(tǒng)到應(yīng)用層開發(fā)的完整鏈路。

官方案例中,MiniMax M2.1基于React Three Fiber與InstancedMesh構(gòu)建了一顆“3D夢幻圣誕樹”,成功渲染7000+實例,支持手勢交互與復(fù)雜粒子動畫。可以看到,這顆“圣誕樹”能根據(jù)用戶的手勢散開或者聚攏,頁面效果流暢。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

模型的多語言能力,擴展了模型在更復(fù)雜場景的應(yīng)用。此前,主流模型在編程領(lǐng)域都存在偏科的現(xiàn)象,大部分模型更擅長Web端應(yīng)用和網(wǎng)頁前端的開發(fā),而MiniMax加強了M2.1的Android與iOS開發(fā)能力、設(shè)計理解與美學(xué)表達能力。

下方案例中,M2.1使用Kotlin語言開發(fā)了一款安卓原生重力感應(yīng)模擬器,利用陀螺儀傳感器實現(xiàn)重力操控體驗,并設(shè)計了視覺彩蛋,通過自然的UI過渡與碰撞特效,呈現(xiàn)“MERRY XMAS MiniMax M2.1”信息。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

iOS開發(fā)中,M2.1打造了一個桌面交互小組件,設(shè)計了“沉睡圣誕老人”點擊喚醒機制,邏輯完整且具備交互動畫效果。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

為了理解辦公場景的復(fù)合指令約束,MiniMax此前已經(jīng)為其模型引入了交叉思考(Interleaved Thinking)的能力。此次開源的M2.1在系統(tǒng)化問題解決方面的能力再次升級,執(zhí)行任務(wù)時,模型不僅關(guān)注代碼執(zhí)行是否正確,同時關(guān)注對“復(fù)合指令約束”的整合執(zhí)行能力。

二、模型驅(qū)動機器狗行動,還能充當(dāng)數(shù)字員工

MiniMax M2.1還具備較強的Agent能力。MiniMax官方展示了多個案例。

比如,MiniMax M2.1可以直接用于驅(qū)動機器狗,理解用戶“幫我去后面的吧臺那瓶水來”的需求。模型能理解壓力傳感器變化意味著物品已經(jīng)被放置,然后轉(zhuǎn)身回去找用戶。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

Agent能力還體現(xiàn)在模型的工具調(diào)用能力上。下方案例中,MiniMax M2.1能自主調(diào)用Excel工具和雅虎財經(jīng),完成市場調(diào)研數(shù)據(jù)清洗、分析和圖表生成任務(wù)。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

MiniMax M2.1可以用于驅(qū)動數(shù)字員工。模型能夠接受以文字形式展示的網(wǎng)頁內(nèi)容,并以文本形態(tài)的輸入控制鼠標的點擊行為和鍵盤輸入,在日常辦公場景下,完成行政、數(shù)據(jù)科學(xué)、財務(wù)、人力資源、軟件開發(fā)類的端到端任務(wù)。

比如,模型可以在通訊軟件上主動收集員工的設(shè)備請求,然后前往企業(yè)內(nèi)部服務(wù)器上搜索相關(guān)文檔獲取設(shè)備價格,計算總成本并判斷部門預(yù)算是否充足,然后記錄設(shè)備變更。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

或是在項目管理軟件上查找被阻塞或積壓的問題,然后在通訊軟件上查找相關(guān)員工并咨詢解決方案,根據(jù)員工反饋更新問題的狀態(tài)。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

模型也可以在代碼庫中查找答案。例如,某同事希望知道改動了某個文件的最近的合并請求是哪一個,檢索相關(guān)的合并請求,找到編號并告知該同事。

又一國產(chǎn)大模型剛剛開源!能使喚機器狗拿水

結(jié)語:AI編程模型,持續(xù)深入生產(chǎn)級場景

隨著AI編程的不斷滲透,開發(fā)者和企業(yè)已經(jīng)不再僅僅滿足將編程模型用于簡單的代碼補全或片段生成。

本周,MiniMax與智譜都發(fā)布了主打編程能力的新模型,并強調(diào)模型在生產(chǎn)級環(huán)境的可用性與處理復(fù)雜、復(fù)合任務(wù)的能力。

未來,模型能否更深入地融入開發(fā)工作流、安全穩(wěn)定地完成端到端任務(wù),將成為影響其價值的重要因素。