智東西(公眾號:zhidxcom)
作者 | 陳駿達
編輯 | 漠影

智東西2月9日報道,這兩天,一款叫Pony Alpha的神秘模型,在模型聚合平臺OpenRouter上悄然走紅。沒有發(fā)布會、沒有論文,甚至連廠商也沒有公開,它卻憑借一連串超出預(yù)期的實測表現(xiàn),在開發(fā)者和模型愛好者圈子里迅速引發(fā)關(guān)注。

據(jù)OpenRouter官方介紹,這款模型是某家廠商的下一代基礎(chǔ)模型,在編程、推理和角色扮演方面具有不錯的性能,還針對智能體工作流進行了優(yōu)化,工具調(diào)用準確性較高。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

更有說服力的,是已經(jīng)上手測試的用戶反饋,不少網(wǎng)友給出了幾乎一致的好評。一位博主用自己的秘密SVG生成測試題“拷打”Pony Alpha,結(jié)果生成質(zhì)量高得離譜,甚至讓他一度懷疑是不是泄題了。

還有開發(fā)者分享稱,自己讓Pony Alpha連續(xù)編程3小時,最終直接做出了一個真正可游玩的Pokemon Ruby,完成度之高,甚至在某些細節(jié)上“比原版還像原版”。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

也正因為這種不合常理的強勢表現(xiàn),Pony Alpha 的“身世之謎”迅速成為討論焦點。有人猜測它可能是Anthropic的Sonnet 5,畢竟這種代碼能力實在過于眼熟;也有人聯(lián)想到此前頻頻被傳將發(fā)布的DeepSeek-V4;還有不少聲音認為,這或許是智譜下一代模型GLM-5的提前試水。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

那么,Pony Alpha的真實能力究竟如何?這些傳言有沒有技術(shù)層面的依據(jù)?接下來,我們不妨拋開猜測,直接通過一系列實測,看看這匹“Pony”到底能跑多遠。

一、從數(shù)據(jù)儀表盤到算法可視化,Pony Alpha初體驗

目前,Pony Alpha已在OpenRouter開放,免費可用,可以直接在網(wǎng)頁與模型對話,也能通過API方式直接調(diào)用。其上下文窗口為200K。

由于Pony Alpha是一款主打編程的模型,我們也將測試的重點放在編程領(lǐng)域。

第一個Case是“迷你數(shù)據(jù)儀表盤”。提示詞要求輸入一組數(shù)字,實時生成最大值、均值‘最小值和波動率,并伴隨平滑動畫更新。

這個提示主要考察三點能力:一是對統(tǒng)計指標的理解是否準確;二是前端結(jié)構(gòu)組織能力,能否把數(shù)據(jù)和UI卡片合理拆分;三是動畫與狀態(tài)更新的細膩程度。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

▲Pony Alpha打造的“迷你數(shù)據(jù)儀表盤”

實際結(jié)果中,Pony Alpha打造的網(wǎng)頁在指標計算上沒有偏差,動畫采用了過渡效果而非生硬刷新,整體完成度已經(jīng)很高了。

我們嘗試的第二個Case是SVG卡通場景繪制。提示詞非常具體:尺寸、主題、元素、風格和細節(jié)要求齊全,核心難點在于復(fù)雜約束下,模型能不能確保一致性。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

模型最終輸出的SVG在結(jié)構(gòu)上清晰,圖層關(guān)系合理,太陽光暈、海浪曲線、椰子樹陰影都被準確實現(xiàn),色彩飽和但不過曝,并沒有簡單堆砌圖形。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

第三個Case是算法可視化演繹,我們要求模型將排序或?qū)ぢ匪惴ㄞD(zhuǎn)化為動畫,本質(zhì)是把步驟映射為時間與空間變化,對編程和推理能力進行了綜合考驗。

Pony Alpha在這里表現(xiàn)出色:顏色變化對應(yīng)狀態(tài),節(jié)奏體現(xiàn)算法進度,路徑演化直觀呈現(xiàn)決策過程,說明它不僅會寫代碼,還能用代碼解釋復(fù)雜的概念。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

▲Pony Alpha打造的“算法可視化器”

在完成這三組案例之后,可以明顯感覺到:Pony Alpha在“能跑、好看、好理解”這一層面已經(jīng)打造目前主流模型的水平線上方了。接下來我們要做的,是把它放到更復(fù)雜、更需長時間推理的場景中,看看是否依然能保持創(chuàng)造力。

二、架構(gòu)師思維上線,從零復(fù)刻星露谷

前面的案例更多是在驗證模型“寫代碼”的能力,本質(zhì)仍是短鏈路、低復(fù)雜度的任務(wù)執(zhí)行。而真正拉開差距的,是模型是否具備Agentic Coding能力——也就是能否以系統(tǒng)視角理解問題,并長期、自主地推進復(fù)雜工程。

這意味著模型要像資深架構(gòu)師一樣拆解系統(tǒng)級需求,在長時間運行中保持上下文連貫與目標一致。接下來,我們用復(fù)刻知名游戲《星露谷物語》的任務(wù),來對Pony Alpha進行一場壓力測試。

這是我們發(fā)送給Pony Alpha的提示詞。對專業(yè)的人類開發(fā)者來說,復(fù)刻像星露谷這樣的游戲,至少需要涉及數(shù)千行代碼,需要處理好游戲循環(huán)、場景管理、玩家與NPC行為邏輯、農(nóng)作物成長、地塊管理、UI、背包、存檔系統(tǒng)等多種機制和不同的主體。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

同時,還要保證各模塊接口一致、邏輯同步、動畫渲染平滑、事件交互響應(yīng)正確,并考慮性能優(yōu)化和可維護性,這樣寫出來的代碼才有可運行、可擴展、可調(diào)試的實際應(yīng)用價值。

那么,Pony Alpha會如何解決這一問題呢?拿到提示詞后,Pony Alpha首先像項目經(jīng)理一樣,分析了我們復(fù)雜的提示詞中的核心需求,梳理出需要設(shè)計的八大系統(tǒng)與配色方案,以指導后期的開發(fā)。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

緊接著,Pony Alpha又化身系統(tǒng)架構(gòu)師,規(guī)劃了項目的整體項目架構(gòu)。打開源文件后,我們能看到這一項目采用了最基礎(chǔ)且通用的前端資源結(jié)構(gòu),JS項目結(jié)構(gòu)有明顯的模塊化思路:模型、渲染、系統(tǒng)分開,邏輯清晰,適合中小型項目。

在這樣的理念指導下,Pony Alpha打造出了一個初步可玩的游戲界面,視覺風格統(tǒng)一、治愈系滿滿,核心玩法邏輯也很清晰。比如開墾(土地)、播種(種子)、澆水(水壺)這些動作都能正常運行,體力消耗系統(tǒng)也設(shè)計得合理。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

當然,本質(zhì)上,這還是一個純前端的 Demo。為了讓它更有“玩頭”,我們進一步挑戰(zhàn)了Pony Alpha:加入數(shù)據(jù)保存機制,并讓游戲畫面更精美。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

在了解完我們的需求后,Pony Alpha給了多個技術(shù)解決方案供選擇。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

上手優(yōu)化項目后,Pony Alpha進行了打造了后端的服務(wù)器和數(shù)據(jù)庫,完成了前端存檔管理器,連續(xù)編程了超過10多分鐘,無需任何人為干預(yù)。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

升級后,Pony Alpha大幅度優(yōu)化了原本的設(shè)計,背包和物品欄被移動到頁面下方,讓虛擬世界本身占據(jù)視覺中心。畫面中的湖泊、草地、樹木都變得更為精細。天氣系統(tǒng)也被加入進來,晴天、陰天、下雨甚至小雪都能動態(tài)呈現(xiàn),讓整個世界更加生動、真實。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

三、深入生產(chǎn)“屎山”,實測存量代碼深度重構(gòu)

在真實企業(yè)環(huán)境中,開發(fā)新功能只是整個工程的一部分,更多時候程序員面對的是已經(jīng)存在、復(fù)雜且歷史悠久的“屎山”代碼庫。這些系統(tǒng)往往包含隱式規(guī)則、技術(shù)債務(wù)和歷史遺留行為,使得理解現(xiàn)有代碼、定位問題并安全修改,比從零開發(fā)更具挑戰(zhàn)性。

因此,AI在企業(yè)中的價值不僅在于生成新代碼,還在于對已有項目中進行有效的代碼理解、調(diào)試、重構(gòu)和增量開發(fā)。接下來,我們將通過實測案例,看看Pony Alpha在這類工程任務(wù)中的表現(xiàn)。

我們先是用Pony Alpha+人工手搓了一個一眼看上去就有年頭的財務(wù)系統(tǒng)。乍一看,這一系統(tǒng)只是UI有些陳舊,但是深入代碼后,里面埋著更大的雷(當然,這都是我們要求Pony Alpha做的,不代表其自身能力)。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

我們能發(fā)現(xiàn)里頭變量命名混亂、函數(shù)職責不明確、一些特殊的神秘賬戶隱晦地藏在if分支里,還有隨機批量操作和對歷史數(shù)據(jù)的隱性依賴。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

清空上下文后,我們讓Pony Alpha排除自己剛才親手埋下的雷。

其實,對人類程序員來說,這種存量系統(tǒng)簡直是噩夢,如果沒有一個靠譜AI的幫助,你可能永遠不知道重構(gòu)時會不會“順手刪掉一條祖?zhèn)鬟壿嫛?/p>

而AI模型也很容易在這種情況下翻車,它們會試著統(tǒng)一規(guī)則、試圖去掉重復(fù)邏輯,但卻忽略了一些技術(shù)現(xiàn)狀其實代表了某種業(yè)務(wù)上的妥協(xié)或者真實形態(tài),如果妄加修改可能真的會引發(fā)更大的Bug。

我們給Pony Alpha發(fā)送了如下提示詞,基本上就是要求它在盡可能確保系統(tǒng)可以無縫替換原模塊的基礎(chǔ)上,實現(xiàn)代碼的重構(gòu)和現(xiàn)代化。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

Pony Alpha沒有急著上手修改,而是先分析了一通。它能理解這是個財務(wù)系統(tǒng),也能準確判斷其使用的技術(shù)棧。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

為了讓問題看起來更清晰,Pony Alpha按照嚴重程度分了類。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

在模型自行設(shè)定的重構(gòu)目標指導下,Pony Alpha開始了改造。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

最終,Pony Alpha成功交付了一個更為現(xiàn)代化的版本。這一重構(gòu)后的財務(wù)系統(tǒng)不僅實現(xiàn)了原來的所有功能,甚至連原系統(tǒng)里可能是給領(lǐng)導使用的“9999”特殊賬戶隱藏邏輯也得到了完整保留,這波操作真是情商拉滿了,技術(shù)與心思都在線。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

再來看看底層的代碼。原版中,全局變量和函數(shù)都是混合在一起的,而Pony Alpha改造后的版本架構(gòu)清晰度明顯提升,配置層、數(shù)據(jù)層、業(yè)務(wù)層等都清晰地隔離了,依賴關(guān)系清晰,便于單元測試。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

原來混亂的變量名也規(guī)范化了,無意義的字母變成了一個個語義化的命名,這樣后續(xù)接手代碼的其他同事能更輕松地理解代碼邏輯。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

除此之外,Pony Alpha還主動新增了提示詞中沒有明確要求的各種安全性和可維護性功能。比如輸入驗證就可以避免用戶遺漏關(guān)鍵信息,而數(shù)據(jù)加載容錯機制可以避免程序崩潰。

編程AI變天了!實測神秘模型Pony Alpha:Opus級智能,架構(gòu)師思維上線

說實話,看著Pony Alpha把這堆老舊代碼一點點梳理、優(yōu)化,又保留關(guān)鍵邏輯,感覺它就像一位耐心又靠譜的老師傅,讓人工作起來踏實多了。

結(jié)語:下一代旗艦級基礎(chǔ)模型要來了

綜合多輪實測下來,Pony Alpha給人的整體使用感受,更像是一個Opus級別的下一代旗艦級基礎(chǔ)模型,而不是一次簡單的模型小版本更新。

它在長上下文、復(fù)雜工程理解與執(zhí)行穩(wěn)定性這些真正決定生產(chǎn)力的維度上,體現(xiàn)出明顯的代際差異。或許是某家廠商長期打磨、針對真實開發(fā)工作流深度優(yōu)化模型能力的一次集中釋放。至于它究竟來自哪一家,目前仍然沒有定論。

但可以確定的是,如果這匹“Pony”真的是某家國內(nèi)廠商憋了很久的大招,那么國內(nèi)基礎(chǔ)模型在高階編程與工程智能體方向上的競爭,可能已經(jīng)提前進入了新階段。