智東西(公眾號:zhidxcom)
作者 |? 陳駿達
編輯 |? 漠影

什么,通義App現(xiàn)在長這樣了?

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

近日,阿里旗下的通義App迎來升級,UI、交互體驗到背后接入的模型都全面重塑,整體外觀大做減法,而內(nèi)置模型、工具的能力則進一步升級。

進入新版通義App首頁,主智能體引入“鄰家女孩”這一富有親和力的新形象,能勝任大部分應(yīng)用場景中的需求。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

右滑則是豐富的智能體生態(tài),將原版通義App的工具、角色、頻道等頁面整合,呈現(xiàn)更為直觀。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

左滑后,用戶的對話記錄、創(chuàng)作的圖像、視頻與創(chuàng)建的智能體都一覽無余。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

值得一提的是,新版通義App還接入阿里最新推理模型千問QwQ-32B,這款模型以32B的參數(shù)量,在數(shù)學(xué)推理、編程能力上與671B的DeepSeek-R1 旗鼓相當。此外,在多項通用能力測評中,QwQ-32B的得分超越DeepSeek-R1。一經(jīng)發(fā)布,便獲得全球開發(fā)者的關(guān)注與贊賞。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

已經(jīng)有不少網(wǎng)友體驗了升級后的通義App,其更快的響應(yīng)速度、更豐富的交互體驗獲得好評,還有網(wǎng)友感嘆,新版通義讓“最強AI飛入尋常百姓家”。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App迎來升級后,智東西第一時間全面體驗了其在交互、模型、工具等方面的新變化,在阿里加碼AI to C的大背景下,新版通義有望成為更實用、更貼心的個人AI助手。

一、拍照找bug、解答無厘頭問題,還能給會議畫腦圖

新版通義App以超級智能體作為交互中樞,用戶在通義首頁能問、能聊,還能讓智能體進行圖片理解、圖片生成,翻譯、寫作等任務(wù)。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

此外,通義首頁還會推薦基于其他模型或者具備其他不同功能的智能體。目前,基于Qwen-QwQ-32B的被放在了首頁的推薦欄中。用戶只需點擊,就能與這款新模型進行對話。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

數(shù)學(xué)、代碼類問題一直是通義模型家族的強項,實測中,搭載QwQ-32B智能體的通義App回答了從高考壓軸題到AIME真題等不同難度的數(shù)學(xué)問題,還編寫了一個簡單的游戲。同時,為了避免大模型上網(wǎng)找答案,測試時聯(lián)網(wǎng)搜索能力均已關(guān)閉。

下方是2024年高考全國甲卷理科數(shù)學(xué)的壓軸題,在先前的測試中,智東西曾讓DeepSeek-R1解答,R1用時80余秒,給出了正確答案,但解題流程不符合評分標準中的規(guī)范。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

測試中,QwQ-32B在解答這道題目的用時略長于R1,這主要是因為它在思考過程中進行了更多的反思、驗算等流程,還嘗試了不同的解題思路。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

▲QwQ-32B的部分思考過程

最終,QwQ-32B兩個小題的答案都完全正確,解題格式較為規(guī)范,不過,它漏掉了一個踩分點,無法拿到滿分。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

智東西又讓QwQ-32B嘗試了一道2024年的AIME真題。在面對英文題目時,Qwen-32B也毫不露怯,會自動用英文思考,不到一分鐘,QwQ-32B便給出了正確答案,這一次它的證明過程沒有破綻。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

測試完新版通義App中QwQ-32B智能體的數(shù)學(xué)能力,我們再來看看其編程方面的實力究竟如何。智東西讓QwQ-32B編寫了一個基于HTML的五子棋小程序,并加入了“三三禁手”、“長連禁手”等限制黑棋的規(guī)則。

幾分鐘后,QwQ-32B用不到200行代碼完成了這一任務(wù),還解釋了禁手檢測的實現(xiàn)邏輯。細讀它的思考過程,還能發(fā)現(xiàn)它自我迭代了幾版實現(xiàn)方法。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

不過,作為一款手機App,通義在代碼場景中更常見的應(yīng)用或許是拍照解釋代碼。智東西在先前的程序中埋入了一個bug,導(dǎo)致游戲無法判斷勝者,無法結(jié)束。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

由于QwQ-32B智能體目前暫時不支持圖片上傳,我們將這一挑戰(zhàn)交給了通義App中的主智能體。據(jù)了解,在代碼類問題上,主智能體會調(diào)用通義千問的Qwen-MAX模型。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

簡單分析后,通義給出了幾個可能的原因與修復(fù)的代碼,復(fù)制粘貼后再進行微調(diào),游戲程序便能夠正常運行。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

如果說數(shù)學(xué)、代碼等能力更偏向理科,那接下來的幾道測試題則更側(cè)重于文字推理、百科知識的考查。

目前,有許多大模型都在歷史類問題上表現(xiàn)不佳,尤其是在涉及資料較少的國家和民族時。智東西讓QwQ-32B智能體分析了“南非有沒有鎖甲”這一問題。觀察它的思考過程,我們可以發(fā)現(xiàn),QwQ-32B從不同年代、不同民族的角度條分縷析地回答了這一問題,答案也符合史實。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

至于下方這類無厘頭的問題,通義則采取了“用魔法打敗魔法”的策略。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App中的QwQ-32B智能體引經(jīng)據(jù)典,從經(jīng)濟學(xué)視角、生物學(xué)視角邏輯學(xué)視角等5個不同角度給出了理由,讓人無可辯駁。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App的一大特色是其專業(yè)能力,如實時記錄、拍照講題、健康問答等領(lǐng)域。新版通義App中,實時記錄功能新上線了腦圖功能,錄音后不僅能生成會議紀要,還可以將會議內(nèi)容生成腦圖,可謂是打工人福音了;拍照講題功能現(xiàn)在不光能給出答案解析,還能持續(xù)追問,允許用戶“打破砂鍋問到底”。

二、高情商有溫度,產(chǎn)品交互全面重塑

接入新模型、功能升級等調(diào)整進一步提升了新版通義App的實用性,而產(chǎn)品界面、交互體驗的變化則是從設(shè)計層面,讓通義App更加易用,也更具溫度。

過去的通義App同樣具備不俗的實力,但在用戶友好度上仍有優(yōu)化空間,未能向用戶充分表達、溝通其實力

以原版通義的主頁面(下圖右2)為例,可以看到界面以文字為主,并集合了不少其他功能。這種設(shè)計雖然可以幫助用戶快速跳轉(zhuǎn),但也可能導(dǎo)致用戶在剛開始使用時摸不著頭腦,需要一定的學(xué)習成本。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

新版通義App通過做減法,讓產(chǎn)品設(shè)計更加簡潔清爽,突出了核心功能,也擁有了更具親和力的交互體驗。

現(xiàn)在,打開通義App后,映入眼簾的是更具親和力的人物形象,通義官方將其稱之為“鄰家女孩”。這一形象可以視作是整個通義智能體生態(tài)的代言人,給人以親切、溫暖的感受。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

對大多數(shù)用戶而言,首頁主智能體是他們與App交互的核心入口,這一形象的變化能夠迅速拉近用戶與產(chǎn)品之間的距離,降低使用時的陌生感和距離感?!班徏遗ⅰ毕路降奈淖诌€會不斷變化,詢問用戶的心情,或是用表情符號讓文字更為活潑。

在使用通義App的過程中,我們也能感受到與這一形象相符合的貼心體驗。通義App在QwQ-32B智能體中推薦了這樣一個問題:“如果你是人類,如何過幸福的一生?”模型給出的回答不僅包括實操建議,還撰寫了鼓勵的話語,既貼心又實用。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

新版通義App在其他方面的設(shè)計和調(diào)整,也進一步降低了用戶使用的門檻。例如,保存用戶過去聊天記錄的板塊原本被分為助手、工具和角色,這一頁面還融合了與通義進行語音交互的功能。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

而在新版通義中,左滑后進入的對話記錄、個人資產(chǎn)頁面劃分更加易懂,被分為對話記錄、我創(chuàng)建的、我聊過的智能體,用戶能通過這些名稱更直觀地找到自己所需的信息。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

使用頻率很高的拍照講題、實時記錄等功能,被調(diào)整到主頁輸入框上方,用戶可以一鍵切換。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

右滑后,通義App將代碼、紀要等生產(chǎn)力工具和視頻生成、繪圖、角色扮演整合到一個統(tǒng)一的智能體生態(tài)中,在中心位置呈現(xiàn)用戶最新使用的智能體與其他熱門應(yīng)用,讓用戶無需過多點擊就能直達目標。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

一些趣味的AI玩法能讓用戶使用App的體驗更加輕松,不過,并不是所有用戶都會高頻使用此類應(yīng)用。在新版通義App中,這些智能體的位置被放在實用工具之后,用戶可以下滑點擊,或是通過搜索直接訪問。

談及這些升級,通義產(chǎn)品負責人認為,他們不僅要通過強大的AI技術(shù)能力幫助用戶解決實際問題,還要讓用戶在使用中感到更方便、更懂我。AI應(yīng)用的未來不僅僅是簡單的提效工具,更是一個能夠理解、陪伴并提升用戶生活質(zhì)量的貼心AI助手。

三、Agent賽道爆火,通義積極布局

新版通義App的發(fā)布,正值A(chǔ)I Agent應(yīng)用的爆發(fā)期。2024年底,Anthropic發(fā)布了MCP(模型上下文協(xié)議),以統(tǒng)一標準規(guī)范了大模型應(yīng)用程序與外部數(shù)據(jù)源和工具的集成。

進入2025年,OpenAI發(fā)布了Operator預(yù)覽版本,支持購物、訂票等服務(wù);而Deep Research這類深度研究工具,也體現(xiàn)了Agentic AI的思想。

在過去,通義已經(jīng)在基礎(chǔ)模型領(lǐng)域有深厚積累,涵蓋文本、圖像、語音、視頻,開源模型廣受全球開發(fā)者認可。此外,通義App中積累了大量專業(yè)領(lǐng)域智能體,已經(jīng)擁有一定的用戶認可,但尚未完全破圈。

新版通義App主頁面引入的超級智能體,有望憑借新的形象,成為加強用戶與智能體連接的紐帶。

通義App的C端化轉(zhuǎn)向,也符合這段時間以來阿里的AI To C戰(zhàn)略。去年年底,通義App團隊從阿里云分拆,并入阿里智能信息事業(yè)群,而原有基礎(chǔ)模型團隊則仍然保留在阿里云體系內(nèi)。

產(chǎn)品與研究的相對獨立,讓通義App與一線用戶離得更近,也能更準確地把握用戶的需求,響應(yīng)市場變化。

未來,通義App會持續(xù)上線更多千問大模型新能力,還會把阿里多個先進模型能力融入到產(chǎn)品應(yīng)用中,為用戶提供更加豐富的智能體驗。

作為潛在的發(fā)展方向,現(xiàn)有的主智能體或許能在未來成為智能體分發(fā)入口,根據(jù)用戶需求智能調(diào)用相關(guān)智能體,進一步提升用戶體驗。

結(jié)語:通義產(chǎn)品理念重塑,阿里AI To C進行時

本次通義App的全新升級,不僅僅是技術(shù)層面的進化,更是產(chǎn)品理念和用戶體驗的全面煥新。

要真正做好一款To C產(chǎn)品,技術(shù)硬實力僅僅是基礎(chǔ)。如何挖掘、創(chuàng)造用戶的需求,找到用戶的高頻使用場景,創(chuàng)造與用戶的情感連接,是任何一款想要獲得To C成功的產(chǎn)品的必答題。在“Agent元年”推出的新版通義,正探索這些挑戰(zhàn)的最新解題思路。