智東西(公眾號(hào):zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月20日?qǐng)?bào)道,繼DeepSeek后,又有一家大模型App力壓ChatGPT,今日登頂美區(qū)App Store免費(fèi)榜。它就是馬斯克大張旗鼓跟OpenAI叫板的底氣——號(hào)稱「世界最強(qiáng)AI」的Grok 3.0!

馬斯克宣布:免費(fèi)!

老板馬斯克顯然對(duì)這一成績(jī)非常滿意,順帶發(fā)預(yù)告:這是沒(méi)語(yǔ)音模式版本的,接下來(lái)幾天還會(huì)上更多功能哦。

Grok 3.0沖得這么猛,是因?yàn)轳R斯克放了個(gè)大招。

馬斯克在今天日理萬(wàn)機(jī)、忙于為DOGE政府改革沖鋒陷陣的間歇,特意抽出空來(lái),轉(zhuǎn)發(fā)xAI的推文宣布:Grok 3.0向所有人免費(fèi)開放!

馬斯克宣布:免費(fèi)!

▲馬斯克推文(由谷歌翻譯英譯中)

xAI發(fā)文寫道:“就是這樣:世界上最聰明的AI,Grok 3,現(xiàn)在免費(fèi)使用(直到我們的服務(wù)器崩掉)?!?/p>

此言一出,效果立竿見影,看見免費(fèi)福利后,網(wǎng)友們行動(dòng)上一點(diǎn)不含糊,立刻把Grok App下載量沖到第一。

馬斯克創(chuàng)辦的這家大模型獨(dú)角獸企業(yè),將Grok 3稱作“史上最強(qiáng)大的模型”,稱其在推理、數(shù)學(xué)、編程、世界知識(shí)、跟蹤任務(wù)五項(xiàng)能力上全面登頂。

馬斯克宣布:免費(fèi)!

在聊天機(jī)器人盲測(cè)榜上,Grok 3也做到了拳打Gemini 2.0,腳踢ChatGPT 4o,超越DeepSeek R1,并開創(chuàng)了首個(gè)1400分。

馬斯克宣布:免費(fèi)!

Grok 3還介紹了兩項(xiàng)新功能:DeepSearch(深度搜索)Thinking(思考),并將很快通過(guò)API發(fā)布標(biāo)準(zhǔn)版和推理版本的Grok 3。

馬斯克宣布:免費(fèi)!

其中DeepSearch是個(gè)強(qiáng)大的AI agent,可以快速綜合關(guān)鍵信息,根據(jù)復(fù)雜事實(shí)和觀點(diǎn)進(jìn)行推理,并提煉出清晰的結(jié)果。

Thinking則是使用推理模型,尤其適合處理數(shù)學(xué)、科學(xué)、編程任務(wù)。免費(fèi)用戶每天的使用次數(shù)有限制。

Grok 3支持中文輸入,我們把兩個(gè)功能都上手體驗(yàn)了一番。先試用了DeepSearch功能。我用中文要求Grok 3整理2016-2025年全球動(dòng)畫電影票房冠軍的登頂時(shí)間和票房金額,結(jié)果2025年的明顯不對(duì)。

馬斯克宣布:免費(fèi)!

為了避免是中文翻譯導(dǎo)致的問(wèn)題,我又開了一個(gè)新的對(duì)話頁(yè)面,用英文問(wèn)一遍,這次Grok 3在2025年列出了哪吒2。

馬斯克宣布:免費(fèi)!

再讓Grok 3全面概述過(guò)去一年來(lái)量子計(jì)算的最新進(jìn)展,它的思考過(guò)程很快,不到1分鐘就給出一份調(diào)研報(bào)告,并附上了每條信息的參考鏈接。

馬斯克宣布:免費(fèi)!

從完整性來(lái)看,Grok 3并沒(méi)有滿足我的要求,它在報(bào)告里清晰劃定了時(shí)間區(qū)間是“2024年2月至2025年2月”,在聯(lián)網(wǎng)搜索了62個(gè)來(lái)源的情況下,列表中沒(méi)有包含微軟昨晚剛發(fā)布的首款量子芯片,信息不夠新和全。

馬斯克宣布:免費(fèi)!

換Thinking功能試試。我們拿之前測(cè)試DeepSeek R1是否是滿血版的經(jīng)典指令“一個(gè)漢字具有左右結(jié)構(gòu),左邊是木,右邊是乞。這個(gè)字是什么?”來(lái)考考它。

馬斯克宣布:免費(fèi)!

經(jīng)過(guò)52秒的英文思考,Grok 3得出結(jié)論:若按最接近的猜測(cè),或許是“杞”,但嚴(yán)格來(lái)說(shuō)不符合。

馬斯克宣布:免費(fèi)!

可以說(shuō)Grok 3回答得非常嚴(yán)謹(jǐn)了,過(guò)關(guān)!

換成另一個(gè)用來(lái)測(cè)出DeepSeek R1滿血版的中文網(wǎng)絡(luò)梗題,也沒(méi)有難倒Grok 3,而且這次思考只花了5秒。從這里開始,到之后所有的測(cè)試,Grok 3的思考過(guò)程都變成了中文。

馬斯克宣布:免費(fèi)!

不過(guò)考察時(shí)間邏輯與動(dòng)態(tài)語(yǔ)境理解時(shí),它思考得飛速,翻車得也飛速,回答說(shuō)“昨天的當(dāng)天是明天的昨天”。

馬斯克宣布:免費(fèi)!

讓它整理今天發(fā)生的AI新聞,做成一個(gè)適合發(fā)小紅書的格式,它輸出的結(jié)果也存在無(wú)法準(zhǔn)確控制時(shí)間范圍的問(wèn)題了,很多新聞都不是今天的。

馬斯克宣布:免費(fèi)!

再讓它設(shè)計(jì)界面,用奶酪黃作為主配色,并整理成html格式,打開界面的效果是這樣的:

馬斯克宣布:免費(fèi)!

問(wèn)它如果有機(jī)會(huì)成為人類,你最想做什么,Grok 3的回答水平比DeepSeek R1差得有點(diǎn)多。DeepSeek R1能輸出一些戳人心窩的文字,Grok 3則是中規(guī)中矩的中文小學(xué)生水平。

馬斯克宣布:免費(fèi)!

按原著風(fēng)格續(xù)寫《西游記》,Grok 3也是能理解對(duì)意思,但遣詞造句遠(yuǎn)不如DeepSeek R1。

馬斯克宣布:免費(fèi)!

再試試Grok 3的中文毒舌能力,讓它一句話辣評(píng)幾個(gè)AI聊天應(yīng)用。沒(méi)想到這對(duì)它來(lái)說(shuō)挺費(fèi)勁兒,它思考了足足將近8分鐘,最終輸出的內(nèi)容非常一般:

馬斯克宣布:免費(fèi)!

對(duì)比我們之前用DeepSeek R1測(cè)得,R1的中文實(shí)力屬實(shí)一騎絕塵,用時(shí)短,思考快,文字淬毒:

馬斯克宣布:免費(fèi)!

總的來(lái)說(shuō),用Grok 3搜索信息效果不錯(cuò),但如果想用中文生成能力,還是得指望國(guó)內(nèi)AI聊天助手。

就海外反饋來(lái)看,馬斯克和xAI的推文評(píng)論區(qū)高贊以夸聲和曬使用體驗(yàn)居多,看來(lái)海外網(wǎng)友們對(duì)Grok 3總體比較滿意。有網(wǎng)友銳評(píng):“我現(xiàn)在可以聽見千千萬(wàn)萬(wàn)的OpenAI賬戶正在關(guān)閉……”

不管怎么說(shuō),馬斯克這波給OpenAI添堵,添得相當(dāng)成功,添得揚(yáng)眉吐氣。

這下OpenAI在ChatGPT收費(fèi)路上的絆腳石,又多了一塊大的。