智東西(公眾號:zhidxcom)
作者 |? 徐豫
編輯 |? 漠影

智東西1月29日報道,國產(chǎn)AI之光DeepSeek-R1正快速平替OpenAI、Meta、Google的模型,成為應(yīng)用開發(fā)者的新選擇。

該模型在知名AI開源社區(qū)Hugging Face上的下載量已超70萬次,日增40%。

DeepSeek危及美國國家安全?火爆海外開源社區(qū),衍生模型超670個

▲DeepSeek-R1躋身Hugging Face最受喜愛的模型前十名(圖源:Clem Delangue X主頁)

不過,DeepSeek強(qiáng)勁的增長勢頭,也引起了美方的高度關(guān)注。

今日凌晨CNBC報道稱,美國海軍基于“潛在安全和道德問題”,已要求內(nèi)部人員禁止使用DeepSeek模型。

據(jù)玉淵譚天消息,昨天,美國多名官員回應(yīng)DeepSeek對美國的影響,稱其“蒸餾”技術(shù)是“偷竊”,正對其影響開展國家安全調(diào)查。

同日,DeepSeek官網(wǎng)的服務(wù)狀態(tài)頁面顯示:“近期DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持?!庇駵Y譚天向奇安信安全專家咨詢并獨(dú)家了解道,DeepSeek這次受到的網(wǎng)絡(luò)攻擊,IP地址都在美國。

DeepSeek危及美國國家安全?火爆海外開源社區(qū),衍生模型超670個

截至發(fā)稿,在Chatbot Arena大模型榜單中,DeepSeek-R1基準(zhǔn)測試排名已升至全類別大模型第二,超過OpenAI的o1和o1-mini模型,僅次于Anthropic的Claude3.5 Sonnet,熱度持續(xù)攀升。

一、DeepSeek衍生模型數(shù)量日增30%,下載量超320萬

Hugging Face首席科學(xué)官Thomas Wolf今天接受彭博社采訪時,透露了DeepSeek-R1開源模型上線一周后增勢強(qiáng)勁,并且該公司有計(jì)劃在DeepSeek-R1的基礎(chǔ)上,自研開源項(xiàng)目Open-R1。

Hugging Face社區(qū)內(nèi)的開發(fā)者們正在公開復(fù)現(xiàn)DeepSeek-R1。主頁的135萬個模型中,檢索“DeepSeek”相關(guān)的模型有將近2700個。

Hugging Face聯(lián)合創(chuàng)始人兼CEO Clem Delangue 1月28日發(fā)帖稱,DeepSeek-R1的衍生模型至少有500種。

DeepSeek危及美國國家安全?火爆海外開源社區(qū),衍生模型超670個

Thomas Wolf今天給出了最新數(shù)據(jù),用DeepSeek-R1搭建的模型至少有670個,累計(jì)下載量超320萬次,日增約30%;而DeepSeek-R1的下載量超過70萬次,日增40%。

DeepSeek危及美國國家安全?火爆海外開源社區(qū),衍生模型超670個

據(jù)Clem Delangue透露,DeepSeek-R1已進(jìn)入該社區(qū)史上最受喜愛的模型前十名之列。

截至1月29日,Hugging Face社區(qū)點(diǎn)贊數(shù)排行前十的AI模型依次是:

1、黑森林實(shí)驗(yàn)室的FLUX.1-dev

2、CompVis的stable-diffusion-v1-4

3、Stability AI的stable-diffusion-x1-base-1.0

4、Meta的Llama-3-8B

5、BigScience的bloom

6、Stability AI的stable-diffusion-3-medium

7、DeepSeek的DeepSeek-R1

8、Mistral AI的Mixtral-8x7B-Instruct-v0.1

9、Meta的Llama-2-7B

10、Meta的Llama-2-7B-chat-hf

二、Hugging Face開搞Open R1,要研究透DeepSeek

跟上眾多開發(fā)者的潮流,Hugging Face也打算基于DeepSeek-R1復(fù)刻一套自己的新模型,即Open-R1項(xiàng)目。

據(jù)Hugging Face官網(wǎng)1月28日介紹,Open-R1項(xiàng)目將重建DeepSeek-R1的數(shù)據(jù)和訓(xùn)練管道,并在這個過程中驗(yàn)證其效果、突破其上限,從而增強(qiáng)推理的透明度,以及積累可復(fù)制的經(jīng)驗(yàn)。

不同開發(fā)商的復(fù)刻方法不盡相同。針對DeepSeek-R1遺留的特定推理數(shù)據(jù)收集方法、未公開模型訓(xùn)練代碼、訓(xùn)練時的計(jì)算和數(shù)據(jù)縮放定律等問題,Open-R1計(jì)劃通過以下步驟補(bǔ)齊這些空白板塊:

首先,從DeepSeek-R1中提取高質(zhì)量推理數(shù)據(jù)集,來復(fù)制R1-Distill模型。

然后,復(fù)制DeepSeek用于創(chuàng)建R1-Zero的純RL管道,這個過程將涉及為數(shù)學(xué)、推理和代碼任務(wù),整理新的大規(guī)模數(shù)據(jù)集。

最后,可以通過多階段訓(xùn)練,實(shí)現(xiàn)從基礎(chǔ)模型到SFT(監(jiān)督微調(diào)),再到RL(強(qiáng)化學(xué)習(xí))的模型進(jìn)階。

DeepSeek危及美國國家安全?火爆海外開源社區(qū),衍生模型超670個

▲Open-R1復(fù)刻DeepSeek-R1的計(jì)劃示意圖(圖源:Hugging Face官網(wǎng))

按照Thomas Wolf的預(yù)期,其團(tuán)隊(duì)將在接下來的幾個月內(nèi)弄清楚這些細(xì)節(jié)問題,并應(yīng)用于Open-R1項(xiàng)目。

三、谷歌前CEO:全球AI的轉(zhuǎn)折點(diǎn)已經(jīng)到來

這場有關(guān)DeepSeek的硝煙,不僅僅籠罩了OpenAI、Meta、Google等一眾主流模型開發(fā)商,使其著手研究如何降低模型的開發(fā)成本;也進(jìn)一步蔓延至中美兩國的AI博弈大局。

不到兩周前,美國商務(wù)部工業(yè)和安全局(BIS)才頒布了芯片出口限制最新規(guī)定。其中,BIS共拉黑了11家與先進(jìn)AI技術(shù)有關(guān)的中國實(shí)體。

在The Verge昨晚的報道中,OpenAI前政策研究員Miles Brundage稱,像DeepSeek-R1這種推理模型通常需要使用大量GPU,會受到美國芯片出口管制的干擾。

在Miles Brundage看來,DeepSeek-R1使用了兩個關(guān)鍵的優(yōu)化技巧,一是更高效的預(yù)訓(xùn)練,二是思維鏈推理強(qiáng)化學(xué)習(xí),這在一定程度上使其能以更少的GPU數(shù)量、更便宜的GPU,推動DeepSeek-R1實(shí)現(xiàn)了更強(qiáng)大的性能。因此,Miles Brundage稱,美國對GPU實(shí)施有效的出口管制,比以往任何時候都更為重要。

不過,OpenAI首席研究官M(fèi)ark Chen則傾向于外界夸大了DeepSeek-R1的成本優(yōu)勢。他一方面認(rèn)可了DeepSeek獨(dú)立開發(fā)出了OpenAI o1級別的推理模型,但另一方面認(rèn)為兩者在開發(fā)成本上的差距并沒有那么大,仍然對OpenAI的技術(shù)路線持樂觀態(tài)度。因此,從某種意義上說,DeepSeek還是有被先進(jìn)GPU卡脖子的風(fēng)險。

另外,有不少觀點(diǎn)認(rèn)為DeepSeek-R1的出現(xiàn)將惠及部分美國科技巨頭。

《華爾街日報》1月27日報道稱,DeepSeek-R1的技術(shù)突破意味著,不少美國科技巨頭可能不必花費(fèi)太多時間、精力和算力,來訓(xùn)練他們的AI模型。

而且這些模型都是開源的,開發(fā)人員可以檢查和修改其代碼,并用它來構(gòu)建自己的應(yīng)用程序。這可以幫助更多小企業(yè)花費(fèi)比閉源模式低得多的成本,用上AI,并且開源可以促進(jìn)更多合作和實(shí)驗(yàn)。

摩根士丹利分析師Brian Nowak稱,蘋果也將因DeepSeek等大模型的任何進(jìn)展中受益匪淺,原因是蘋果“擁有現(xiàn)存最有價值的消費(fèi)技術(shù)分發(fā)平臺”。

谷歌前CEO Eric Schmidt昨天告訴《華盛頓郵報》,他認(rèn)為美國需要加大開源AI研發(fā)力度,開發(fā)出更多開源模型,鼓勵先進(jìn)AI實(shí)驗(yàn)室共享訓(xùn)練方法,以及投資星際之門等AI基礎(chǔ)設(shè)施,以應(yīng)對DeepSeek的迅速發(fā)展。

Eric Schmidt還一改去年“美國領(lǐng)先”的說辭,在《華盛頓郵報》專欄文章中稱,DeepSeek的崛起標(biāo)志著全球AI“轉(zhuǎn)折點(diǎn)”的到來,證明了中國可以用更少的資源與大型科技公司競爭。

結(jié)語:國產(chǎn)模型出圈新路線,Meta、Hugging Face等爭相模仿

目前,有的團(tuán)隊(duì)和機(jī)構(gòu)正在研究、復(fù)刻DeepSeek-R1,有的嘗試用該模型重塑自家模型,例如Meta、Hugging Face、UC伯克利、港科大等。

同時,2025年開年,DeepSeek-R1將推理模型競賽推向新拐點(diǎn),有望憑借低算力、高性價比的技術(shù)路線,開拓國產(chǎn)模型的全球市場。

春節(jié)期間DeepSeek掀起的這場AI風(fēng)暴,仍在中美乃至全球科技、政金界產(chǎn)生持續(xù)影響,并不斷發(fā)酵。這已經(jīng)成為改變AI科技產(chǎn)業(yè)趨勢的風(fēng)向標(biāo)事件,智東西將持續(xù)跟進(jìn)相關(guān)進(jìn)展和報道,敬請關(guān)注。