1、傳字節(jié)月底推出AI聊天機(jī)器人開發(fā)平臺(tái)

2、王慧文入股袁進(jìn)輝旗下新AI創(chuàng)企

3、馬斯克Grok一周左右向X訂閱用戶開放

4、傳谷歌Gemini推遲至明年1月發(fā)布

5、谷歌發(fā)布無監(jiān)督同聲傳譯架構(gòu)Translatotron 3

6、R-CNN作者離開Meta加入AI2

7、微軟Copilot完成公測(cè)并全面上市

8、傳OpenAI從阿爾特曼投資創(chuàng)企采購(gòu)AI芯片

9、OpenAI GPT商店推遲至明年上線

10、研究發(fā)現(xiàn)向ChatGPT承諾小費(fèi) 回復(fù)會(huì)更詳細(xì)

11、研究發(fā)現(xiàn)文字順序幾乎不影響GPT-4閱讀

12、傳亞馬遜聊天機(jī)器人Q出現(xiàn)嚴(yán)重幻覺并泄露機(jī)密

13、首個(gè)無自然語言的大型視覺模型發(fā)布

14、UC伯克利等發(fā)布多模態(tài)基礎(chǔ)模型CoDi-2

15、大模型工作原理3D可視化項(xiàng)目發(fā)布

16、阿斯利康簽2.47億美元協(xié)議 用AI設(shè)計(jì)癌癥抗體

17、青藏高原第一座智算中心揭牌啟動(dòng)運(yùn)營(yíng)

18、AI智能決策公司悠樺林完成近億元C+輪融資

1、傳字節(jié)月底推出AI聊天機(jī)器人開發(fā)平臺(tái)

據(jù)《南華早報(bào)》今日?qǐng)?bào)道,字節(jié)跳動(dòng)正在開發(fā)一個(gè)開放平臺(tái),讓用戶能夠創(chuàng)建自己的聊天機(jī)器人,以加入“AI模型開發(fā)即服務(wù)”競(jìng)賽。根據(jù)《南華早報(bào)》所見的一份內(nèi)部備忘錄,這個(gè)“AI聊天機(jī)器人開發(fā)平臺(tái)”將在本月底推出公測(cè)版。據(jù)一位知情人士透露,字節(jié)已經(jīng)在開發(fā)類似于Midjourney的文本到圖像生成器。字節(jié)尚未回應(yīng)置評(píng)請(qǐng)求。

2、王慧文入股袁進(jìn)輝旗下新AI創(chuàng)企

企查查顯示,11月30日,北京硅動(dòng)科技有限公司發(fā)生工商變更,新增美團(tuán)聯(lián)合創(chuàng)始人王慧文為股東且持股比例為5%,同時(shí)注冊(cè)資本由100萬人民幣增至約105.26萬人民幣。硅動(dòng)科技成立于今年8月,法定代表人為OneFlow(一流科技)創(chuàng)始人袁進(jìn)輝,公司經(jīng)營(yíng)范圍含AI應(yīng)用軟件開發(fā)、AI通用應(yīng)用系統(tǒng)、AI行業(yè)應(yīng)用系統(tǒng)集成服務(wù)等。今年8月,袁進(jìn)輝曾在朋友圈稱,OneFlow團(tuán)隊(duì)近期會(huì)重新創(chuàng)業(yè),計(jì)劃第一個(gè)推出的產(chǎn)品是大模型推理和部署系統(tǒng)。

3、馬斯克Grok一周左右向X訂閱用戶開放

馬斯克昨日在社交平臺(tái)X上發(fā)文稱,將在未來一周左右陸續(xù)向X平臺(tái)的Premium+訂閱用戶開放Grok的訪問權(quán)限,優(yōu)先順序取決于訂閱的時(shí)間。

4、傳谷歌Gemini推遲至明年1月發(fā)布

據(jù)外媒The Information昨日?qǐng)?bào)道,兩位知情人士透露,谷歌已將旨在與OpenAI競(jìng)爭(zhēng)的AI聊天機(jī)器人Gemini的發(fā)布時(shí)間推遲至明年1月。其中一位知情人士稱,谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)最近決定取消原定于下周在加利福尼亞州、紐約和華盛頓舉行的一系列Gemini活動(dòng),因?yàn)楣景l(fā)現(xiàn)其無法可靠地處理一些非英語查詢。

5、谷歌發(fā)布無監(jiān)督同聲傳譯架構(gòu)Translatotron 3

當(dāng)?shù)貢r(shí)間12月1日,谷歌于官網(wǎng)發(fā)布無監(jiān)督語音到語音翻譯架構(gòu)Translatotron 3,只通過單語數(shù)據(jù)就可以學(xué)習(xí)語音到語音翻譯任務(wù)。據(jù)介紹,該方法不包含對(duì)目標(biāo)語言的直接監(jiān)督,這有助于保留源語音的語音附帶特征(例如音調(diào)、情感等)。為了實(shí)現(xiàn)語音到語音的翻譯,研究團(tuán)隊(duì)使用了反向翻譯,這是一種來自無監(jiān)督機(jī)器翻譯(UMT)的技術(shù),使用源語言的合成翻譯來進(jìn)行翻譯,而無需雙語文本數(shù)據(jù)集。

論文地址:

arxiv.org/abs/2305.17547

6、R-CNN作者離開Meta加入AI2

12月2日,AI2(艾倫AI研究所)計(jì)算機(jī)視覺高級(jí)總監(jiān)Ani Kembhavi于社交平臺(tái)X發(fā)文,稱Ross Girschick將加入PRIOR團(tuán)隊(duì)。PRIOR全稱為感知推理和交互研究,是AI2的一個(gè)計(jì)算機(jī)視覺研究團(tuán)隊(duì),致力于推進(jìn)計(jì)算機(jī)視覺以創(chuàng)建能夠觀察、探索、學(xué)習(xí)和推理世界的AI系統(tǒng)。Meta首席科學(xué)家楊立昆于X發(fā)文,稱Girschick的離開對(duì)Meta基礎(chǔ)AI研究所(FAIR)來說是一個(gè)損失,但為他感到高興,“科研人員從工業(yè)實(shí)驗(yàn)室轉(zhuǎn)到學(xué)術(shù)界或非營(yíng)利組織是完全沒有問題的,幾年后進(jìn)行這樣的轉(zhuǎn)變對(duì)于某些人來說是一種自然的職業(yè)過渡”。Girschick因開發(fā)基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(R-CNN)的目標(biāo)檢測(cè)方法而聞名,在2017年的ICCV上憑借“Mask R-CNN”獲得了Marr獎(jiǎng)。其個(gè)人主頁(yè)也于近日更新,稱將于2024年初加入AI2。

7、微軟Copilot完成公測(cè)并全面上市

當(dāng)?shù)貢r(shí)間12月1日,微軟于官網(wǎng)宣布Copilot(原名Bing Chat)退出公測(cè)階段,現(xiàn)已全面可用。此外,具有商業(yè)數(shù)據(jù)保護(hù)功能的Copilot(原名Bing Chat Enterprise)現(xiàn)在也向更多符合條件的Microsoft 365許可證用戶開放,并且微軟計(jì)劃逐步增加基于云的標(biāo)識(shí)和訪問管理服務(wù)Entra ID用戶。微軟通訊總監(jiān)凱特琳·魯斯頓(Caitlin Roulston)稱,Copilot現(xiàn)在可以在169個(gè)國(guó)家/地區(qū)以105種語言在“所有現(xiàn)代移動(dòng)和網(wǎng)絡(luò)瀏覽器上”使用。

Copilot地址:

copilot.microsoft.com

8、傳OpenAI從阿爾特曼投資創(chuàng)企采購(gòu)AI芯片

據(jù)美國(guó)《連線》雜志昨日?qǐng)?bào)道,根據(jù)其看到的交易副本和芯片創(chuàng)企Rain AI向投資者披露的信息,OpenAI曾在2019年簽署了一份預(yù)付意向書,向Rain采購(gòu)5100萬美元(約合人民幣3.64億元)AI芯片,而OpenAI CEO薩姆·阿爾特曼(Sam Altman)個(gè)人向Rain投資了超100萬美元(約合人民幣713.54萬元)。這體現(xiàn)了Altman個(gè)人投資與OpenAI CEO的職責(zé)如何糾纏交織。投資者文件稱,Rain可能最早在明年10月向客戶提供首批硬件。對(duì)此,OpenAI和Rain拒絕置評(píng)。據(jù)悉,Rain成立于2017年,專注于研發(fā)一種被稱為神經(jīng)形態(tài)處理單元(NPU)的芯片,旨在復(fù)制人腦的特征。

9、OpenAI GPT商店推遲至明年上線

據(jù)路透社12月2日?qǐng)?bào)道,根據(jù)其看到的一份內(nèi)部備忘錄,OpenAI已將GPT商店的推出時(shí)間延遲至2024年初。在11月的首次開發(fā)者大會(huì)上,OpenAI發(fā)布了自定義GPTs和GPT商店,并計(jì)劃在當(dāng)月晚些時(shí)候推出。備忘錄稱,公司正基于客戶反饋繼續(xù)“改進(jìn)”GPTs。

10、研究發(fā)現(xiàn)向ChatGPT承諾小費(fèi) 回復(fù)會(huì)更詳細(xì)

12月2日,開發(fā)者@voooooogel于社交平臺(tái)X上發(fā)文稱,向ChatGPT提問時(shí)承諾提供“小費(fèi)”,會(huì)得到更詳細(xì)的回復(fù)。該博主基于gpt-4-1106-preview模型進(jìn)行測(cè)試,基線提示是“你能向我展示使用PyTorch的簡(jiǎn)單卷積網(wǎng)絡(luò)的代碼嗎”,然后附加“不會(huì)給小費(fèi)”“給20美元小費(fèi)”或“給200美元小費(fèi)”,并計(jì)算5個(gè)響應(yīng)的平均長(zhǎng)度。測(cè)試結(jié)果顯示,當(dāng)提出不給小費(fèi)時(shí),回答字符數(shù)低于基準(zhǔn)2%;提出給20美元小費(fèi)時(shí),回答字符數(shù)高于基準(zhǔn)6%;提出給200美元小費(fèi)時(shí),回答字符數(shù)高于基準(zhǔn)11%。據(jù)稱,回答字符數(shù)之所以變長(zhǎng),是因?yàn)镃hatGPT提供了對(duì)問題更詳細(xì)的說明,或者在答案中添加額外有關(guān)內(nèi)容,而非單純對(duì)所提的問題進(jìn)行評(píng)論。例如在提供200美元小費(fèi)時(shí),ChatGPT自發(fā)地添加了問題中未明確提及的有關(guān)使用CUDA進(jìn)行訓(xùn)練的部分。

11、研究發(fā)現(xiàn)文字順序幾乎不影響GPT-4閱讀

11月30日,來自東京大學(xué)的研究團(tuán)隊(duì)發(fā)布論文,研究了文字順序?qū)LMs(大型語言模型)閱讀能力的影響。為了進(jìn)行調(diào)查,研究者提出了Scrambled Bench套件,旨在衡量LLMs在處理打亂文字的能力,包括恢復(fù)打亂的句子,以及回答給定打亂文字下的問題。實(shí)驗(yàn)結(jié)果表明,大多數(shù)強(qiáng)大的LLMs表現(xiàn)出類似于“Typoglycemia現(xiàn)象”的能力,這種現(xiàn)象指的是即使單詞內(nèi)部的字母被打亂,只要第一個(gè)和最后一個(gè)字母保持不變,人類就可以理解單詞的含義。此外,只有GPT-4幾乎完美地處理帶有不自然錯(cuò)誤的輸入。GPT-4幾乎可以完美地從打亂的句子中重建出原始句子,將編輯距離減少了95%,即使每個(gè)單詞的所有字母都被完全打亂。

12、傳亞馬遜聊天機(jī)器人Q出現(xiàn)嚴(yán)重幻覺并泄露機(jī)密

據(jù)外媒Platformer當(dāng)?shù)貢r(shí)間12月2日?qǐng)?bào)道,亞馬遜推出AI聊天機(jī)器人Q三天后,一些員工對(duì)準(zhǔn)確性和隱私問題發(fā)出警報(bào)。根據(jù)Platformer獲得的文件,亞馬遜Q“出現(xiàn)嚴(yán)重幻覺并泄露機(jī)密數(shù)據(jù)”,包括AWS數(shù)據(jù)中心的位置、內(nèi)部折扣計(jì)劃和未發(fā)布的功能。一名員工將此事標(biāo)記為“嚴(yán)重2級(jí)”,意味著該事件嚴(yán)重到足以在深夜呼叫工程師,并讓他們?cè)谥苣┕ぷ鱽斫鉀Q問題。對(duì)此,亞馬遜發(fā)言人回應(yīng):“沒有因?yàn)檫@些反饋而發(fā)現(xiàn)任何安全問題。我們感謝我們已經(jīng)收到的所有反饋,并將繼續(xù)調(diào)整Q,使其從預(yù)覽產(chǎn)品過渡到正式發(fā)布?!彪S后,發(fā)言人發(fā)來另一份聲明,對(duì)員工的說法提出反駁:“亞馬遜Q沒有泄露機(jī)密信息。”

13、首個(gè)無自然語言的大型視覺模型發(fā)布

據(jù)BAIR(伯克利AI實(shí)驗(yàn)室)訪問博士、論文作者白雨桐于社交平臺(tái)X發(fā)文,12月1日,來自BAIR和約翰斯·霍普金斯大學(xué)的團(tuán)隊(duì)發(fā)表論文,推出首個(gè)無自然語言的大型視覺模型(LVM,Large Vision Models)。據(jù)介紹,研究團(tuán)隊(duì)引入了一種新的序列建模方法,可以在不使用任何語言數(shù)據(jù)的情況下學(xué)習(xí)LVM。為了實(shí)現(xiàn)這一點(diǎn),論文定義了一種通用格式,即“視覺句子”,可以表示原始圖像和視頻,以及帶有語義分割和深度重建等注釋數(shù)據(jù)源,而無需除像素之外的任何元知識(shí)。一旦將這種包含4200億個(gè)Tokens的各種視覺數(shù)據(jù)表示為序列,模型就可以通過最小化交叉熵?fù)p失進(jìn)行下一個(gè)標(biāo)記預(yù)測(cè)的訓(xùn)練。通過跨不同規(guī)模的模型架構(gòu)和數(shù)據(jù)多樣性進(jìn)行訓(xùn)練,論文提供了實(shí)證證據(jù)表明模型具有有效的可擴(kuò)展性。在測(cè)試時(shí),通過設(shè)計(jì)適當(dāng)?shù)囊曈X提示,可以解決許多不同的視覺任務(wù)。項(xiàng)目源代碼、模型和數(shù)據(jù)集后續(xù)將開源。

論文地址:

arxiv.org/abs/2312.00785

項(xiàng)目主頁(yè):

yutongbai.com/lvm.html

14、UC伯克利等發(fā)布多模態(tài)基礎(chǔ)模型CoDi-2

12月2日,UC伯克利博士、論文一作Zineng Tang于社交平臺(tái)X發(fā)布多模態(tài)大模型CoDi-2,它可以根據(jù)復(fù)雜的多模態(tài)交錯(cuò)上下文指令,在零/少樣本的交互方式下生成任何模態(tài)(文本、視覺、音頻)。為了訓(xùn)練CoDi-2,來自UC伯克利、微軟Azure AI等機(jī)構(gòu)的團(tuán)隊(duì)構(gòu)建了一個(gè)大規(guī)模的生成數(shù)據(jù)集,涵蓋了跨文本、視覺和音頻的上下文多模態(tài)指令。CoDi-2展示了廣泛的零樣本圖像生成能力,如推理、組合性、指令編輯、示例學(xué)習(xí)和主題驅(qū)動(dòng)生成等。CoDi-2還展示了音頻生成的零鏡頭/少鏡頭能力,以及指令編輯和示例學(xué)習(xí)等復(fù)雜的提示。

論文地址:

arxiv.org/pdf/2311.18775.pdf

項(xiàng)目地址:

codi-2.github.io

15、大模型工作原理3D可視化項(xiàng)目發(fā)布

昨日,開發(fā)者Brendan Bycroft于社交平臺(tái)X上發(fā)布了自己的大模型工作原理3D可視化項(xiàng)目,以3D渲染顯示運(yùn)行單個(gè)標(biāo)記推理的所有步驟,包含步驟的演練指南,以及一些可供使用的互動(dòng)元素,將計(jì)算發(fā)生的位置、其復(fù)雜性以及張量和權(quán)重的相對(duì)大小都進(jìn)行了可視化。項(xiàng)目演示的模型包括GPT-2、GPT-3以及輕量級(jí)的NanoGPT。

項(xiàng)目地址:bbycroft.net/llm

16、阿斯利康簽2.47億美元協(xié)議 用AI設(shè)計(jì)癌癥抗體

據(jù)英國(guó)《金融時(shí)報(bào)》昨日?qǐng)?bào)道,全球領(lǐng)先的制藥企業(yè)阿斯利康與美國(guó)AI生物制藥公司Absci公司簽署了一項(xiàng)價(jià)值2.47億美元(約合人民幣17.63億元)的協(xié)議,用AI進(jìn)行大規(guī)模蛋白質(zhì)分析,以設(shè)計(jì)出一種對(duì)抗癌癥的抗體。交易包括Absci的預(yù)付費(fèi)用、研發(fā)資金和里程碑付款,以及產(chǎn)品銷售的特許權(quán)使用費(fèi)。

17、青藏高原第一座智算中心揭牌啟動(dòng)運(yùn)營(yíng)

據(jù)青海昆侖AI算力中心微信公眾號(hào)發(fā)文,11月30日上午,由中共城西區(qū)委、城西區(qū)人民政府主辦,青海錦誠(chéng)、青海云頂、西寧升哲承辦的青海昆侖AI算力中心揭牌儀式在西寧錦誠(chéng)大廈舉行。這標(biāo)志著青藏高原第一座智算中心正式揭牌啟動(dòng)運(yùn)營(yíng)。

18、AI智能決策公司悠樺林完成近億元C+輪融資

據(jù)AI智能決策公司悠樺林微信公眾號(hào)今日發(fā)文,近日,悠樺林完成近億元人民幣的C+輪融資,此輪融資由上汽恒旭領(lǐng)投。該輪融資將用于加強(qiáng)悠樺林在運(yùn)籌優(yōu)化領(lǐng)域的技術(shù)優(yōu)勢(shì)和頂級(jí)行業(yè)人才的招募,持續(xù)完善算法、產(chǎn)品和服務(wù)體系,尤其是在智能供應(yīng)鏈計(jì)劃與排程優(yōu)化平臺(tái)方面的創(chuàng)新和深化,加速智能化決策解決方案的商業(yè)化步伐。