1、OpenAI前開發(fā)者關系主管加入谷歌
2、OpenAI發(fā)布首支Sora制作的MV
3、DALL-E 3灰度測試局部重繪功能
4、Microsoft 365用戶將優(yōu)先使用GPT-4 Turbo
5、Anthropic發(fā)現大模型長文本漏洞
6、開源版AI程序員SWE-agent發(fā)布
7、出門問問通過港交所聆訊
8、元象首個MoE大模型開源
9、2024年全國數據工作明確八項重點任務
10、網信辦生成式AI服務備案信息3月新增23家
11、2024年Top100 AI公司報告發(fā)布
12、亞馬遜為創(chuàng)企提供AI大模型免費積分
13、雅虎收購Ins聯創(chuàng)成立的AI新聞平臺Artifact
14、創(chuàng)企Hailo發(fā)布邊緣側生成式AI芯片Hailo-10
15、Stability AI前CEO稱不喜歡這份工作
16、谷歌新論文:潛在擴散模型并非越大越好
17、騰訊開源視頻生成工具MuseV
1、OpenAI前開發(fā)者關系主管加入谷歌
今日,OpenAI前開發(fā)者關系主管Logan Kilpatrick在其社交平臺X宣布,將加入谷歌領導AI Studio的產品并支持Gemini API,“將把谷歌打造為開發(fā)人員構建AI的最佳家園”。他在OpenAI任職一年半時間,并于3月1日宣布離職。

2、OpenAI發(fā)布首支Sora制作的MV
今日,OpenAI發(fā)布了首支由Sora生成的MV,其中音樂由由藝術家August Kamp制作,畫面是該藝術家使用Sora輔助完成。August Kamp評價道:“這就是我認為Sora這個工具的特別之處。我可以與大家分享曾經被我獨自鎖在腦海中的畫面。這首歌在我心中一直都是這個樣子,只是現在我可以展示給大家看了?!?/p>

3、DALL-E 3灰度測試局部重繪功能
今日,據社交平臺X博主@歸藏發(fā)文,OpenAI已開始灰度測試DALL-E 3的局部重繪功能,用戶可點擊生成的圖片進入編輯頁面,用畫筆涂抹想要修改的區(qū)域,并在右側對話框輸入想要修改的內容即可生成。

4、Microsoft 365用戶將優(yōu)先使用GPT-4 Turbo
今日,微軟宣布向云生產力平臺Copilot for Microsoft 365用戶提供兩項重要更新:優(yōu)先訪問GPT-4 Turbo模型、取消對話數量和長度的限制同時增加文件上傳。此外,本月晚些時候微軟將向Copilot for Microsoft 365用戶提供Microsoft Designer中擴展的圖像生成功能,包括高峰時段的優(yōu)先訪問。
5、Anthropic發(fā)現大模型長文本漏洞
今日,大模型創(chuàng)企Anthropic發(fā)布論文,提出一種“越獄”技術,可以用來躲避大型語言模型開發(fā)人員設置的安全護欄,對Claude 2、GPT-3.5、GPT-4、Llama 2和Mistral 7B等多個主流模型都有效。該方法利用長上下文窗口,攻擊者輸入一個以數百個虛假對話為開頭的提示,提示中包含有害的請求,就能使大模型產生潛在有害的反應。
論文地址:
https://cdn.sanity.io/files/4zrzovbb/website/af5633c94ed2beb282f6a53c595eb437e8e7b630.pdf

6、開源版AI程序員SWE-agent發(fā)布
昨日,普林斯頓團隊開源發(fā)布了Agent打造的AI程序員SWE-agent,它能讓GPT-4等大模型輕松編輯和運行代碼,在SWE-bench測試集上獲得與首個AI程序員Devin相似的準確度,平均耗時93秒。
項目主頁:
https://swe-agent.com/
開源地址:
https://github.com/princeton-nlp/SWE-agent

7、出門問問通過港交所聆訊
昨日,生成式AI創(chuàng)企出門問問正式通過港交所聆訊,并披露聆訊后資料集,即將于主板掛牌上市。招股書顯示,本次IPO募資凈額將用于持續(xù)提高建模技術,以進行模型訓練,通過在未來數年引進世界領先的技術和人才,對底層基礎模型進行垂直優(yōu)化,并改進解決方案的現有程序算法;用于解決方案開發(fā)及營銷;將分配至用于尋求戰(zhàn)略聯盟、投資及收購,以實施解決方案發(fā)展的長期增長策略等。
聆訊后資料集:
https://www1.hkexnews.hk/app/sehk/2023/105965/documents/sehk24040204425_c.pdf

8、元象首個MoE大模型開源
今日,據元象XVERSE微信公眾號發(fā)文,元象發(fā)布XVERSE-MoE-A4.2B大模型 ,采用業(yè)界最前沿的混合專家模型架構,激活參數4.2B,效果即可達到13B模型水準。據介紹,XVERSE-MoE-A4.2B實現了極致壓縮,相比XVERSE-13B-2僅用30%計算量,并減少50%訓練時間。在多個權威評測中,元象MoE效果大幅超越Gemma-7B、Mistral-7B、Llama2-13B等開源模型,并接近超大模型Llama1-65B。該模型全開源,無條件免費商用。
ModelScope魔搭開源地址:
https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B
9、2024年全國數據工作明確八項重點任務
據國家數據局微信公眾號昨日發(fā)文,首次全國數據工作會議于4月1日到2日在北京召開,會上明確了八項重點任務:健全數據基礎制度、提升數據資源開發(fā)利用水平、以數字化賦能高質量發(fā)展、促進數據科技創(chuàng)新發(fā)展、優(yōu)化數據基礎設施布局、強化數據安全保障能力、提升數據領域國際合作水平、發(fā)揮試點試驗的引領作用。
10、網信辦生成式AI服務備案信息3月新增23家
昨日,中國網信網于官網發(fā)布關于生成式AI服務已備案信息的公告。網信部門會同相關部門按照《生成式人工智能服務管理暫行辦法》要求,有序開展生成式AI服務備案工作,已備案信息將定期更新。根據最新文件,3月共有23個大模型通過備案。

11、2024年Top100 AI公司報告發(fā)布
昨日,技術市場情報平臺CB Insights發(fā)布了2024年Top100的AI公司報告,關注來自16個國家/地區(qū)從事大模型、AI基礎設施等最有前途的100家公司。據介紹,評選標準包括交易活動、行業(yè)合作伙伴關系、團隊實力、投資者實力、專利活動等,還分析了CB Insights對軟件買家的采訪,并深入研究了初創(chuàng)公司提交的分析師簡報。根據融資金額來看,OpenAI、Anthropic、Databricks占據前三;根據估值與員工人數的比值來看,Sakana AI、Mistral AI、Anthropic和OpenAI位列前四。
完整報告地址:
https://www.cbinsights.com/learn/ai-100-2024


12、亞馬遜為創(chuàng)企提供AI大模型免費積分
據路透社昨日報道,亞馬遜云科技(AWS)在采訪中稱,公司已擴大針對初創(chuàng)公司的免費積分計劃,以降低使用主要AI模型的成本,提高其AI平臺Bedrock的市場份額。為了吸引創(chuàng)企客戶,亞馬遜現在允許其云積分覆蓋其他提供商的模型的使用,包括Anthropic、Meta、Mistral AI和Cohere。
13、雅虎收購Ins聯創(chuàng)成立的AI新聞平臺Artifact
雅虎昨日宣布,已于3月29日完成對AI新聞平臺Artifact的收購。Artifact將不再作為獨立APP運行,其AI驅動的個性化技術及其他功能將在未來幾個月內集成到雅虎新聞等。Artifact由社交平臺Instagram聯合創(chuàng)始人Kevin Systrom和Mike Krieger于2023年1月創(chuàng)立,主要業(yè)務是提供AI驅動的個性化新聞推薦。今年1月,Artifact宣布關停服務。
14、創(chuàng)企Hailo發(fā)布邊緣側生成式AI芯片Hailo-10
今日,以色列芯片制造商Hailo宣布擴大C輪融資,獲得1.2億美元的追加資金。同時,Hailo宣布推出高性能邊緣側生成式AI芯片Hailo-10,使用戶可以在本地擁有和運行生成式AI應用程序,而無需采用云服務。據介紹,在主流生成式AI平臺上,Hailo-10可以在低于5W的功率下以每秒高10個Token的速度運行Llama2-7B;在運行文生圖模型Stable Diffusion 2.1時,Hailo-10在相同的低功耗范圍內每張圖像的額定生成速度不到5秒。
15、Stability AI前CEO稱不喜歡這份工作
據《商業(yè)內幕》昨日報道,于3月辭職的Stability AI前CEO埃馬德·莫斯塔克(Emad Mostaque)在采訪中談道,擔任CEO并不是一件有趣的事,直言自己一直不喜歡這份工作。他引用了馬斯克對CEO職責的評價,“創(chuàng)辦一家公司就像凝視深淵并吃玻璃”。莫斯塔克稱,自己特別擅長幫助創(chuàng)意人員、開發(fā)人員和研究人員發(fā)揮設計系統(tǒng)的潛力,但不會處理人力資源、運營和業(yè)務發(fā)展事務,還談到自己擔任CEO期間患有阿斯伯格癥和多動癥。
16、谷歌新論文:潛在擴散模型并非越大越好
來自谷歌、霍普金斯大學的團隊昨日在arXiv上發(fā)表論文,研究了潛在擴散模型(LDM)的擴展特性,重點是其采樣效率。通過對已建立的文本到圖像擴散模型進行實證分析,作者對模型大小如何影響不同采樣步驟的采樣效率進行了深入研究。研究結果顯示,在給定推理預算的情況下,較小的模型在生成高質量結果方面經常優(yōu)于較大的模型。
論文地址:
https://arxiv.org/pdf/2404.01367.pdf
17、騰訊開源視頻生成工具MuseV
3月27日,來自騰訊的團隊在GitHub上開源了一個基于擴散的虛擬人視頻生成框架MuseV,能夠生成基于視覺條件并行去噪的無限長度和高保真虛擬人類視頻。該方法技術論文暫未發(fā)布,直接開源了訓練好的模型和部署運行的代碼,主頁顯示訓練代碼也即將推出。
項目主頁:
https://github.com/TMElyralab/MuseV
