1、阿里發(fā)布肖像視頻生成框架EMO
2、Pika推出“對(duì)口型”功能
3、傳蘋果放棄電動(dòng)汽車制造轉(zhuǎn)向生成式AI
4、特斯拉APP推出AI聊天助手測(cè)試版
5、Gemini 1.5通過(guò)視頻成功修復(fù)Bug
6、谷歌將進(jìn)行結(jié)構(gòu)性調(diào)整以解決Gemini偏見(jiàn)問(wèn)題
7、研究顯示Gemini等在選舉上存在偏見(jiàn)
8、傳谷歌向媒體付費(fèi)測(cè)試AI寫(xiě)作工具
9、扎克伯格拜訪日韓討論AI、XR合作
10、OpenAI稱《紐約時(shí)報(bào)》侵權(quán)指控存在欺騙行為
11、歐盟監(jiān)管機(jī)構(gòu)擬審查微軟對(duì)Mistral的投資
12、GitHub推出企業(yè)版Copilot
13、微軟正測(cè)試Copilot GPT
14、百度2023年凈利潤(rùn)漲39%
15、百度Comate啟動(dòng)眾測(cè)活動(dòng)
16、螞蟻集團(tuán)推出多模態(tài)遙感模型SkySense
17、魅族Aicy語(yǔ)音助手接入AI大模型
18、OPPO Reno11系列將引入生成式AI功能
19、南京大學(xué)開(kāi)設(shè)AI通識(shí)核心課程體系
20、傳Tumblr等計(jì)劃將數(shù)據(jù)出售給AI公司
21、Prophesee與高通合作進(jìn)入可量產(chǎn)階段
22、芯片大神Jim Keller創(chuàng)企與日企合作設(shè)計(jì)AI芯片
23、法AI圖像創(chuàng)企獲4300萬(wàn)美元融資
24、字節(jié)推出MegaScale 將LLM訓(xùn)練擴(kuò)展到1萬(wàn)個(gè)GPU
1、阿里發(fā)布肖像視頻生成框架EMO
今日,來(lái)自阿里巴巴的團(tuán)隊(duì)發(fā)布了音頻驅(qū)動(dòng)的肖像視頻生成框架EMO(Emote Portrait Alive),相關(guān)論文同步發(fā)表于arXiv。輸入一張參考圖像和聲音音頻,該框架能夠生成具有豐富面部表情和頭部姿勢(shì)的聲音肖像視頻。
論文地址:
arxiv.org/pdf/2402.17485.pdf
項(xiàng)目主頁(yè):
humanaigc.github.io/emote-portrait-alive/

2、Pika推出“對(duì)口型”功能
昨晚,AI視頻生成平臺(tái)Pika宣布推出為生成視頻中的人物配音,并同時(shí)“對(duì)口型”的唇形同步功能LipSync,目前僅支持Pro用戶體驗(yàn)。其中,音頻生成部分由AI語(yǔ)音克隆創(chuàng)企ElevenLabs提供技術(shù)支持。

3、傳蘋果放棄電動(dòng)汽車制造轉(zhuǎn)向生成式AI
據(jù)彭博社援引知情人士消息報(bào)道,蘋果在當(dāng)?shù)貢r(shí)間周二于公司內(nèi)部宣布取消長(zhǎng)達(dá)十年的電動(dòng)汽車項(xiàng)目,從事該項(xiàng)目的近2000名員工中的許多人將被轉(zhuǎn)到由約翰·詹南德雷亞(John Giannandrea)領(lǐng)導(dǎo)的AI部門,專注于生成式人工智能項(xiàng)目。
4、特斯拉APP推出AI聊天助手測(cè)試版
據(jù)electrek報(bào)道,特斯拉今日更新了移動(dòng)端應(yīng)用程序,推出測(cè)試版聊天助手,可以回答有關(guān)特斯拉或其他產(chǎn)品的問(wèn)題。

5、Gemini 1.5通過(guò)視頻成功修復(fù)Bug
昨日,社交平臺(tái)X博主Mckay Wrigley稱Gemini Pro 1.5通過(guò)視頻和文本成功修復(fù)了問(wèn)題代碼。他將整個(gè)代碼庫(kù)以文本形式發(fā)送給Gemini Pro 1.5,并同時(shí)上傳了攝像頭拍攝的三個(gè)出錯(cuò)的程序界面,輸入“請(qǐng)幫我修復(fù)代碼中的所有Bug”等提示詞,Gemini直接給出了問(wèn)題代碼位置和解決方案。

6、谷歌將進(jìn)行結(jié)構(gòu)性調(diào)整以解決Gemini偏見(jiàn)問(wèn)題
據(jù)Semafor今日?qǐng)?bào)道,谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)在當(dāng)?shù)貢r(shí)間周二晚間回應(yīng)了Gemini的種族偏見(jiàn)爭(zhēng)議,稱該問(wèn)題“不可接受”,并發(fā)誓要進(jìn)行結(jié)構(gòu)性調(diào)整來(lái)解決問(wèn)題。他在內(nèi)部信中說(shuō),公司在修復(fù)Gemini護(hù)欄方面已經(jīng)取得了進(jìn)展,“我們的團(tuán)隊(duì)一直在夜以繼日地工作來(lái)解決這些問(wèn)題。我們已經(jīng)看到各種提示都得到了顯著的改進(jìn)?!?/p>
7、研究顯示Gemini等在選舉上存在偏見(jiàn)
據(jù)非盈利新聞工作室Proof今日發(fā)布的報(bào)告,GPT-4、Llama 2、Gemini、Mixtral和Claude等領(lǐng)先的五個(gè)AI文本模型在26個(gè)選舉相關(guān)問(wèn)題上準(zhǔn)確性表現(xiàn)不佳,超過(guò)一半的相應(yīng)被AI專家評(píng)委不準(zhǔn)確,40%的回答被評(píng)為有害。其中,Gemini、Llama2和Mixtral的不準(zhǔn)確答案率最高,均超過(guò)60%。

8、傳谷歌向媒體付費(fèi)測(cè)試AI寫(xiě)作工具
據(jù)ADWEEK昨日?qǐng)?bào)道,谷歌上個(gè)月為少數(shù)獨(dú)立出版商推出一項(xiàng)計(jì)劃,為后者提供未發(fā)布的生成式AI平臺(tái)測(cè)試版訪問(wèn)權(quán)限,來(lái)?yè)Q取分析和反饋。作為協(xié)議的一部分,出版商將使用該工具套件在12個(gè)月內(nèi)每天發(fā)布3篇內(nèi)容,每月可以獲得五位數(shù)的津貼。
9、扎克伯格拜訪日韓討論AI、XR合作
據(jù)路透社報(bào)道,Meta CEO扎克伯格周二拜訪了東京,與日本首相岸田文雄討論了AI問(wèn)題。周二晚間,他抵達(dá)韓國(guó),并于今日會(huì)見(jiàn)了LG電子CEO、LG母公司COO,討論下一代XR設(shè)備開(kāi)發(fā)相關(guān)業(yè)務(wù),以及在AI領(lǐng)域的潛在合作。
10、OpenAI稱《紐約時(shí)報(bào)》侵權(quán)指控存在欺騙行為
據(jù)The Verge報(bào)道,OpenAI在當(dāng)?shù)貢r(shí)間周一提交的一份動(dòng)議中稱,《紐約時(shí)報(bào)》使用“欺騙性提示”讓ChatGPT重復(fù)其內(nèi)容,并請(qǐng)求紐約南部的美國(guó)地方法院駁回《紐約時(shí)報(bào)》版權(quán)侵權(quán)訴訟中的幾項(xiàng)索賠。
11、歐盟監(jiān)管機(jī)構(gòu)擬審查微軟對(duì)Mistral的投資
據(jù)The Information報(bào)道,歐洲最高反壟斷監(jiān)管機(jī)構(gòu)歐盟委員會(huì)當(dāng)?shù)貢r(shí)間周二稱,計(jì)劃審查微軟對(duì)法國(guó)生成式AI初創(chuàng)公司Mistral的投資。微軟于周一宣布與Mistral建立合作伙伴關(guān)系,向Mistral投資1630萬(wàn)美元,并在云平臺(tái)Azure中提供Mistral的模型。
12、GitHub推出企業(yè)版Copilot
微軟旗下的GitHub今日推出Copilot Enterprise,可根據(jù)企業(yè)內(nèi)部的代碼和知識(shí)庫(kù)定制,每人每月39美元。

13、微軟正測(cè)試Copilot GPT
昨日,微軟副總裁兼Copilot和必應(yīng)工程與產(chǎn)品負(fù)責(zé)人約爾迪·里巴斯(Jordi Ribas)透露,微軟正在測(cè)試Copilot GPT,當(dāng)用戶打開(kāi)Microsoft Copilot時(shí)會(huì)出現(xiàn)一個(gè)新的Copilot GPT列表,可為用戶提供健身訓(xùn)練計(jì)劃、計(jì)劃假期和幫助烹飪等功能。

14、百度2023年凈利潤(rùn)漲39%
據(jù)百度微信公眾號(hào)今日發(fā)文,其2023年?duì)I收為1345.98億元,凈利潤(rùn)287億元,同比增長(zhǎng)39%;其第四季度營(yíng)收349.51億元,凈利潤(rùn)77.55億元,同比增長(zhǎng)44%。其中,AI成為增長(zhǎng)新動(dòng)力,百度智能云、PP飛槳等AI平臺(tái)高速增長(zhǎng),千帆大模型平臺(tái)累計(jì)精調(diào)模型1萬(wàn)個(gè),AI出行平臺(tái)蘿卜快跑第四季度提供乘車服務(wù)83.9萬(wàn)次。
15、百度Comate啟動(dòng)眾測(cè)活動(dòng)
據(jù)百度安全應(yīng)急響應(yīng)中心微信公眾號(hào)今日發(fā)文,百度智能編程工具Comate及千帆大模型平臺(tái)開(kāi)啟專項(xiàng)加碼眾測(cè)活動(dòng),活動(dòng)時(shí)間為2月29日-3月12日,單個(gè)漏洞獎(jiǎng)勵(lì)最高可達(dá)3萬(wàn)元。
16、螞蟻集團(tuán)推出多模態(tài)遙感模型SkySense
螞蟻集團(tuán)今日宣布推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense,這是螞蟻百靈大模型在多模態(tài)領(lǐng)域最新的研發(fā)成果,其論文已被世界計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2024接收。數(shù)據(jù)顯示,SkySense在17項(xiàng)測(cè)試場(chǎng)景中指標(biāo)均超過(guò)國(guó)際同類產(chǎn)品,可用于地貌、農(nóng)作物觀測(cè)和解譯等,有效輔助農(nóng)業(yè)生產(chǎn)和經(jīng)營(yíng)。

17、魅族Aicy語(yǔ)音助手接入AI大模型
據(jù)IT之家報(bào)道,魅族21系列手機(jī)今日獲推Flyme 10.5.0.1A穩(wěn)定版系統(tǒng),語(yǔ)音助手小溪(Aicy)接入大模型,支持自然語(yǔ)言對(duì)話、文檔總結(jié)、知識(shí)問(wèn)答、出行規(guī)劃、運(yùn)動(dòng)健康建議、文案生成等AI功能。

18、OPPO Reno11系列將引入生成式AI功能
昨日,OPPO在2024年世界移動(dòng)通信大會(huì)(MWC 2024)宣布將全面發(fā)力AI領(lǐng)域。OPPO還宣布,今年第二季度,全球OPPO Reno11系列及OPPO Find N3也將引入包括AI消除功能在內(nèi)的一系列生成式AI功能。
19、南京大學(xué)開(kāi)設(shè)AI通識(shí)核心課程體系
昨日,南京大學(xué)宣布將面向全體本科新生開(kāi)設(shè)“人工智能通識(shí)核心課程體系”。南京大學(xué)將建設(shè)“1+X+Y”三層次“人工智能通識(shí)核心課程體系”,以1門必修的AI通識(shí)核心課+X門AI素養(yǎng)課+Y門個(gè)學(xué)科與AI深度融合的前沿拓展課為基礎(chǔ),從知識(shí)、能力、價(jià)值觀與倫理三個(gè)維度開(kāi)展教育教學(xué)。
20、傳Tumblr等計(jì)劃將數(shù)據(jù)出售給AI公司
據(jù)404 Media今日援引內(nèi)部文件報(bào)道,社交平臺(tái)Tumblr和博客網(wǎng)站W(wǎng)ordPress.com的所有者正在與AI公司Midjourney和OpenAI進(jìn)行談判,以提供從用戶帖子中抓取的訓(xùn)練數(shù)據(jù)。
21、Prophesee與高通合作進(jìn)入可量產(chǎn)階段
神經(jīng)擬態(tài)視覺(jué)傳感公司Prophesee 2月27日宣布與高通的合作進(jìn)入可量產(chǎn)階段。在巴塞羅那世界移動(dòng)通信大會(huì)MWC 2024期間,Prophesee展示了其解決方案與驍龍旗艦移動(dòng)平臺(tái)的原生兼容性,以及神經(jīng)擬態(tài)視覺(jué)技術(shù)為智能手機(jī)攝像頭帶來(lái)的速度、能效和成像質(zhì)量方面的提升。Prophesee Metavision事件視覺(jué)傳感器和AI算法針對(duì)驍龍平臺(tái)進(jìn)行了優(yōu)化,使運(yùn)動(dòng)模糊消除的效果和整體圖像的質(zhì)量都得到前所未有的提升,尤其是在快速移動(dòng)和低光等傳統(tǒng)基于幀的RGB傳感器難以應(yīng)對(duì)的場(chǎng)景中。
22、芯片大神Jim Keller創(chuàng)企與日企合作設(shè)計(jì)AI芯片
根據(jù)彭博社昨日?qǐng)?bào)道,日本政府投資的半導(dǎo)體研發(fā)集團(tuán)Rapidus將與加拿大芯片創(chuàng)企Tenstorrent合作設(shè)計(jì)其首款A(yù)I芯片。Tenstorrent將授權(quán)其設(shè)計(jì)日本AI加速器的一部分,并與Rapidus共同設(shè)計(jì)整個(gè)芯片。Tenstorrent成立于2016年,首席執(zhí)行官為芯片界大神吉姆·凱勒(Jim Keller)。Rapidus成立于2022年,計(jì)劃在2027年開(kāi)始芯片生產(chǎn),與臺(tái)積電和三星電子等公司競(jìng)爭(zhēng)。
23、法AI圖像創(chuàng)企獲4300萬(wàn)美元融資
據(jù)TechCrunch昨日?qǐng)?bào)道,法國(guó)AI圖像編輯器創(chuàng)企Photoroom近期以5億美元估值完成了4300萬(wàn)美元融資,Balderton Capital領(lǐng)投此輪融資,新投資者Aglaé和之前的投資者Y Combinator參投。Photoroom目前擁有約50名員工,計(jì)劃利用這筆融資雇用更多員工,并投資于研發(fā)和基礎(chǔ)設(shè)施。
24、字節(jié)推出MegaScale 將LLM訓(xùn)練擴(kuò)展到1萬(wàn)個(gè)GPU
2月24日,來(lái)自字節(jié)和北大的團(tuán)隊(duì)在arXiv上發(fā)表論文,提出大模型生產(chǎn)系統(tǒng)MegaScale。MegaScale將大型語(yǔ)言模型訓(xùn)練擴(kuò)展到超過(guò)10000個(gè)GPU,在12288個(gè)GPU上訓(xùn)練175B LLM模型時(shí),MegaScale實(shí)現(xiàn)了55.2%的模型FLOP利用率(MFU),與層內(nèi)模型并行技術(shù)Megatron-LM相比,MFU提高了1.34倍。
論文地址:
https://arxiv.org/abs/2402.15627