1、谷歌發(fā)布零樣本視頻生成模型VideoPoet
2、谷歌將AI代碼輔助功能擴(kuò)展到所有Colab用戶
3、谷歌將在美國(guó)總統(tǒng)大選前限制選舉相關(guān)AI檢索
4、微軟Copilot引入音樂(lè)生成功能
5、亞馬遜云科技自研芯Graviton3實(shí)例落地中國(guó)
6、亞馬遜的AI評(píng)論摘要被認(rèn)為夸大負(fù)面反饋
7、AI機(jī)器人在迷宮游戲中超越人類
8、百度智能云千帆AppBuilder開(kāi)放服務(wù)
9、智源FlagEval 12月榜發(fā)布,新增魯棒性評(píng)測(cè)
10、摩爾線程首個(gè)千卡智算中心落地
11、港中大團(tuán)隊(duì)開(kāi)源AI音頻工具包Amphion
12、CMU研究稱Gemini Pro不如GPT-3.5 Turbo
13、蓋茨:距美國(guó)大眾廣泛使用AI還有18到24個(gè)月
14、NewsGuard:全球AI虛假新聞網(wǎng)站已達(dá)614個(gè)
15、《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南》發(fā)布
16、輕松集團(tuán)自研大模型升級(jí) 發(fā)布七大AI+健康應(yīng)用
17、AI創(chuàng)企安安創(chuàng)新完成1500萬(wàn)天使輪融資
18、荷蘭地圖平臺(tái)TomTom與微軟合作打造車載AI助手
19、荷蘭數(shù)字金融公司Bunq推出AI聊天機(jī)器人
20、藥品連鎖店因?yàn)E用AI人臉識(shí)別被FTC起訴
1、谷歌發(fā)布零樣本視頻生成模型VideoPoet
今日,谷歌于官網(wǎng)宣布推出用于零樣本視頻生成的大型語(yǔ)言模型VideoPoet。該模型能夠完成多種視頻生成任務(wù),包括文本到視頻、圖像到視頻、視頻風(fēng)格化、視頻修復(fù)、視頻擴(kuò)張以及視頻到音頻。該模型采用的方法在單個(gè)大模型中無(wú)縫集成了多種視頻生成功能,而不是依賴于專門(mén)針對(duì)每項(xiàng)任務(wù)的單獨(dú)訓(xùn)練組件。

2、谷歌將AI代碼輔助功能擴(kuò)展到所有Colab用戶
今日,谷歌于官網(wǎng)宣布將AI代碼輔助功能擴(kuò)展到所有Colab用戶,包括免費(fèi)用戶,現(xiàn)已在175個(gè)地區(qū)推出。Colab是谷歌提供的一個(gè)在線工作平臺(tái),可以免費(fèi)使用GPU進(jìn)行深度學(xué)習(xí),支持Jupyter Notebook和代碼執(zhí)行程序。
3、谷歌將在美國(guó)總統(tǒng)大選前限制選舉相關(guān)AI檢索
據(jù)路透社報(bào)道,谷歌于當(dāng)?shù)貢r(shí)間周二宣布,在2024年美國(guó)總統(tǒng)大選之前,它將限制其聊天機(jī)器人Bard和搜索生成體驗(yàn)所能返回的與選舉有關(guān)的查詢類型,這些限制將于2024年初開(kāi)始實(shí)施。
4、微軟Copilot引入音樂(lè)生成功能
今日,微軟于官網(wǎng)宣布與AI音樂(lè)創(chuàng)作公司Suno合作,以插件形式將其功能引入微軟Copilot,使用戶可以通過(guò)簡(jiǎn)單的提示輕松創(chuàng)作有趣、巧妙和個(gè)性化的歌曲。

5、亞馬遜云科技自研芯Graviton3實(shí)例落地中國(guó)
12月15日,亞馬遜云科技宣布,通過(guò)與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,其在亞馬遜云科技北京區(qū)域和寧夏區(qū)域推出基于自研芯片Amazon Graviton3處理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g計(jì)算優(yōu)化型和R7g內(nèi)存優(yōu)化型三款實(shí)例。這些實(shí)例均基于Amazon Nitro System構(gòu)建,與采用Amazon Graviton2的實(shí)例相比,整體性能提升高達(dá)25%,內(nèi)存帶寬提升50%,同時(shí)能耗更低,能效提升高達(dá)60%。其中,M7g實(shí)例適用于如應(yīng)用程序服務(wù)器、微服務(wù)、游戲服務(wù)器等,C7g 實(shí)例適用于如高性能計(jì)算、視頻編碼、游戲和基于CPU的機(jī)器學(xué)習(xí)推理加速等計(jì)算密集型應(yīng)用程序,R7g實(shí)例適用于如開(kāi)源數(shù)據(jù)庫(kù)、內(nèi)存緩存和實(shí)時(shí)大數(shù)據(jù)分析等內(nèi)存密集型工作負(fù)載。
6、亞馬遜的AI評(píng)論摘要被認(rèn)為夸大負(fù)面反饋
據(jù)彭博社昨日?qǐng)?bào)道,亞馬遜的AI商品評(píng)論摘要功能有時(shí)會(huì)提供不準(zhǔn)確的產(chǎn)品描述,或是夸大負(fù)面反饋。一些商家稱,這些摘要是在他們即將進(jìn)入關(guān)鍵的假日購(gòu)物季時(shí)部署的。彭博社審查了數(shù)十篇評(píng)論摘要發(fā)現(xiàn),AI在分析顧客評(píng)論和生成評(píng)論摘要時(shí)并不一致,有的突出了批評(píng)性反饋,有的則沒(méi)有。
7、AI機(jī)器人在迷宮游戲中超越人類
據(jù)彭博社報(bào)道,蘇黎世聯(lián)邦理工學(xué)院的研究人員創(chuàng)造了一個(gè)名為CyberRunner的AI機(jī)器人,其在迷宮游戲Labyrinth中的表現(xiàn)超過(guò)了人類。據(jù)稱,該機(jī)器人通過(guò)傾斜表面使一個(gè)小金屬球穿過(guò)迷宮,避開(kāi)棋盤(pán)上的洞,僅用了六個(gè)小時(shí)就掌握了這個(gè)玩具。相關(guān)論文于當(dāng)?shù)貢r(shí)間周二發(fā)布,介紹了其建立在基于模型的強(qiáng)化學(xué)習(xí)領(lǐng)域的最新進(jìn)展之上的模型,讓AI通過(guò)試錯(cuò)來(lái)學(xué)習(xí)如何在動(dòng)態(tài)環(huán)境中行動(dòng)。該項(xiàng)目現(xiàn)已開(kāi)源發(fā)布,用戶可支付200美元以使用CyberRunner平臺(tái)協(xié)調(diào)大規(guī)模實(shí)驗(yàn)。

8、百度智能云千帆AppBuilder開(kāi)放服務(wù)
今日,百度智能云宣布,AI原生應(yīng)用開(kāi)發(fā)工作臺(tái)——千帆AppBuilder全面開(kāi)放服務(wù)。據(jù)了解,AppBuilder提供兩種產(chǎn)品形態(tài),代碼態(tài)與低代碼態(tài)。對(duì)于有深度AI原生應(yīng)用開(kāi)發(fā)需求的用戶,AppBuilder代碼態(tài)提供包括SDK、開(kāi)發(fā)環(huán)境、調(diào)試工具、示例代碼等各種開(kāi)發(fā)套件和應(yīng)用組件;而AppBuilder低碼態(tài)則提供可視化工具,用戶只需簡(jiǎn)單點(diǎn)選,即可快速定制、上線AI原生應(yīng)用。
9、智源FlagEval 12月榜發(fā)布,新增魯棒性評(píng)測(cè)
據(jù)智源研究院微信公眾號(hào)發(fā)文,今日,F(xiàn)lagEval大語(yǔ)言模型測(cè)評(píng)榜單12月榜發(fā)布,本期榜單新增大語(yǔ)言模型魯棒性評(píng)測(cè)結(jié)果,考察模型對(duì)于輸入文本的抗干擾能力;FlagEval平臺(tái)更新了C-SEM v2.0數(shù)據(jù)集評(píng)測(cè)結(jié)果,新增了最新開(kāi)源的Qwen-72B/1.8B、DeepSeek-67B(Base)模型評(píng)測(cè)。其中,Qwen-72B-Chat模型主觀評(píng)測(cè)結(jié)果大幅領(lǐng)先,準(zhǔn)確率達(dá)83.6%。
據(jù)悉,北京航空航天大學(xué)與智源FlagEval團(tuán)隊(duì)共同構(gòu)建了大語(yǔ)言模型魯棒性評(píng)測(cè)方案,并針對(duì)當(dāng)前主流模型進(jìn)行了初步評(píng)測(cè),本期魯棒性評(píng)測(cè)數(shù)據(jù)集和評(píng)測(cè)結(jié)果分為兩個(gè)部分:內(nèi)容擾動(dòng)魯棒性評(píng)測(cè)(北京航空航天大學(xué)構(gòu)建),針對(duì)選擇問(wèn)答、文本分類、代碼生成任務(wù)下的MMLU、OCNLI、CSL、HumanEval測(cè)試集進(jìn)行字符(Char)、單詞(Word)、句子(Sentence)三個(gè)級(jí)別進(jìn)行內(nèi)容擾動(dòng)以及對(duì)抗性擾動(dòng)(即采用代理模型和相關(guān)算法進(jìn)行對(duì)抗性攻擊),生成了不同的擾動(dòng)數(shù)據(jù)集;格式擾動(dòng)魯棒性評(píng)測(cè)(智源FlagEval團(tuán)隊(duì)構(gòu)建),基于MMLU_Chinese、MMLU、Gaokao2023_v2.0數(shù)據(jù)集,進(jìn)行選項(xiàng)格式擾動(dòng),考察模型是否真正理解了問(wèn)題和選項(xiàng)并遵從指令的格式要求作答。例如,四個(gè)選項(xiàng)的內(nèi)容調(diào)換順序,或者將A、B、C、D改為B、D、C、E。
詳細(xì)測(cè)評(píng)結(jié)果:flageval.baai.ac.cn/#/trending

10、摩爾線程首個(gè)千卡智算中心落地
據(jù)摩爾線程微信公眾號(hào)發(fā)文,昨日,摩爾線程首個(gè)全國(guó)產(chǎn)千卡千億模型訓(xùn)練平臺(tái)——摩爾線程KUAE智算中心揭幕儀式在北京成功舉辦,宣告國(guó)內(nèi)首個(gè)以國(guó)產(chǎn)全功能GPU為底座的大規(guī)模算力集群正式落地。同時(shí),摩爾線程CEO張建中發(fā)布了大模型智算加速卡MTT S4000、專為千億參數(shù)大模型訓(xùn)練和推理提供強(qiáng)大支持的摩爾線程KUAE平臺(tái)。據(jù)悉,摩爾線程KUAE支持包括DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale在內(nèi)的業(yè)界主流分布式框架,并融合了多種并行算法策略,包括數(shù)據(jù)并行、張量并行、流水線并行和ZeRO,且針對(duì)高效通信計(jì)算并行和Flash Attention做了額外優(yōu)化。
11、港中大團(tuán)隊(duì)開(kāi)源AI音頻工具包Amphion
12月18日,香港中文大學(xué)(深圳)武執(zhí)政副教授帶領(lǐng)的團(tuán)隊(duì)聯(lián)合上海AI實(shí)驗(yàn)室等開(kāi)源了音頻、音樂(lè)和語(yǔ)音生成工具包Amphion v0.1版本。除了文字轉(zhuǎn)語(yǔ)音功能,Amphion還可以將一首歌的聲音換成另一個(gè)歌手的聲音,支持聲音轉(zhuǎn)換、歌聲合成、文本到音頻、文本到音樂(lè)等功能,歌聲轉(zhuǎn)換目前支持邁克爾·杰克遜、泰勒·斯威夫特、王菲、那英、李健等歌手的聲音。該工具包支持多種模型和架構(gòu),如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音頻生成任務(wù)。
論文地址:
arxiv.org/abs/2312.09911
聲音轉(zhuǎn)換Demo地址:
huggingface.co/spaces/amphion/singing_voice_conversion

12、CMU研究稱Gemini Pro不如GPT-3.5 Turbo
據(jù)VentureBeat報(bào)道,昨日,卡內(nèi)基梅隆大學(xué)(CMU)和BerriAI的研究人員共同發(fā)表了一篇論文,將谷歌的Gemini Pro模型與OpenAI的GPT-3.5 Turbo、GPT-4 Turbo以及Mistral AI的Mixtral 8x7B進(jìn)行了測(cè)試對(duì)比,通過(guò)一組不同的提示運(yùn)行所有模型,包括向他們?cè)儐?wèn)57個(gè)不同的多項(xiàng)選擇題,涉及STEM、人文科學(xué)、社會(huì)科學(xué)等方面的內(nèi)容。測(cè)試結(jié)果顯示,Gemini Pro得分在十幾個(gè)數(shù)據(jù)集的測(cè)試上表現(xiàn)都不如GPT-3.5 Turbo。研究人員還發(fā)現(xiàn),當(dāng)提示不同的模型在標(biāo)記為A、B、C或D的答案之間進(jìn)行選擇時(shí),Gemini選擇“D”的次數(shù)比其他模型不成比例地多,無(wú)論它是否是正確的答案。
論文地址:arxiv.org/pdf/2312.11444.pdf


13、蓋茨:距美國(guó)大眾廣泛使用AI還有18到24個(gè)月
比爾蓋茨昨日發(fā)布年度展望博客,其中談道:“如果讓我做個(gè)預(yù)測(cè),在美國(guó)這樣的高收入國(guó)家,我猜離普通民眾大量使用AI還有18-24個(gè)月的時(shí)間。而在非洲國(guó)家,我預(yù)計(jì)在3年左右的時(shí)間里,AI的使用就會(huì)達(dá)到相當(dāng)?shù)乃健_@仍然是一個(gè)差距,但比我們?cè)谄渌麆?chuàng)新中看到的滯后時(shí)間要短得多。”他還提到,希望AI在抗生素藥物、個(gè)性化教育、高危妊娠治療、艾滋病風(fēng)險(xiǎn)評(píng)估、醫(yī)療信息獲取等方面能夠得到更廣泛的應(yīng)用。
14、NewsGuard:全球AI虛假新聞網(wǎng)站已達(dá)614個(gè)
新聞數(shù)據(jù)集網(wǎng)站NewsGuard昨日發(fā)布報(bào)告稱,迄今為止,NewsGuard的團(tuán)隊(duì)已識(shí)別出614個(gè)不可靠的AI生成的新聞和信息網(wǎng)站,涵蓋15種語(yǔ)言。相比今年4月的49個(gè),虛假新聞網(wǎng)站的數(shù)量增加了1153%。這些網(wǎng)站大多使用一些諸如“商業(yè)日?qǐng)?bào)”(iBusiness Day)、“愛(ài)爾蘭頭條新聞”(Ireland Top News)、“每日時(shí)事更新”(Daily Time Update)等看似權(quán)威的名稱,對(duì)于消費(fèi)者來(lái)說(shuō)難以辨認(rèn)。這些網(wǎng)站發(fā)布的文章涉及政治、技術(shù)、娛樂(lè)和旅游等主題,包含名人死亡騙局、捏造事件以及將舊事件描述為剛剛發(fā)生等虛假內(nèi)容。
15、《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南》發(fā)布
今日,中國(guó)音像與數(shù)字出版協(xié)會(huì)發(fā)布關(guān)于發(fā)布團(tuán)體標(biāo)準(zhǔn)《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南》的公告,該指南經(jīng)立項(xiàng)審核、標(biāo)準(zhǔn)起草、征求意見(jiàn)、專家組審查等程序,并通過(guò)團(tuán)標(biāo)委審查,現(xiàn)予以批準(zhǔn)發(fā)布。標(biāo)準(zhǔn)編號(hào)為T(mén)/CADPA 47-2023,自2024年1月20日起開(kāi)始實(shí)施。
《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南(征求意見(jiàn)稿)》原文地址:
https://web-yinxiang.oss-cn-beijing.aliyuncs.com/yinxiang/upload/yinxiang/file/20231114/1699945418432981.pdf
16、輕松集團(tuán)自研大模型升級(jí) 發(fā)布七大AI+健康應(yīng)用
據(jù)醫(yī)療健康企業(yè)輕松集團(tuán)微信公眾號(hào)發(fā)文,12月19日,輕松集團(tuán)旗下醫(yī)療健康服務(wù)平臺(tái)輕松健康,宣布其自研的垂直領(lǐng)域大模型“輕松問(wèn)醫(yī)Dr.GPT”全面升級(jí)。同時(shí),輕松健康還發(fā)布了基于該大模型研發(fā)七大應(yīng)用,以滿足不同應(yīng)用場(chǎng)景及用戶群體的特定需求,包括“智能問(wèn)診系統(tǒng)”“個(gè)性化健康管理顧問(wèn)”“慢性病管理計(jì)劃”“心理健康指導(dǎo)師”“醫(yī)學(xué)知識(shí)庫(kù)和技能培訓(xùn)平臺(tái)”“輔助診療助手”“患教內(nèi)容智創(chuàng)平臺(tái)”,覆蓋健康管理服務(wù)全場(chǎng)景應(yīng)用。
17、AI創(chuàng)企安安創(chuàng)新完成1500萬(wàn)天使輪融資
據(jù)36氪昨日?qǐng)?bào)道,AI創(chuàng)企安安創(chuàng)新近期完成一輪近1500萬(wàn)元天使輪融資,投資方為個(gè)人股東。據(jù)悉,安安創(chuàng)新是一家企業(yè)服務(wù)賽道的創(chuàng)業(yè)公司,創(chuàng)立于2021年,公司主要面向民營(yíng)企業(yè)服務(wù),針對(duì)企業(yè)的“治理、管理、金融、財(cái)稅、法律”5個(gè)維度難題,通過(guò)大模型等AI工具進(jìn)行智能診斷,結(jié)合自主知識(shí)圖譜+專家知識(shí)庫(kù),輸出專業(yè)解決方案。
18、荷蘭地圖平臺(tái)TomTom與微軟合作打造車載AI助手
據(jù)路透社報(bào)道,荷蘭數(shù)字地圖平臺(tái)TomTom于當(dāng)?shù)貢r(shí)間周二宣布,將與微軟合作打造一款基于AI的車輛對(duì)話助手。該助手將允許用戶通過(guò)自然語(yǔ)言與車輛交談,并實(shí)現(xiàn)與信息娛樂(lè)、位置搜索和車輛命令系統(tǒng)的語(yǔ)音交互。TomTom稱,該語(yǔ)音助手可以集成到其他汽車信息娛樂(lè)系統(tǒng)中,也可以內(nèi)置到TomTom的數(shù)字駕駛艙中,是一個(gè)開(kāi)放的模塊化車載信息娛樂(lè)平臺(tái)。
19、荷蘭數(shù)字金融公司Bunq推出AI聊天機(jī)器人
據(jù)彭博社今日?qǐng)?bào)道,荷蘭數(shù)字金融公司Bunq推出一款A(yù)I聊天機(jī)器人Finn,支持用戶查詢自己的支出信息。Finn建立在現(xiàn)有大型語(yǔ)言模型之上,并利用客戶在Bunq平臺(tái)上的消費(fèi)信息進(jìn)行訓(xùn)練,由十幾名數(shù)據(jù)專家歷時(shí)一年構(gòu)建。

20、藥品連鎖店因?yàn)E用AI人臉識(shí)別被FTC起訴
據(jù)彭博社報(bào)道,美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)在當(dāng)?shù)貢r(shí)間周二提交給聯(lián)邦法院的一份訴狀中稱,藥品連鎖巨頭Rite Aid在紐約、洛杉磯、巴爾的摩等城市的門(mén)店使用了AI面部識(shí)別系統(tǒng),但沒(méi)有通知顧客。據(jù)該機(jī)構(gòu)稱,Rite Aid的面部識(shí)別系統(tǒng)產(chǎn)生了數(shù)千個(gè)不正確的識(shí)別,通常涉及黑人、拉丁裔或女性。由于匹配不當(dāng),Rite Aid員工會(huì)在商店周圍跟蹤顧客、報(bào)警,有時(shí)甚至謊稱顧客入店行竊。作為與聯(lián)邦貿(mào)易委員會(huì)和解的一部分,該連鎖店同意在未來(lái)五年內(nèi)不使用面部識(shí)別技術(shù)進(jìn)行監(jiān)控,刪除迄今為止收集的圖像,并向聯(lián)邦貿(mào)易委員會(huì)提供有關(guān)其合規(guī)情況的年度報(bào)告。