1、李飛飛谷歌聯(lián)合發(fā)布AI視頻擴(kuò)散模型W.A.L.T
2、馬斯克Grok出現(xiàn)幻覺 自稱是OpenAI產(chǎn)品
3、OpenAI聯(lián)創(chuàng)10年前論文獲NeurIPS 2023時(shí)間檢驗(yàn)獎(jiǎng)
4、法國(guó)AI創(chuàng)企Mistral估值達(dá)20億美元
5、Mistral AI發(fā)布專家混合模型Mixtral 8x7B
6、Runway宣布開展通用世界模型研發(fā)
7、微軟與美國(guó)勞聯(lián)-產(chǎn)聯(lián)合作 確保AI為工人服務(wù)
8、網(wǎng)信辦:整治AI生成虛假短視頻內(nèi)容
9、阿里云前首席安全科學(xué)家創(chuàng)業(yè)個(gè)人AI計(jì)算機(jī)
10、京東前副總裁AI創(chuàng)企獲科大訊飛領(lǐng)投新融資
11、傳華為云大模型核心成員顧曉韜加入智譜AI
12、零一萬物再度澄清套殼爭(zhēng)議
13、社交平臺(tái)Soul推出自研大模型SoulX
14、海通證券發(fā)布“泛海言道”金融大模型
1、李飛飛谷歌聯(lián)合發(fā)布AI視頻擴(kuò)散模型W.A.L.T
今日凌晨,李飛飛的斯坦福團(tuán)隊(duì)與谷歌聯(lián)合發(fā)布用于生成逼真視頻的擴(kuò)散模型W.A.L.T,基于Transformer訓(xùn)練而成,支持文生視頻、圖生視頻和3D攝像機(jī)運(yùn)動(dòng)。據(jù)介紹,該方法有兩個(gè)關(guān)鍵的設(shè)計(jì),一是使用因果編碼器,在統(tǒng)一的潛空間內(nèi)聯(lián)合壓縮圖像和視頻,從而實(shí)現(xiàn)跨模態(tài)的訓(xùn)練和生成;二是為了提高記憶和訓(xùn)練效率,使用了為空間和時(shí)空聯(lián)合生成建模量身定制的窗口注意力架構(gòu)。最后,團(tuán)隊(duì)針對(duì)文本到視頻的生成任務(wù)訓(xùn)練了由三個(gè)模型組成的級(jí)聯(lián),包括一個(gè)基本潛在視頻擴(kuò)散模型和兩個(gè)視頻超分辨率擴(kuò)散模型,能夠以每秒8幀的速度生成分辨率為512*896的視頻。
項(xiàng)目地址:walt-video-diffusion.github.io/
論文地址:walt-video-diffusion.github.io/assets/W.A.L.T.pdf

2、馬斯克Grok出現(xiàn)幻覺 自稱是OpenAI產(chǎn)品
近日有多名網(wǎng)友反饋,馬斯克xAI公司的聊天機(jī)器人Grok出現(xiàn)“幻覺”問題。職業(yè)黑客Jax Winterbourne在進(jìn)行紅隊(duì)測(cè)試時(shí)發(fā)現(xiàn),當(dāng)他要求Grok創(chuàng)建惡意軟件時(shí),Grok會(huì)回復(fù)“我無法滿足您的要求,因?yàn)檫@有悖于OpenAI的政策”,因此質(zhì)疑Grok抄襲了OpenAI的代碼庫。對(duì)此,xAI技術(shù)人員Igor Babuschkin回應(yīng)道:“這里的問題是,網(wǎng)絡(luò)上充滿了ChatGPT輸出,因此我們?cè)谑褂么罅烤W(wǎng)絡(luò)數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),不小心收集到了其中一些。當(dāng)我們第一次注意到這個(gè)問題時(shí),我們感到非常驚訝。不管怎么說,這個(gè)問題非常罕見。既然我們已經(jīng)意識(shí)到了,就會(huì)確保未來版本的Grok不會(huì)出現(xiàn)這個(gè)問題。別擔(dān)心,Grok沒有使用OpenAI的代碼?!?/p>

但也有網(wǎng)友對(duì)他說的“罕見”提出質(zhì)疑。博主@ideasthesia跟帖稱:“只是為了給幻覺問題提供更多例子,它可能并不像你想象的那么罕見?!辈⑸蟼髁艘粡埥貓D,當(dāng)他問Grok世界上最強(qiáng)的大模型是什么時(shí),Grok回答是“xAI公司創(chuàng)建的GPT4”。

3、OpenAI聯(lián)創(chuàng)10年前論文獲NeurIPS 2023時(shí)間檢驗(yàn)獎(jiǎng)
今日,神經(jīng)信息處理系統(tǒng)大會(huì)NeurIPS公布了今年的獲獎(jiǎng)?wù)撐?,包括時(shí)間檢驗(yàn)獎(jiǎng)、兩篇杰出論文 、兩篇杰出論文亞軍(Runner-Ups )、兩篇優(yōu)秀數(shù)據(jù)集和基準(zhǔn)論文,其中大部分論文都圍繞大型語言模型展開。獲得時(shí)間檢驗(yàn)獎(jiǎng)的是一篇10年前由谷歌團(tuán)隊(duì)發(fā)布的論文,作者包括現(xiàn)在的OpenAI首席科學(xué)家Ilya Sutskever。NeurIPS稱,該論文介紹了開創(chuàng)性的詞嵌入技術(shù)word2vec,展示了從大量非結(jié)構(gòu)化文本中學(xué)習(xí)的力量,促進(jìn)了標(biāo)志著自然語言處理新時(shí)代開始的進(jìn)步,被引量超過4萬次。
論文地址:arxiv.org/pdf/1310.4546

4、法國(guó)AI創(chuàng)企Mistral估值達(dá)20億美元
據(jù)彭博社昨日?qǐng)?bào)道,法國(guó)AI創(chuàng)企Mistral完成了新一輪4.15億美元融資(約合人民幣29.8億元),本輪融資對(duì)該公司的估值約為20億美元(約合人民幣143.5億元)。該公司在周一的一份聲明中稱,本輪融資由硅谷風(fēng)險(xiǎn)投資公司Andreessen Horowitz和初始支持者光速創(chuàng)投(Lightspeed Ventures)牽頭。Mistral由來自谷歌DeepMind和Meta的科學(xué)家創(chuàng)立,成立僅7個(gè)月,其最新發(fā)布的專家模型在基準(zhǔn)測(cè)評(píng)中超越Llama 2,對(duì)標(biāo)GPT-3.5。
5、Mistral AI發(fā)布專家混合模型Mixtral 8x7B
繼上周五突然開源8x7B模型但未作任何介紹后,今日,法國(guó)AI創(chuàng)企Mistral AI于官網(wǎng)宣布正式發(fā)布該模型,名為Mixtral 8x7B,是一個(gè)具有開放權(quán)重的高質(zhì)量稀疏專家混合模型(SMoE)。據(jù)介紹,該模型采用Apache 2.0許可,在大多數(shù)基準(zhǔn)測(cè)試中的表現(xiàn)都優(yōu)于Llama 2 70B且推理速度快6倍,測(cè)評(píng)成績(jī)能與GPT-3.5相媲美,甚至優(yōu)于GPT-3.5。Mixtral可以處理32k長(zhǎng)度的上下文,支持英語、法語、意大利語、德語和西班牙語,具有強(qiáng)大的代碼生成能力。具體來說,Mixtral擁有467億總參數(shù),但每個(gè)令牌只使用129億個(gè)參數(shù)。因此,它處理輸入和生成輸出的速度和成本與12.9B模型相同。
同時(shí),Mistral開放了第一個(gè)平臺(tái)服務(wù)的測(cè)試版,該平臺(tái)目前提供三個(gè)聊天端點(diǎn),用于根據(jù)文本指令生成文本,還有一個(gè)嵌入端點(diǎn)。據(jù)介紹,前兩個(gè)端點(diǎn)(mistral-tiny和mistral-small)分別使用Mistral 7B和剛發(fā)布的Mixtral 8x7B;第三個(gè)端點(diǎn)(mistral-medium)使用的是性能更高的原型模型,該模型目前仍在部署環(huán)境中測(cè)試。
平臺(tái)地址:console.mistral.ai

6、Runway宣布開展通用世界模型研發(fā)
昨日晚間,AI創(chuàng)企Runway于官網(wǎng)宣布開展圍繞通用世界模型(General World Models)的長(zhǎng)期研究工作,目標(biāo)是表現(xiàn)和模擬與現(xiàn)實(shí)世界中一致的廣泛的互動(dòng)。Runway稱,其目前的Gen-2等視頻生成系統(tǒng)可以看作是非常早期的通用世界模型,對(duì)物理和運(yùn)動(dòng)有一定的了解,但在處理復(fù)雜的攝像機(jī)或物體運(yùn)動(dòng)等問題上仍有困難。為了建立通用的世界模型,Runway正在進(jìn)行幾項(xiàng)公開的研究,包括生成環(huán)境地圖,在環(huán)境中導(dǎo)航和交互,捕捉世界和世界中居民的動(dòng)態(tài),建立逼真的人類行為模型等。
7、微軟與美國(guó)勞聯(lián)-產(chǎn)聯(lián)合作 確保AI為工人服務(wù)
據(jù)美通社報(bào)道,昨日,微軟宣布與美國(guó)勞工聯(lián)合會(huì)-產(chǎn)業(yè)工會(huì)聯(lián)合會(huì)(AFL-CIO)就AI和勞動(dòng)力達(dá)成合作協(xié)議。為確保AI為美國(guó)工人服務(wù),將主要實(shí)現(xiàn)三個(gè)目標(biāo):1、與工會(huì)領(lǐng)袖和工人分享有關(guān)AI技術(shù)趨勢(shì)的深度信息;2、將工人的觀點(diǎn)和專業(yè)知識(shí)納入AI技術(shù)的開發(fā);3、幫助制定支持一線工人技術(shù)技能和需求的公共政策。
8、網(wǎng)信辦:整治AI生成虛假短視頻內(nèi)容
據(jù)網(wǎng)信中國(guó)微信公眾號(hào)今日發(fā)文,12月5日,中央網(wǎng)信辦開展為期一個(gè)月的“清朗·整治短視頻信息內(nèi)容導(dǎo)向不良問題”專項(xiàng)行動(dòng)。其中提到,集中整治技術(shù)生成虛假短視頻,包括使用AI等技術(shù)編造、拼接內(nèi)容,違法使用他人肖像和聲音進(jìn)行人臉替換或人聲合成,生成虛假短視頻。
9、阿里云前首席安全科學(xué)家創(chuàng)業(yè)個(gè)人AI計(jì)算機(jī)
企查查信息顯示,今日,杭州云麓知道科技有限公司發(fā)生企業(yè)名稱變更,變更為“杭州半個(gè)宇宙科技有限公司”,同時(shí)企業(yè)人員發(fā)生重大變更,法定代表人、大股東從張宏變更為吳翰清。官網(wǎng)顯示,KMind(半個(gè)宇宙)公司由前阿里巴巴研究員吳翰清(道哥)聯(lián)合2名聯(lián)合創(chuàng)始人和13名創(chuàng)始團(tuán)隊(duì)成員于2023年創(chuàng)立,并于12月推出“半個(gè)宇宙”操作系統(tǒng),提供一個(gè)由kOS驅(qū)動(dòng)的個(gè)人AI計(jì)算機(jī)給所有普通用戶使用,幫助人們處理數(shù)據(jù)。KMind的使命是發(fā)明新型的個(gè)人AI計(jì)算機(jī)(PAIC,Personal AI Computer),打破當(dāng)代互聯(lián)網(wǎng)大公司的數(shù)據(jù)壟斷,讓數(shù)據(jù)為個(gè)人、小微企業(yè)創(chuàng)造價(jià)值,最終實(shí)現(xiàn)自由、開放、共享、平等的AI互聯(lián)網(wǎng)。據(jù)悉,吳翰清曾任阿里云首席安全科學(xué)家、云盾負(fù)責(zé)人,于今年5月從阿里離職,當(dāng)時(shí)曾有媒體報(bào)道稱他將投身于AI短視頻賽道創(chuàng)業(yè)。
半個(gè)宇宙官網(wǎng)地址:kmind.cn

10、京東前副總裁AI創(chuàng)企獲科大訊飛領(lǐng)投新融資
據(jù)36氪報(bào)道,AI創(chuàng)企HiDream.ai近期完成新一輪融資,由科大訊飛創(chuàng)投基金領(lǐng)投,將門創(chuàng)投等多家機(jī)構(gòu)跟投。其中,上一輪投資的阿爾法公社、中喝大種子一號(hào)基金再次跟投。本輪融資將用于產(chǎn)品研發(fā)、電商場(chǎng)景的市場(chǎng)拓展和C端產(chǎn)品出海方向的發(fā)展等。據(jù)悉,HiDream.ai由前京東集團(tuán)副總裁、京東探索研究院副院長(zhǎng)梅濤博士于2023年初創(chuàng)立,定位于圍繞視覺方向,打造生成式多模態(tài)基礎(chǔ)模型及應(yīng)用。
11、傳華為云大模型核心成員顧曉韜加入智譜AI
據(jù)AI科技評(píng)論今日?qǐng)?bào)道,華為云大模型團(tuán)隊(duì)一核心技術(shù)骨干顧曉韜近日將離職,加入智譜AI。據(jù)悉,顧曉韜主要參與華為云的NLP與大模型研發(fā)工作,是盤古大模型的三個(gè)算法負(fù)責(zé)人之一,負(fù)責(zé)預(yù)訓(xùn)練,其他兩人是負(fù)責(zé)監(jiān)督微調(diào)的史佳欣與負(fù)責(zé)強(qiáng)化的朱疆成。本科期間,顧曉韜曾進(jìn)入清華大學(xué)知識(shí)工程實(shí)驗(yàn)室做科研實(shí)習(xí),師從智譜AI創(chuàng)始人唐杰,做數(shù)據(jù)挖掘、模型訓(xùn)練等方面的相關(guān)研究。他參與了清華大學(xué)Aminer數(shù)據(jù)挖掘系統(tǒng)開發(fā)工作,并獲得一項(xiàng)“基于人名的郵箱地址推薦方法及系統(tǒng)”的專利,而Aminer由唐杰主導(dǎo),也是智譜AI起家的第一塊業(yè)務(wù)。
12、零一萬物再度澄清套殼爭(zhēng)議
據(jù)DoNews昨日?qǐng)?bào)道,零一萬物稱,公司內(nèi)部經(jīng)過幾個(gè)周的國(guó)際國(guó)內(nèi)法律研判,已經(jīng)確認(rèn)完全不涉及套殼、抄襲,并給出了進(jìn)一步的澄清。此前,向零一萬物官方發(fā)郵件建議修改張量名稱的Eric Hartford也于社交平臺(tái)X上為其澄清,稱零一萬物“沒有在任何事情上撒謊,他們從零開始使用自己創(chuàng)建的數(shù)據(jù)集訓(xùn)練Yi,對(duì)開源領(lǐng)域的貢獻(xiàn)是值得贊揚(yáng)的”。此外據(jù)零一萬物微信公眾號(hào)昨日發(fā)文,Yi-34B系列模型近期在斯坦福大學(xué)研發(fā)的大語言模型評(píng)測(cè)AlpacaEval Leaderboard中,以94.08%的勝率超越Llama 2、Claude 2、ChatGPT等模型,成為世界范圍內(nèi)僅次于GPT-4英語能力的大語言模型,并且是經(jīng)由Alpaca官方認(rèn)證為數(shù)不多的開源模型。同一周,在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中,Yi-34B-Chat以1102的Elo評(píng)分,晉升最新開源SOTA開源模型之列,性能表現(xiàn)追平GPT-3.5。
模型地址:
huggingface.co/01-ai/
modelscope.cn/organization/01ai
13、社交平臺(tái)Soul推出自研大模型SoulX
據(jù)新浪科技報(bào)道,新型社交平臺(tái)Soul近日宣布上線自研語言大模型SoulX。據(jù)了解,該模型基于海量數(shù)據(jù)訓(xùn)練,具備Prompt驅(qū)動(dòng)、條件可控生成、上下文理解、多模態(tài)理解等能力。在保證對(duì)話流暢、自然、具備情感溫度的同時(shí),能覆蓋百種細(xì)粒度風(fēng)險(xiǎn)類別,通過訓(xùn)練數(shù)據(jù)安全篩選、安全SFT數(shù)據(jù)構(gòu)造、RLHF安全對(duì)齊、推理攔截等策略來構(gòu)建安全體系,保證了大模型的內(nèi)容生產(chǎn)質(zhì)量和安全性。
14、海通證券發(fā)布“泛海言道”金融大模型
據(jù)海通證券微信公眾號(hào)發(fā)文,12月10日,在第五屆上海金融科技國(guó)際論壇智慧金融平行論壇上,海通證券正式發(fā)布“泛海言道”大模型。據(jù)介紹,“泛海言道”綜合應(yīng)用前沿大模型技術(shù),成功落地智能問答、智能研報(bào)、智能研發(fā)等業(yè)務(wù)場(chǎng)景,可結(jié)合互聯(lián)網(wǎng)檢索引擎,為外部客戶和內(nèi)部員工提供即時(shí)、高質(zhì)量的問答服務(wù);通過樣例示范學(xué)習(xí)能力,深度解讀、分析財(cái)報(bào)數(shù)據(jù),生成研報(bào)初稿,為研究人員提供專業(yè)可靠的寫作服務(wù);可嵌入開發(fā)環(huán)境,快速識(shí)別開發(fā)人員代碼需求,支持多種編程語言,自動(dòng)生成高質(zhì)量程序,為開發(fā)人員提供高效研發(fā)服務(wù)。