1、ChatGPT將推出語音和圖像輸入功能

2、OpenAI發(fā)布視覺模型GPT-4V及其系統(tǒng)卡論文

3、Spotify合作OpenAI推出AI語音翻譯功能

4、Getty合作英偉達(dá)推出生成式AI工具

5、微軟招聘核技術(shù)經(jīng)理 或用核電供能AI數(shù)據(jù)中心

6、百度發(fā)布首個(gè)量子領(lǐng)域大模型及兩大AI原生應(yīng)用

7、合合信息等發(fā)布業(yè)內(nèi)首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫(kù)

8、抖音上線地方方言AI自動(dòng)翻譯功能

9、中美多家機(jī)構(gòu)聯(lián)合發(fā)布大模型可解釋性技術(shù)綜述

10、潞晨與瀾舟將合作打造企業(yè)級(jí)LLM解決方案

11、中國(guó)電信在深圳成立含AI軟件業(yè)務(wù)數(shù)智公司

12、梅安森計(jì)劃推出第一代礦山安全模型

13、耐能宣布完成9700萬美元B輪融資

14、AI醫(yī)療公司惠每科技宣布完成超3億元D輪融資

15、諾和諾德合作Valo 基于AI尋求CMD新療法

16、諾基亞將在迪拜設(shè)實(shí)驗(yàn)室推動(dòng)AI技術(shù)應(yīng)用

17、木頭姐:在AI方面有比英偉達(dá)更好的賭注

18、英國(guó)政府:AI對(duì)多邊體系構(gòu)成了“嚴(yán)峻考驗(yàn)”

1、ChatGPT將推出語音和圖像輸入功能

當(dāng)?shù)貢r(shí)間25日,OpenAI于官網(wǎng)宣布將在ChatGPT中推出新的語音和圖像功能,允許用戶進(jìn)行語音對(duì)話、上傳圖像。該系列功能將在兩周內(nèi)于Plus和企業(yè)版推出,其中,語音功能將在iOS和安卓平臺(tái)提供,圖像功能將在所有平臺(tái)提供。據(jù)介紹,新的語音功能由新的文本轉(zhuǎn)語音模型提供支持,能夠僅從文本和幾秒的樣本語音中生成類似人類的音頻,OpenAI與專業(yè)配音演員合作創(chuàng)作了每一個(gè)聲音,并使用開源語音識(shí)別系統(tǒng)Whisper將用戶的口語轉(zhuǎn)錄為文本。圖像理解由多模態(tài)GPT-3.5和GPT-4提供支持,這些模型將其語言推理技能應(yīng)用于各種圖像,例如照片、屏幕截圖以及包含文本和圖像的文檔。

2、OpenAI發(fā)布視覺模型GPT-4V及其系統(tǒng)卡論文

當(dāng)?shù)貢r(shí)間25日,OpenAI于官網(wǎng)發(fā)布多模態(tài)視覺模型GPT-4V(Vision)系統(tǒng)卡論文。據(jù)介紹,GPT-4V使用戶能指示GPT-4分析用戶提供的圖像輸入,其訓(xùn)練于2022年完成,并在2023年3月開始提供早期訪問系統(tǒng)。該系統(tǒng)卡概述了OpenAI如何為GPT-4部署視覺功能,并分析了GPT-4V的安全屬性。

論文地址:

https://cdn.openai.com/papers/GPTV_System_Card.pdf

3、Spotify合作OpenAI推出AI語音翻譯功能

據(jù)外媒The Verge報(bào)道,流媒體平臺(tái)Spotify近日合作OpenAI,基于OpenAI的語音轉(zhuǎn)錄工具Whisper推出AI語音翻譯功能,利用該工具將其他播客的英語劇集翻譯成另一種語言,并以播客自己的聲音合成版本再現(xiàn)。該功能目前已推出西班牙語翻譯,并計(jì)劃在未來幾周內(nèi)推出法語和德語翻譯。

4、Getty合作英偉達(dá)推出生成式AI工具

近日,Getty Images合作英偉達(dá)推出一款生成式AI工具,基于英偉達(dá)的Edify模型,用戶可根據(jù)Getty Images的授權(quán)照片庫(kù)創(chuàng)建圖像。該工具將與標(biāo)準(zhǔn)的Getty Images訂閱分開定價(jià),并且定價(jià)基于即時(shí)數(shù)量,但Getty未具體說明價(jià)格。Getty承諾,任何使用該工具并發(fā)布其商業(yè)圖像的人都將受到法律保護(hù)。

5、微軟招聘核技術(shù)經(jīng)理 或用核電供能AI數(shù)據(jù)中心

據(jù)IT之家報(bào)道,根據(jù)微軟官網(wǎng)的一份招聘啟事,微軟正在考慮使用核電來運(yùn)行其大型數(shù)據(jù)中心。該公司正在尋找一位“核技術(shù)首席項(xiàng)目經(jīng)理”,此職位的任務(wù)是領(lǐng)導(dǎo)SMR(小型模塊化反應(yīng)堆)和微反應(yīng)器集成的技術(shù)評(píng)估,為微軟云和AI所在的數(shù)據(jù)中心提供動(dòng)力。

6、百度發(fā)布首個(gè)量子領(lǐng)域大模型及兩大AI原生應(yīng)用

據(jù)百度微信公眾號(hào)發(fā)文,9月23-24日,2023量子產(chǎn)業(yè)大會(huì)在安徽合肥召開。會(huì)上,百度量子計(jì)算研究所所長(zhǎng)段潤(rùn)堯發(fā)布首個(gè)量子領(lǐng)域大模型,及百度量子助手和量子寫作助手兩大AI原生應(yīng)用。他還發(fā)布了量子領(lǐng)域大模型白皮書,展望量子領(lǐng)域大模型的未來發(fā)展趨勢(shì)和技術(shù)潛力。據(jù)段潤(rùn)堯介紹,該量子領(lǐng)域大模型是在文心一言基礎(chǔ)上,使用量子領(lǐng)域高質(zhì)量數(shù)據(jù)進(jìn)行更有針對(duì)性的訓(xùn)練和優(yōu)化而構(gòu)建的量子領(lǐng)域大模型,能更好地理解量子知識(shí),專業(yè)執(zhí)行量子任務(wù)。

7、合合信息等發(fā)布業(yè)內(nèi)首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫(kù)

近期,合合信息聯(lián)合上海大學(xué)、華南理工大學(xué)發(fā)布業(yè)內(nèi)首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫(kù),該項(xiàng)目由合合信息與上海大學(xué)社會(huì)學(xué)院、華南理工大學(xué)文檔圖像分析識(shí)別與理解實(shí)驗(yàn)室共同推進(jìn),針對(duì)現(xiàn)有的《西南彝志》、云貴一帶字符,通過智能圖像處理、智能文字識(shí)別等AI技術(shù)開展統(tǒng)一編碼,并于近期發(fā)布了業(yè)內(nèi)首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫(kù)(簡(jiǎn)稱“數(shù)據(jù)庫(kù)”)。

在對(duì)7萬6千字符的樣本進(jìn)行訓(xùn)練后,團(tuán)隊(duì)成功建立了包含上千個(gè)古彝文基礎(chǔ)編碼的數(shù)據(jù)庫(kù)。在收集語料收集的過程中,研究人員使用了合合信息旗下掃描全能王“智能高清濾鏡”功能,高效解決古彝文識(shí)別的版式檢測(cè)、圖像處理和文字識(shí)別等難題。對(duì)于污漬、殘破的彝文古籍,收集者只需通過“智能高清濾鏡”輕輕一掃,即可得到一張清晰、平整的圖片。

通過API數(shù)據(jù)接口等形式,該數(shù)據(jù)庫(kù)有望幫助高校研究人員、文化工作者、興趣愛好者等人群快速找到古彝文在字典中的讀音、漢語釋義、用法,如同“大字典”一般,幫助人們降低古彝文書籍、文獻(xiàn)閱讀的門檻。

8、抖音上線地方方言AI自動(dòng)翻譯功能

據(jù)央廣網(wǎng)報(bào)道,抖音于近期上線了方言自動(dòng)翻譯功能,創(chuàng)作者可以“一鍵”將粵語、閩語、吳語、西南官話、中原官話等方言視頻轉(zhuǎn)化出普通話字幕,方便公眾觀看。據(jù)介紹,抖音火山引擎技術(shù)團(tuán)隊(duì)采用了自研的自監(jiān)督預(yù)訓(xùn)練模型和多語言翻譯模型,實(shí)現(xiàn)了極少量標(biāo)注數(shù)據(jù)條件下識(shí)別方言的能力,且訓(xùn)練效率提升一倍,有效提升了多語言翻譯的性能,同時(shí)大幅度降低了模型訓(xùn)練的資源消耗。

9、中美多家機(jī)構(gòu)聯(lián)合發(fā)布大模型可解釋性技術(shù)綜述

據(jù)機(jī)器之心報(bào)道,近期,中美多家機(jī)構(gòu)(新澤西理工學(xué)院、約翰斯·霍普金斯大學(xué)、維克森林大學(xué)、佐治亞大學(xué)、上海交大、百度等)聯(lián)合發(fā)布了大模型可解釋性技術(shù)的綜述,分別對(duì)傳統(tǒng)的Fine-tuning模型和基于Prompting的超大模型的可解釋性技術(shù)進(jìn)行了全面的梳理,并探討了模型解釋的評(píng)估標(biāo)準(zhǔn)和未來的研究挑戰(zhàn)。

論文鏈接:

https://arxiv.org/abs/2309.01029

GitHub鏈接:

https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

10、潞晨與瀾舟將合作打造企業(yè)級(jí)LLM解決方案

據(jù)潞晨科技微信公眾號(hào)發(fā)文,近日,北京潞晨科技有限公司(簡(jiǎn)稱“潞晨科技”)與北京瀾舟科技有限公司(簡(jiǎn)稱“瀾舟科技”)達(dá)成戰(zhàn)略合作協(xié)議。潞晨科技將以Colossal-AI系統(tǒng)為基礎(chǔ),結(jié)合內(nèi)存管理,多維并行,推理提速等先進(jìn)技術(shù),幫助瀾舟科技更高效更快速地實(shí)現(xiàn)垂類模型落地,使孟子通用大模型、孟子行業(yè)大模型和孟子場(chǎng)景服務(wù)模型等孟子系列大模型更好地服務(wù)行業(yè)頭部和標(biāo)桿企業(yè),共同推動(dòng)AI大模型在多個(gè)領(lǐng)域的工程化產(chǎn)業(yè)應(yīng)用和落地,積極助力各產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。

11、中國(guó)電信在深圳成立含AI軟件業(yè)務(wù)數(shù)智公司

《科創(chuàng)板日?qǐng)?bào)》26日訊,天眼查App顯示,9月25日,中電信數(shù)智科技(深圳)有限公司成立,法定代表人為張宇峰,注冊(cè)資本5000萬人民幣,經(jīng)營(yíng)范圍含軟件開發(fā)、智能控制系統(tǒng)集成、智能無人飛行器銷售、可穿戴智能設(shè)備銷售、5G通信技術(shù)服務(wù)、光通信設(shè)備銷售、人工智能應(yīng)用軟件開發(fā)等。股權(quán)全景穿透圖顯示,該公司由中電信數(shù)智科技有限公司全資持股,后者為中國(guó)電信(601728)全資子公司。

12、梅安森計(jì)劃推出第一代礦山安全模型

《科創(chuàng)板日?qǐng)?bào)》26日訊,安全領(lǐng)域“物聯(lián)網(wǎng)+”企業(yè)梅安森董事長(zhǎng)馬焰在接受《科創(chuàng)板日?qǐng)?bào)》記者采訪時(shí)表示,公司從去年開始利用華為盤古大模型和算力,對(duì)原有產(chǎn)品進(jìn)行優(yōu)化,目前已應(yīng)用于項(xiàng)目中。梅安森與上海人工智能研究院共建礦山安全大模型聯(lián)合實(shí)驗(yàn)室,計(jì)劃盡快推出第一代針對(duì)細(xì)分領(lǐng)域問題的礦山安全模型,應(yīng)用于礦山中,并逐步完善。

13、耐能宣布完成9700萬美元B輪融資

據(jù)人工智能公司耐能微信公眾號(hào)發(fā)文,今天,耐能宣布從和順興基金、富士康及全科科技等投資者處獲得4900萬美元的戰(zhàn)略融資,使B輪融資總額達(dá)到9700萬美元。本輪融資由維港投資領(lǐng)投,光寶科技、威剛科技、富士康及和順興基金等多家公司參投。此次資金,耐能將用于加速先進(jìn)人工智能的推進(jìn),特別關(guān)注汽車領(lǐng)域輕量級(jí)GPT的解決方案。據(jù)悉,耐能目前為止的融資總額達(dá)到1.9億美元。

14、AI醫(yī)療公司惠每科技宣布完成超3億元D輪融資

據(jù)醫(yī)療AI解決方案提供商惠每科技微信公眾號(hào)發(fā)文,今天,惠每科技宣布完成超3億元人民幣的D輪融資,本輪融資由鐘鼎資本領(lǐng)投,潤(rùn)璋創(chuàng)投、蘇州宜和等知名投資機(jī)構(gòu)跟投,老股東啟明創(chuàng)投繼續(xù)投資。泰合資本擔(dān)任本輪融資財(cái)務(wù)顧問。

15、諾和諾德合作Valo 基于AI尋求CMD新療法

當(dāng)?shù)貢r(shí)間25日,知名生物制藥公司諾和諾德(Novo Nordisk)于官網(wǎng)宣布與美國(guó)科技公司Valo Health合作,將利用Valo公司的Opal計(jì)算平臺(tái)和患者數(shù)據(jù)集,以實(shí)現(xiàn)新型心臟代謝藥物項(xiàng)目的發(fā)現(xiàn)和開發(fā)。Valo將獲得一筆預(yù)付款和一筆潛在的近期里程碑付款,總額為6000萬美元,并且有資格獲得最多11個(gè)項(xiàng)目的里程碑付款,總額27億美元,外加研發(fā)資金和潛在的特許權(quán)使用費(fèi)

16、諾基亞將在迪拜設(shè)實(shí)驗(yàn)室推動(dòng)AI技術(shù)應(yīng)用

據(jù)外媒ET Telecom報(bào)道,諾基亞于當(dāng)?shù)貢r(shí)間周一宣布將在阿聯(lián)酋迪拜設(shè)立一個(gè)“開放式創(chuàng)新”實(shí)驗(yàn)室,旨在推動(dòng)中東非地區(qū)人工智能、機(jī)器學(xué)習(xí)等技術(shù)在云無線接入網(wǎng)(C-RAN)、私有無線網(wǎng)絡(luò)、工業(yè)網(wǎng)絡(luò)等領(lǐng)域的應(yīng)用。

17、木頭姐:在AI方面有比英偉達(dá)更好的賭注

據(jù)彭博社報(bào)道,被稱作“女版巴菲特”的知名基金經(jīng)理、方舟投資(ARK Invest)首席執(zhí)行官“木頭姐”Cathie Wood在慕尼黑的一次投資者會(huì)議上稱,在人工智能的指數(shù)級(jí)增長(zhǎng)方面,有比英偉達(dá)更好的選擇,她強(qiáng)調(diào)了另外兩家“不太明顯的”AI軟件公司UiPath和Twilio。據(jù)悉,Wood的旗艦基金ARK Innovation ETF在今年1月減持了英偉達(dá)股票,錯(cuò)過了該芯片制造商估值達(dá)到1萬億美元的大部分漲勢(shì)。

18、英國(guó)政府:AI對(duì)多邊體系構(gòu)成了“嚴(yán)峻考驗(yàn)”

據(jù)英國(guó)《金融時(shí)報(bào)》報(bào)道,英國(guó)政府在近期舉行的聯(lián)合國(guó)大會(huì)上警告稱,人工智能對(duì)多邊體系構(gòu)成了“嚴(yán)峻考驗(yàn)”,并聲稱正在尋求讓包括中國(guó)在內(nèi)的國(guó)家支持其監(jiān)管該技術(shù)“社會(huì)規(guī)?!憋L(fēng)險(xiǎn)的愿景。上周,英國(guó)副首相Oliver Dowden和外交大臣James Cleverly在聯(lián)合國(guó)大會(huì)期間接受英國(guó)《金融時(shí)報(bào)》采訪時(shí),為英國(guó)邀請(qǐng)中國(guó)參加人工智能監(jiān)管峰會(huì)的決定進(jìn)行了辯護(hù),該峰會(huì)最初被描述為只包括“志同道合的國(guó)家”。