1、阿里云通義千問140億參數(shù)Qwen-14B發(fā)布

2、百川智能發(fā)布Baichuan2-53B閉源大模型

3、Meta或于本周發(fā)布系列AI聊天機(jī)器人

4、開源可商用的中文版Llama 2發(fā)布

5、特斯拉機(jī)器人啟用端到端神經(jīng)網(wǎng)絡(luò)

6、6.7k Star量的vLLM出論文 助大模型低成本部署

7、亞馬遜與Anthropic達(dá)成合作 至多投資40億美元

8、恒生電子大模型LightGPT開啟內(nèi)測

9、AI原生人力資源服務(wù)商TTC獲千萬人民幣融資

10、Canalys:2027年兼容AI功能的個人電腦占60%

1、阿里云通義千問140億參數(shù)Qwen-14B發(fā)布

今天,阿里云舉辦通義千問開源發(fā)布會,正式發(fā)布通義千問140億參數(shù)模型Qwen-14B及對話模型Qwen-14B-Chat,開源、免費(fèi)。據(jù)介紹,Qwen-14B在眾多同尺寸20B以內(nèi)開源模型中突出重圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權(quán)威測評集上都取得了最優(yōu)成績,超越所有測評中的SOTA大模型。此外,通義千問團(tuán)隊還升級了Qwen模型對接外部系統(tǒng)的能力,開發(fā)者可以通過簡單的操作實現(xiàn)復(fù)雜的插件調(diào)用,也可以基于Qwen系列基座模型快速開發(fā)Agent等AI系統(tǒng),利用Qwen的理解和規(guī)劃能力完成復(fù)雜的任務(wù)。同時,Qwen-7B也實現(xiàn)了全面升級,核心指標(biāo)最高提升22.5%。

2、百川智能發(fā)布Baichuan2-53B閉源大模型

今天,百川智能發(fā)布Baichuan2-53B閉源大模型,全面升級了Baichuan1-53B的各項能力。據(jù)介紹,Baichuan2-53B的數(shù)學(xué)和邏輯推理能力顯著提升,并通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)大幅降低了模型幻覺,是目前國內(nèi)幻覺問題最低的大模型。百川智能此次還開放了Baichuan2-53B API接口,宣布正式進(jìn)軍To B領(lǐng)域。

API接口文檔地址:

https://platform.baichuan-ai.com

3、Meta或于本周發(fā)布系列AI聊天機(jī)器人

據(jù)《華爾街日報》報道,知情人士透露,Meta計劃最快于本周在其社交媒體應(yīng)用上發(fā)布一系列AI聊天機(jī)器人,以吸引年輕用戶。據(jù)稱,這些聊天機(jī)器人在公司內(nèi)部被稱為“Gen AI Personas”,正在由員工進(jìn)行內(nèi)測,預(yù)計將在當(dāng)?shù)貢r間本周三開始的Meta Connect大會上推出。據(jù)《華爾街日報》看到的內(nèi)部文件顯示,正在開發(fā)的聊天機(jī)器人中有一款被稱為“機(jī)器人Bob”,自稱是一位“高智商、敏銳的智慧和尖銳的諷刺”的將軍;一個名為“Alvin the Alien”的聊天機(jī)器人會詢問用戶的生活;一個名為“Gavin”的聊天機(jī)器人發(fā)表了攻擊性言論,以及批評扎克伯格和Meta但贊揚(yáng)TikTok和Snapchat的評論。

4、開源可商用的中文版Llama 2發(fā)布

據(jù)量子位報道,現(xiàn)在,15小時、幾千塊錢、85億Tokens數(shù)據(jù),即可訓(xùn)練出中文版Llama 2。Colossal-LLaMA-2近期把大模型門檻打下來了,同時開源團(tuán)隊還提供了一個完整的評估體系框架ColossalEval,以實現(xiàn)低成本的可復(fù)現(xiàn)性。這一模型綜合性能達(dá)到開源社區(qū)同規(guī)模從頭預(yù)訓(xùn)練SOTA模型水平。方案完全開源,包括全套訓(xùn)練流程、代碼及權(quán)重;而且無商業(yè)限制,還可遷移應(yīng)用到任意垂類領(lǐng)域和從頭預(yù)訓(xùn)練大模型的低成本構(gòu)建。

GitHub地址:
https://github.com/hpcaitech/ColossalAI

5、特斯拉機(jī)器人啟用端到端神經(jīng)網(wǎng)絡(luò)

據(jù)量子位報道,當(dāng)?shù)貢r間9月24日,特斯拉人形機(jī)器人「擎天柱」最新視頻公開,啟用了自動駕駛系統(tǒng)同款的端到端神經(jīng)網(wǎng)絡(luò)架構(gòu),無需任何規(guī)則代碼就學(xué)會分揀物品。對此網(wǎng)友表示很難相信視頻是真的,馬斯克回復(fù)稱:“執(zhí)行器、傳感器和整體機(jī)械結(jié)構(gòu)更多升級還在后面。”伴隨視頻發(fā)布的是機(jī)器人團(tuán)隊招聘公告,特斯拉機(jī)器人團(tuán)隊招聘各類硬件工程師及機(jī)器學(xué)習(xí)工程師、實習(xí)生,總計51個職位。

6、6.7k Star量的vLLM出論文 助大模型低成本部署

據(jù)機(jī)器之心報道,今年六月,來自加州大學(xué)伯克利分校等機(jī)構(gòu)的一個研究團(tuán)隊開源了vLLM,其使用了一種新設(shè)計的注意力算法PagedAttention,可讓服務(wù)提供商輕松、快速且低成本地發(fā)布LLM服務(wù),該團(tuán)隊宣稱vLLM能實現(xiàn)比HuggingFace Transformers高24倍的吞吐量?,F(xiàn)在離vLLM最初宣布時差不多已過去三個月,他們終于發(fā)布了這篇關(guān)于vLLM和PagedAttention的研究論文,其中詳細(xì)解釋了他們?nèi)绾瓮ㄟ^類似操作系統(tǒng)虛擬內(nèi)存管理的機(jī)制來實現(xiàn)高效的LLM服務(wù)。該論文已被將于十月底在德國舉辦的ACM操作系統(tǒng)原理研討會(SOSP 2023)接收。

論文地址:
https://arxiv.org/abs/2309.06180

代碼地址:
https://github.com/vllm-project/vllm

文檔地址:
https://vllm.readthedocs.io/

7、亞馬遜與Anthropic達(dá)成合作 至多投資40億美元

據(jù)界面報道,亞馬遜與人工智能公司Anthropic今日宣布達(dá)成戰(zhàn)略合作,共同推進(jìn)生成式AI發(fā)展。Anthropic選擇亞馬遜云科技(AWS)作為其主要云提供商,并將利用AWS的高性能、低成本機(jī)器學(xué)習(xí)加速器,在AWS Trainium和Inferentia芯片上訓(xùn)練和部署其未來基礎(chǔ)模型。亞馬遜將向Anthropic投資至多40億美元,并擁有該公司的少數(shù)股權(quán)。

8、恒生電子大模型LightGPT開啟內(nèi)測

今日,恒生大模型產(chǎn)品已面向20家金融機(jī)構(gòu)開啟內(nèi)測。據(jù)悉,恒生金融行業(yè)大模型LightGPT是專為金融領(lǐng)域打造的大語言模型,它通過訓(xùn)練海量金融數(shù)據(jù),對金融相關(guān)問題有更好的理解能力。光子是基于LightGPT的智能應(yīng)用服務(wù),可以為金融機(jī)構(gòu)的各個業(yè)務(wù)系統(tǒng)注入AI能力,包括投資合規(guī)、投顧、客服、運(yùn)營、投研和交易等。

體驗地址:
www.hs.net/lightgpt

9、AI原生人力資源服務(wù)商TTC獲千萬人民幣融資

《科創(chuàng)板日報》25日訊,近日,AI原生國際性人力資源服務(wù)提供商TTC完成數(shù)千萬元人民幣Pre-A輪融資,本輪融資領(lǐng)投方為創(chuàng)新工場。

10、Canalys:2027年兼容AI功能的個人電腦占60%

據(jù)知名行研機(jī)構(gòu)Canalys預(yù)測,兼容AI個人電腦將呈穩(wěn)定的上升趨勢。截至2023年第二季度,在蘋果的神經(jīng)引擎的大力推動下,兼容AI個人電腦市場實現(xiàn)了超過500萬臺的出貨量。隨著x86架構(gòu)提升它們的AI能力,預(yù)測從2024上半年開始將出現(xiàn)新一輪的AI賦能模型浪潮。到2024年第四季度,出貨量預(yù)計上升至約2000萬臺的水平,在全球個人電腦出貨量的占比超過25%。

鑒于在2024年末推出的最新Windows操作系統(tǒng)將預(yù)期發(fā)布經(jīng)AI提升的功能,以及AI工具在商業(yè)和生產(chǎn)力軟件的廣泛應(yīng)用,兼容AI個人電腦市場將在2025年和2026年有望實現(xiàn)爆發(fā)式增長。到2027年,出貨量預(yù)計超過1.75億臺,在總個人電腦出貨量的占比超逾60%。從現(xiàn)在起到那時,該板塊的復(fù)合年均增長率將達(dá)94%。