智東西(公眾號(hào):zhidxcom
作者 | 香草
編輯 | 李水青

智東西5月9日?qǐng)?bào)道,今日,阿里云正式發(fā)布通義千問2.5大模型,其性能全面趕超GPT-4,對(duì)標(biāo)GPT-4 Turbo。相比上一代2.1版本,通義千問2.5在理解能力、邏輯推理、指令遵循、代碼能力上分別提升9%、16%、19%、10%。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義千問2.5發(fā)布

通義千問APP全面升級(jí),品牌更名為“通義APP”,免費(fèi)開放通義全棧能力,覆蓋文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等,主打“All in one”。

其中在代碼方面,CodeQwen1.5憑借優(yōu)秀的代碼生成能力、長(zhǎng)序列建模能力、代碼修改能力和SQL能力登頂Big Code模型排行榜,基于該底層模型,通義靈碼正式推出企業(yè)版。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲CodeQwen1.5成為全球領(lǐng)先的代碼大模型

同時(shí),阿里云百煉大模型平臺(tái)全面升級(jí)2.0,首家托管百川等系列三方模型,率先兼容LlamaIndex等開源框架,用戶通過5到10行代碼即可搭建RAG應(yīng)用,讓大模型擁有“最強(qiáng)外掛”。

一、通義千問2.5追平GPT-4 Turbo,1100億參數(shù)開源模型超越Llama 3

阿里云首席技術(shù)官周靖人提到,經(jīng)過近2年的持續(xù)進(jìn)化,通義模型系列已成為最受中國(guó)企業(yè)歡迎的大模型。

目前,通義大模型通過阿里云服務(wù)的企業(yè)客戶數(shù)已超過9萬(wàn),通過釘釘服務(wù)企業(yè)超220萬(wàn),其中月活超170萬(wàn)。此外在Hugging Face、魔搭等開源社區(qū),通義開源模型下載量累計(jì)超700萬(wàn)。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義千問在企業(yè)中的應(yīng)用

今天發(fā)布的通義千問2.5,在理解能力、邏輯推理、指令遵循、代碼能力上相較于2.1版本,分別提升9%、16%、19%、10%。

在上海AI實(shí)驗(yàn)室推出的權(quán)威基準(zhǔn)OpenCompass上,通義千問2.5得分超越Claude 3 Opus,追平GPT-4 Turbo,成為國(guó)產(chǎn)大模型首位。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲OpenCompass測(cè)評(píng)基準(zhǔn)排行

此外,阿里云還發(fā)布了最新開源模型Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準(zhǔn)測(cè)評(píng)中超越了Llama 3 70B,在Hugging Face開源大模型排行榜Open LLM Leaderboard上登上榜首。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲Qwen1.5-110B登上Hugging Face開源大模型榜首

二、基礎(chǔ)模型支持1000萬(wàn)字上下文,推出企業(yè)版通義靈碼

據(jù)周靖人介紹,在基礎(chǔ)能力之外,通義千問2.5還拓展了文檔處理、音視頻理解、智能編碼等多種能力。

在文檔處理上,通義千問2.5支持單次最長(zhǎng)1000萬(wàn)字、100個(gè)文檔,覆蓋PDF、Word、Excel等多種文件格式,可解析標(biāo)題、段落、圖表等多種數(shù)據(jù)格式。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義千問2.5的文檔處理能力

在音視頻理解方面,通義千問2.5融合語(yǔ)音、LLM、多模態(tài)、翻譯能力,具備實(shí)時(shí)語(yǔ)音識(shí)別、說話人分離功能,能夠提取全文摘要、總結(jié)發(fā)言、提取關(guān)鍵詞等,可同時(shí)上傳處理50個(gè)音視頻文件。

周靖人透露,該能力已在多個(gè)行業(yè)廣泛集成,包括釘釘?shù)臅?huì)議智能紀(jì)要功能、新東方的AI課堂筆記功能、螞蟻面試等。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義千問2.5的音視頻理解能力

在智能編碼方面,通義靈碼掌握J(rèn)ava、Python、Go、JavaScript、TypeScript、C/C++、C#等200多種編程語(yǔ)言,可以輔助寫代碼、讀代碼、查Bug、優(yōu)化代碼等。其底層模型是通義千問團(tuán)隊(duì)開發(fā)的CodeQwen1.5,具備優(yōu)秀的代碼生成能力、長(zhǎng)序列建模能力、代碼修改能力和SQL能力,4月剛剛登頂Big Code模型排行榜。

自2023年10月發(fā)布至今,通義靈碼的插件下載量已超350萬(wàn),每日推薦代碼超3000萬(wàn)次,被開發(fā)者采納的代碼超億行,據(jù)稱是國(guó)內(nèi)最受歡迎的智能編程助手。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲CodeQwen1.5登頂Big Code模型排行榜

同時(shí),周靖人宣布通義靈碼企業(yè)版正式發(fā)布,包含標(biāo)準(zhǔn)版、專屬版兩個(gè)版本,滿足企業(yè)用戶在私域知識(shí)檢索、企業(yè)數(shù)據(jù)合規(guī)、統(tǒng)一管理等方面的定制化需求。

標(biāo)準(zhǔn)版“開箱即用”,可以接入企業(yè)私域知識(shí),實(shí)現(xiàn)私域知識(shí)問答,讓AI推薦的代碼更貼合企業(yè)規(guī)范;專屬版在標(biāo)準(zhǔn)服務(wù)之外,提供公共云上專屬實(shí)例部署、企業(yè)私有模型訓(xùn)練、獨(dú)立企業(yè)賬號(hào)系統(tǒng)等服務(wù),滿足大中型企業(yè)客戶定制模型、節(jié)約算力的需求。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義千問2.5的智能編碼能力

周靖人稱,阿里云是國(guó)內(nèi)首家推行全員AI編碼的云廠商,內(nèi)部已全面切換通義靈碼企業(yè)專屬版,目前26%的新增業(yè)務(wù)代碼由通義靈碼編寫,研發(fā)效率提升10%。

此外,中華財(cái)險(xiǎn)成為首批通義靈碼企業(yè)版客戶,其60%技術(shù)人員已開始使用通義靈碼,1/4的編碼任務(wù)由通義靈碼完成,基于通義靈碼的研發(fā)問答準(zhǔn)確率達(dá)90%。此外,通義靈碼編碼助手還“入職”了多家金融、汽車、新零售、互聯(lián)網(wǎng)等企業(yè)。

三、通義千問APP免費(fèi)開放全棧能力,更名“通義APP”

基于以上能力,通義千問APP全面升級(jí),在移動(dòng)端、Web端、小程序端集成通義大模型全棧能力,免費(fèi)為所有用戶提供服務(wù),同時(shí)更名為“通義APP”。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義APP全面升級(jí)

通義APP以性能媲美GPT-4 Turbo的基模為底座,將通義實(shí)驗(yàn)室文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”,目標(biāo)是成為每個(gè)人的全能AI助手。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲通義開放體驗(yàn)全棧能力

今年以來,通義APP先后推出了“全民舞王”、“全民唱演”、“通義照相館”、AI智能體等應(yīng)用。在“全民舞王”頻道,用戶上傳一張照片就能讓圖中人物跳“科目三”等舞蹈;在“全民唱演”頻道,用戶用一段音頻就能驅(qū)動(dòng)肖像照中的人物唱歌說話。

這些熱門應(yīng)用背后都是通義實(shí)驗(yàn)室自研的前沿AI模型。周靖人稱,未來通義APP還將推出更多以新技術(shù)驅(qū)動(dòng)的新玩法,讓所有人都能獲得最領(lǐng)先的大模型技術(shù)體驗(yàn)。

四、百煉大模型平臺(tái)升級(jí)2.0,510行代碼即可搭建企業(yè)級(jí)RAG應(yīng)用

在大模型落地層面,周靖人談道,只靠基礎(chǔ)模型不能解決所有問題,“當(dāng)下企業(yè)應(yīng)用大模型存在三種范式:一是對(duì)大模型開箱即用,二是對(duì)大模型進(jìn)行微調(diào)和持續(xù)訓(xùn)練,三是基于模型開發(fā)應(yīng)用,其中最典型的需求是RAG,以企業(yè)數(shù)據(jù)對(duì)大模型進(jìn)行知識(shí)增強(qiáng)。圍繞這些需求,百煉打造了模型中心和應(yīng)用中心,提供最豐富的模型和最易用的工具箱?!?/p>

阿里云于去年10月推出了百煉大模型平臺(tái),開發(fā)者可通過“拖拉拽”等交互形式,5分鐘開發(fā)一款大模型應(yīng)用,幾小時(shí)“煉”出一個(gè)專屬模型,把精力專注于應(yīng)用創(chuàng)新。

今天,周靖人宣布百煉平臺(tái)從模型開發(fā)、應(yīng)用開發(fā)到算力底座全面升級(jí)至2.0,更加易用、更加開放,引入更多模型,還率先兼容LlamaIndex等開源框架,企業(yè)可自由替換能力組件來適配自身系統(tǒng)。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲百煉平臺(tái)升級(jí)2.0

針對(duì)當(dāng)下企業(yè)最關(guān)注的RAG鏈路,百煉提供靈活開放的企業(yè)級(jí)檢索增強(qiáng)服務(wù),只需5到10行代碼即可搭建RAG應(yīng)用,實(shí)現(xiàn)低時(shí)延、高并發(fā)的檢索引擎。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲百煉提供RAG應(yīng)用服務(wù)

百煉集成了上百款大模型API,除了通義、Llama、ChatGLM等,還首家托管百川等系列三方模型,覆蓋國(guó)內(nèi)外主流廠商。同時(shí),百煉依托阿里云AI基礎(chǔ)設(shè)施,支持千億級(jí)模型的萬(wàn)級(jí)并發(fā)推理,充分滿足企業(yè)需求。

百煉內(nèi)置豐富的Prompt模板,支持基于LLM Meta-prompting的智能優(yōu)化,用戶可用幾句話簡(jiǎn)單陳述需求,無需費(fèi)心調(diào)試Prompt工程。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲百煉提供Prompt模板

對(duì)需進(jìn)一步訓(xùn)練模型的用戶,百煉提供從數(shù)據(jù)管理、模型調(diào)優(yōu)、評(píng)測(cè)到部署的全鏈路模型服務(wù),用戶可彈性按需調(diào)用算力,無需關(guān)心底層架構(gòu)。訓(xùn)練過程可視化,還可自動(dòng)評(píng)測(cè)模型質(zhì)量,并與其他模型對(duì)比。

百煉支持Assistant API開發(fā)模式,用戶可在百煉上創(chuàng)建知識(shí)庫(kù),并一鍵開啟RAG,通過Assistant API聯(lián)合輸出。同時(shí),百煉支持Agent開發(fā),能實(shí)現(xiàn)多智能體協(xié)作、對(duì)話記憶等功能。

通義千問2.5正式發(fā)布!1100億參數(shù)開源模型超越Llama 3,通義APP免費(fèi)開放全棧能力

▲百煉提供Assistant API開發(fā)模式

周靖人稱,接下來百煉將繼續(xù)做對(duì)開發(fā)者最友好、最開放的大模型平臺(tái)。阿里云歡迎更多大模型上架,百煉將進(jìn)一步支持三方模型的微調(diào)訓(xùn)練和云上專屬部署,幫助大模型生態(tài)中的企業(yè)提供商業(yè)化服務(wù)。

結(jié)語(yǔ):開源生態(tài)加速大模型應(yīng)用落地

去年8月,通義宣布加入開源行列,沿著“全模態(tài)、全尺寸”開源路線陸續(xù)推出十多款模型,其中語(yǔ)言模型參數(shù)規(guī)模橫跨5億到1100億,多模態(tài)模型涵蓋視覺理解、音頻理解、代碼等方面。

大模型的訓(xùn)練和迭代成本極高,絕大部分的AI開發(fā)者和中小企業(yè)都難以負(fù)擔(dān)。Meta、阿里云等頭部廠商致力于開源生態(tài),讓開發(fā)者不必從頭訓(xùn)練模型,把模型選型的主動(dòng)權(quán)交給了開發(fā)者,加速了大模型的應(yīng)用落地進(jìn)程。