智東西(公眾號(hào):zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西10月31日?qǐng)?bào)道,在今日舉行的2023云棲大會(huì)上,阿里云正式發(fā)布千億級(jí)參數(shù)大模型通義千問2.0。在10個(gè)權(quán)威測(cè)評(píng)中,通義千問2.0綜合性能超過GPT-3.5和Llama 2,正在加速追趕GPT-4。當(dāng)天,通義千問APP在各大手機(jī)應(yīng)用市場(chǎng)正式上線,所有人都可通過APP直接體驗(yàn)最新模型能力。

阿里云CTO周靖人談道,面向智能時(shí)代,阿里云將通過從底層算力到人工智能(AI)平臺(tái)再到模型服務(wù)的全棧技術(shù)創(chuàng)新,升級(jí)云計(jì)算體系,打造一朵AI時(shí)代最開放的云。除了發(fā)布通義千問2.0外,周靖人還公布了云計(jì)算基礎(chǔ)能力的最新進(jìn)展,升級(jí)了AI平臺(tái),并發(fā)布一站式模型應(yīng)用開發(fā)平臺(tái)阿里云百煉。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

“目前,中國有一半大模型企業(yè)跑在阿里云上,280萬AI開發(fā)者活躍在阿里云魔搭社區(qū)上,未來,阿里云將攜手千行百業(yè)推動(dòng)AI創(chuàng)新,共享技術(shù)紅利?!敝芫溉送嘎墩f,阿里云計(jì)劃近期開源通義千問72B版本,這將將成為中國參數(shù)最大的開源模型,此前阿里云已先后開源7B和14B版本模型,模型累計(jì)下載量超過100萬。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

一、通義千問2.0得分超過GPT-3.5,8個(gè)行業(yè)大模型組團(tuán)上線

過去6個(gè)月,通義千問2.0在性能上取得巨大飛躍,相比4月發(fā)布的1.0版本,通義千問2.0在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識(shí)記憶、幻覺抵御等能力上均有顯著提升。目前,通義千問的綜合性能已經(jīng)超過GPT-3.5,加速追趕GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10個(gè)主流Benchmark測(cè)評(píng)集上,通義千問2.0的得分整體超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九勝一負(fù),相比GPT-4則是四勝六負(fù),與GPT-4的差距進(jìn)一步縮小。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

中英文理解能力是大語言模型的基本功。英語任務(wù)方面,通義千問2.0在MMLU基準(zhǔn)的得分是82.5,僅次于GPT-4,通過大幅增加參數(shù)量,通義千問2.0能更好地理解和處理復(fù)雜的語言結(jié)構(gòu)和概念;中文任務(wù)方面,通義千問2.0以明顯優(yōu)勢(shì)在C-Eval基準(zhǔn)獲得最高得分,這是由于模型在訓(xùn)練中學(xué)習(xí)了更多中文語料,進(jìn)一步強(qiáng)化了中文理解和表達(dá)能力。

在數(shù)學(xué)推理、代碼理解等領(lǐng)域,通義千問2.0進(jìn)步明顯。在推理基準(zhǔn)測(cè)試GSM8K中,通義千問排名第二,展示了強(qiáng)大的計(jì)算和邏輯推理能力;在HumanEval測(cè)試中,通義千問得分緊跟GPT-4和GPT-3.5,該測(cè)試主要衡量大模型理解和執(zhí)行代碼片段的能力,這一能力是大模型應(yīng)用于編程輔助、自動(dòng)代碼修復(fù)等場(chǎng)景的基礎(chǔ)。

通義千問2.0還變得更加好用,在指令遵循、工具使用、精細(xì)化創(chuàng)作等方面作了技術(shù)優(yōu)化,能夠更好地被下游應(yīng)用場(chǎng)景集成。通義大模型官網(wǎng)上線了多模態(tài)和插件功能,支持圖片輸入、文檔解析等細(xì)分任務(wù)。

同時(shí),基于通義大模型訓(xùn)練的8大行業(yè)大模型組團(tuán)上線,分別是通義靈碼-智能編碼助手、通義智文-AI閱讀助手、通義聽悟-工作學(xué)習(xí)AI助手、通義星塵-個(gè)性化角色創(chuàng)作平臺(tái)、通義點(diǎn)金-智能投研助手、通義曉蜜-智能客服、通義仁心-個(gè)人專屬健康助手、通義法睿-AI法律顧問。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

其中,智能編碼助手通義靈碼已在阿里云內(nèi)部大規(guī)模采用,廣受好評(píng);工作學(xué)習(xí)AI助手通義聽悟每天處理5萬余個(gè)音視頻,累積用戶超100萬。

8大行業(yè)模型面向當(dāng)下最受歡迎的多個(gè)垂直場(chǎng)景,使用領(lǐng)域數(shù)據(jù)進(jìn)行專門訓(xùn)練。用戶可以在官網(wǎng)直接體驗(yàn)?zāi)P凸δ埽_發(fā)者可以通過網(wǎng)頁嵌入、API/SDK調(diào)用等方式,將模型能力集成到自己的大模型應(yīng)用和服務(wù)中。

截至10月,阿里云已與60多個(gè)行業(yè)頭部伙伴進(jìn)行深度合作,推動(dòng)通義千問在辦公、文旅、電力、政務(wù)、醫(yī)保、交通、制造、金融、軟件開發(fā)等領(lǐng)域的落地。

二、“中國一半大模型公司跑在阿里云上”

阿里云通義大模型系列基于人工智能平臺(tái)PAI訓(xùn)練而成。

據(jù)介紹,除了通義大模型,中國一半大模型公司跑在阿里云上,百川智能、智譜AI、零一萬物、昆侖萬維、vivo、復(fù)旦大學(xué)等大批頭部企業(yè)及機(jī)構(gòu)均在阿里云上訓(xùn)練大模型。

通義系列、Baichuan系列、智譜AI ChatGLM系列、姜子牙通用大模型等國內(nèi)眾多頭部主流大模型,都已通過阿里云對(duì)外提供API服務(wù)。

“百川成立僅半年便發(fā)布了7款大模型,快速迭代背后離不開云計(jì)算的支持?!卑俅ㄖ悄軇?chuàng)始人兼CEO王小川說。

百川智能和阿里云進(jìn)行了深入合作,在雙方的共同努力下,百川很好地完成了千卡大模型訓(xùn)練任務(wù),有效降低了模型推理成本,提升了模型部署效率。

基礎(chǔ)模型的質(zhì)量很大程度決定了AI產(chǎn)業(yè)化的前景。訓(xùn)練大模型是囊括了算力底座、網(wǎng)絡(luò)、存儲(chǔ)、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程,只有強(qiáng)大的云計(jì)算體系才能訓(xùn)練出高質(zhì)量的大模型。

周靖人談道,2009年阿里云就提出“數(shù)據(jù)中心是一臺(tái)計(jì)算機(jī)”的理念,今天AI時(shí)代更加需要這樣的技術(shù)體系。作為一臺(tái)超級(jí)計(jì)算機(jī)的云計(jì)算,可高效連接異構(gòu)計(jì)算資源,突破單一性能芯片瓶頸,協(xié)同完成大規(guī)模智能計(jì)算任務(wù)。

為了保證大模型訓(xùn)練的穩(wěn)定互聯(lián)和高效并行計(jì)算,阿里云全新升級(jí)了人工智能平臺(tái)PAI。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

PAI底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu),支持高達(dá)10萬卡量級(jí)的集群可擴(kuò)展規(guī)模,超大規(guī)模分布式訓(xùn)練加速比高達(dá)96%,遠(yuǎn)超業(yè)界水平;在大模型訓(xùn)練任務(wù)中,可節(jié)省超過50%算力資源,性能全球領(lǐng)先。

應(yīng)對(duì)大規(guī)模智能算力需求,阿里云已在全球30個(gè)地域建設(shè)了89個(gè)云計(jì)算數(shù)據(jù)中心,提供3000余個(gè)邊緣計(jì)算節(jié)點(diǎn),發(fā)揮云計(jì)算的低延時(shí)、高彈性優(yōu)點(diǎn)。今年,阿里云成功支撐火爆全網(wǎng)的妙鴨相機(jī)短時(shí)間高強(qiáng)度的流量爆發(fā)。

三、超30款云產(chǎn)品接入大模型能力,發(fā)布一站式大模型應(yīng)用開發(fā)平臺(tái)

周靖人談道:“隨著大模型技術(shù)與云計(jì)算本身的融合,我們希望未來的云可以像車一樣也能夠自動(dòng)駕駛,大幅提升開發(fā)者使用云的體驗(yàn)。”

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

據(jù)悉,阿里云上有超過30款云產(chǎn)品接入了大模型能力,例如阿里云大數(shù)據(jù)治理平臺(tái)DataWorks新增了全新的交互形態(tài)Copilot,用戶只需用自然語言輸入即可生成SQL,并自動(dòng)執(zhí)行相應(yīng)的數(shù)據(jù)ETL操作,整體開發(fā)與分析可提效30%以上,堪比“自動(dòng)駕駛”。

阿里云容器、數(shù)據(jù)庫等產(chǎn)品上也提供了類似的開發(fā)體驗(yàn),可實(shí)現(xiàn)NL2SQL、SQL注釋生成/糾錯(cuò)/優(yōu)化等功能,未來這些能力還將集成到阿里云其他產(chǎn)品上。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

現(xiàn)場(chǎng),周靖人還發(fā)布了一站式大模型應(yīng)用開發(fā)平臺(tái)——阿里云百煉。

該平臺(tái)集成了國內(nèi)外主流優(yōu)質(zhì)大模型,提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開發(fā)工具,為用戶簡(jiǎn)化了底層算力部署、模型預(yù)訓(xùn)練、工具開發(fā)等復(fù)雜工作。

開發(fā)者可在5分鐘內(nèi)開發(fā)一款大模型應(yīng)用,幾小時(shí)即可“煉”出一個(gè)企業(yè)專屬模型,可將更多精力專注于應(yīng)用創(chuàng)新。

大模型正引發(fā)千行百業(yè)的新一輪創(chuàng)新,央視網(wǎng)、朗新科技、亞信科技等企業(yè)已率先在阿里云百煉上開發(fā)專屬模型和應(yīng)用,朗新科技在云上訓(xùn)練出電力專屬大模型,開發(fā)“電力賬單解讀智能助手”“電力行業(yè)政策解析/數(shù)據(jù)分析助手”,為客戶接待提效50%、降低投訴70%。

“促進(jìn)中國AI生態(tài)繁榮,是阿里云的首要目標(biāo)。阿里云將堅(jiān)定打造AI時(shí)代最開放的大模型平臺(tái),我們歡迎所有大模型接入阿里云百煉,共同向開發(fā)者提供AI服務(wù)?!敝芫溉苏f。

結(jié)語:向開發(fā)者提供免費(fèi)GPU算力,已構(gòu)建中國最大AI社區(qū)

除了與開發(fā)者共享自研新技術(shù),阿里云還大力支持三方大模型發(fā)展。在阿里云魔搭社區(qū)上,百川智能、智譜AI、上海人工智能實(shí)驗(yàn)室、IDEA研究院等業(yè)界頂級(jí)玩家,都開源首發(fā)他們的核心大模型,阿里云則為開發(fā)者們“嘗鮮”大模型提供免費(fèi)GPU算力,截至目前已超3000萬小時(shí)。

阿里云通義千問2.0發(fā)布!綜合性能超過GPT-3.5,APP正式上線

據(jù)周靖人透露,魔搭社區(qū)現(xiàn)已聚集2300多款A(yù)I模型,吸引280萬名AI開發(fā)者,AI模型下載量突破1億,成為中國規(guī)模最大、開發(fā)者最活躍的AI社區(qū)。

在2023云棲大會(huì)上,阿里云公布了一項(xiàng)重磅計(jì)劃:“云工開物計(jì)劃”,給中國所有大學(xué)生每人送一臺(tái)云服務(wù)器。

此外,阿里云還將為簽約高校提供更大規(guī)模的算力資源支持,助力中國青年學(xué)者和學(xué)子攀登科研高峰。目前,清華大學(xué)、北京大學(xué)、浙江大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)、華南理工大學(xué)等高校已首批達(dá)成合作。