智東西(公眾號:zhidxcom
作者?|?香草
編輯?|?李水青

智東西6月28日報道,今天,百度在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024上,正式發(fā)布文心大模型4.0 Turbo版本,其同步上線網(wǎng)頁端和API接口,App端也將陸續(xù)上線。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型4.0 Turbo API開放

同時,飛槳平臺發(fā)布新一代飛槳框架3.0 Beta版本,具備大模型訓(xùn)推一體、動靜統(tǒng)一自動并行、編譯器自動優(yōu)化以及大模型多硬件適配等特色。

百度智能代碼助手Baidu Comate升級至2.5版本,開發(fā)、業(yè)務(wù)迭代及企業(yè)落地速度大幅提升,并擁有了全新的中文名“文心快碼”,正式加入百度“文心大家族”。

據(jù)百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰介紹,文心一言目前用戶規(guī)模已突破3億,每日調(diào)用量超過5億;飛槳平臺已累計服務(wù)1465萬開發(fā)者、37萬企業(yè),構(gòu)建了超95萬個模型。

一、用戶規(guī)模突破3億,文心大模型4.0 Turbo上線

經(jīng)過幾十年的發(fā)展,AI技術(shù)從早期的人工撰寫規(guī)則,到后來的統(tǒng)計機器學(xué)習(xí),演進(jìn)到深度學(xué)習(xí)時代,再到大模型時代,算法、模型變得更加通用和統(tǒng)一。

王海峰談道,大模型為AGI帶來曙光,可以從兩個角度解讀,一是AI技術(shù)的通用性,二是AI能力的全面性。其中,全面的AI能力主要包括理解、邏輯、生成、記憶四個部分。

百度于2019年3月推出文心大模型1.0,經(jīng)過多次迭代,其4.0版本于去年10月發(fā)布。目前,文心一言累計用戶規(guī)模已達(dá)3億,日調(diào)用次數(shù)5億。

今天,百度推出文心大模型4.0 Turbo版本,其網(wǎng)頁端、API即日起面向用戶開放,App端也將陸續(xù)上線,企業(yè)用戶可登錄百度智能云千帆大模型平臺調(diào)用API服務(wù)。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型4.0 Turbo發(fā)布

文心4.0 Turbo在生成速度和效果上大幅提升。王海峰現(xiàn)場演示了其與4.0版本的生成效果對比,在相同的提示詞下,4.0 Turbo的生成速度明顯更快,生成內(nèi)容也更具條理性。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心4.0 Turbo與文心4.0生成速度對比

在基礎(chǔ)模型升級上,百度進(jìn)一步研發(fā)了智能體(Agent)機制,包括理解、規(guī)劃、反思和進(jìn)化,使其能夠可靠執(zhí)行、自我進(jìn)化,并一定程度上將思考過程白盒化,讓大模型像人一樣思考和行動,調(diào)用工具自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實現(xiàn)自主進(jìn)化。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲基于文心大模型的智能體升級

百度還與中國工程院朱有勇院士及團隊共同打造了首個農(nóng)業(yè)智能體“農(nóng)民院士智能體”,其基于文心智能體平臺創(chuàng)建,吸收了朱有勇院士的研究成果以及相關(guān)的農(nóng)業(yè)知識,可以為農(nóng)民解答生產(chǎn)生活中的問題。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲農(nóng)民院士智能體

百度集團副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜談道,在過去半年,用戶使用文心大模型的日均提問量提升了78%,提問平均長度提升89%,使用的提示詞變得越來越復(fù)雜、具體。

大量的應(yīng)用基于文心大模型進(jìn)行創(chuàng)新,截至目前,文心一言已經(jīng)創(chuàng)作了5.9億篇文章,繪制了2.4億張圖片,生成了70億行代碼,共輔助了1.3億人次工作。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型累計成效

吳甜還分享了文心大模型星河共創(chuàng)計劃取得的成果,自去年8月啟動以來,已創(chuàng)建1000+大模型工具,超55萬AI應(yīng)用,積累了超1000B高質(zhì)量數(shù)據(jù)。

例如,百度與長光衛(wèi)星技術(shù)有限公司合作開發(fā)了共生地球智能助手,上線首月就服務(wù)了3.1萬用戶,解答遙感技術(shù)問題超3.8萬次。

二、飛槳推出3.0測試版,四層框架、四大優(yōu)勢

飛槳是百度推出的開源開放產(chǎn)業(yè)級深度學(xué)習(xí)平臺,據(jù)王海峰介紹,其目前已累計服務(wù)1465萬開發(fā)者、37萬家企業(yè),創(chuàng)建了95萬個模型。

今天,飛槳框架3.0 Beta版本正式發(fā)布,具備動靜統(tǒng)一自動并行、編譯器自動優(yōu)化、大模型多硬件適配、大模型訓(xùn)推一體4大特點。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲百度飛槳框架3.0 Beta

在設(shè)計理念上,考慮到大模型和異構(gòu)多芯發(fā)展趨勢,為了保障大模型訓(xùn)練推理性能、簡化大模型開發(fā)調(diào)優(yōu)過程以及更好地適配各種芯片,飛槳與文心聯(lián)合,在訓(xùn)練、推理兩個方面定向優(yōu)化。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲飛槳框架設(shè)計理念

具體來說,動靜統(tǒng)一的自動并行能力通過極簡開發(fā),實現(xiàn)大模型的混合并行訓(xùn)練,可以將分布式訓(xùn)練核心代碼量減少50%以上,典型模型訓(xùn)練性能領(lǐng)先20%。

編譯器自動優(yōu)化能高效支撐大模型與AI科學(xué)計算,通過一體化設(shè)計提升通用模型訓(xùn)練效率,將大模型推理通用性能提升30%,典型科學(xué)計算模型求解速度領(lǐng)先71%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲編譯器自動優(yōu)化

在大模型多硬件適配方面,通過低成本的硬件接入支撐軟硬協(xié)同優(yōu)化,開發(fā)者僅需適配30余接口即可全面支持大模型訓(xùn)練、壓縮、推理。

大模型訓(xùn)推一體是飛槳框架3.0的核心特色,通過訓(xùn)練、壓縮、推理的無縫銜接,實現(xiàn)RLHF訓(xùn)練復(fù)用推理引擎加速2.1倍,量化壓縮復(fù)用分布式策略效率提升3.8倍。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲大模型訓(xùn)推一體

從整體框架來看,飛槳3.0分為表示層、調(diào)度層、算子層、適配層共4層架構(gòu)。值得注意的是,飛槳3.0的開發(fā)接口和2.0版本完全兼容,用戶無需將代碼推翻重來。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲飛槳3.0框架

飛槳還針對AI for Science進(jìn)行了優(yōu)化,能夠適配主流科學(xué)計算庫130多個模型,覆蓋數(shù)據(jù)、機理、數(shù)理融合的全球求解模式,能廣泛支持科學(xué)問題分析,其中基于高階自動微分及編譯優(yōu)化技術(shù),方程求解類模型對比PyTorch求解速度平均領(lǐng)先71%。

三、智能代碼助手升級2.5版本,覆蓋百度內(nèi)部80%程序員

百度副總裁陳洋發(fā)布了智能代碼助手Comate的2.5版本,升級后的代碼助手集成了更多研發(fā)知識,覆蓋流程更全面。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲百度智能代碼助手升級2.5版本

同時,該助手還擁有了中文名字——文心快碼,正式加入百度文心大家族。

陳洋介紹道,文心快碼的“快”主要體現(xiàn)在3個方面:開發(fā)速度快、業(yè)務(wù)迭代快、企業(yè)落地快。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼2.5

具體來說,在開發(fā)速度上,文心快碼融合了更多研發(fā)知識,包括數(shù)百位技術(shù)專家的實踐經(jīng)驗、十億級研發(fā)領(lǐng)域知識以及上萬企業(yè)的研發(fā)場景。

在百度內(nèi)部使用中,基于文心快碼生成的開發(fā)框架代碼準(zhǔn)確度達(dá)到80%,單位時間內(nèi)提交代碼數(shù)量提升了35%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼開發(fā)速度提升

在業(yè)務(wù)迭代上,文心快碼無縫集成研發(fā)各個環(huán)節(jié),包括需求的調(diào)研、設(shè)計,代碼的編寫、測試、發(fā)布等。

陳洋稱,在百度研發(fā)環(huán)節(jié)的單點提效上,基于文心快碼的單行代碼編寫時長壓縮到1.74秒,部署腳本自動生成達(dá)到秒級,單次線下環(huán)境部署耗時節(jié)省10分鐘以上??偟膩碚f,對單個工程師的研發(fā)整體提效超過14%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼業(yè)務(wù)迭代速度提升

在企業(yè)落地層面,針對行業(yè)規(guī)范差異、企業(yè)私域知識、代碼助手與企業(yè)內(nèi)部工具結(jié)合等痛點,文心快碼提供安全可信、適配業(yè)務(wù)等核心能力。

經(jīng)過1年的實踐周期,在百度內(nèi)部過萬名工程師中,文心快碼的覆蓋率已達(dá)到80%,其生成代碼的采用率達(dá)到46%,新增代碼生成占比29%。

陳洋還分享了標(biāo)桿客戶喜馬拉雅的落地案例,其只用1個季度,就實現(xiàn)了工程師中90%的覆蓋率,代碼采納率達(dá)到44%,新增代碼生成占比33%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼企業(yè)落地案例

喜馬拉雅CTO姜杰稱,文心快碼與喜馬拉雅積累的研發(fā)能力、知識相融合,大幅縮短了技術(shù)調(diào)研和代碼編寫時間,極大提升了企業(yè)整體研發(fā)效率和產(chǎn)品質(zhì)量。

目前,文心快碼提供標(biāo)準(zhǔn)版、專業(yè)版、企業(yè)版以及企業(yè)專有版共4個版本,其中專業(yè)版面向?qū)I(yè)開發(fā)者限時開放,基礎(chǔ)功能和高級功能與模型不限量使用。

結(jié)語:AI進(jìn)入工業(yè)大生產(chǎn)階段

從歷史的角度來看,縱觀前三次工業(yè)革命,其核心驅(qū)動力量機械技術(shù)、電氣技術(shù)和信息技術(shù)都具備很強的通用性。王海峰談道,當(dāng)它們呈現(xiàn)出標(biāo)準(zhǔn)化、自動化和模塊化的工業(yè)大生產(chǎn)特征時,核心技術(shù)就進(jìn)入工業(yè)大生產(chǎn)階段。

目前,包括算法、數(shù)據(jù)、模型、工具等在內(nèi)的AI技術(shù),也已經(jīng)具備了較強的通用性,并具備了標(biāo)準(zhǔn)化、模塊化和自動化的特征,推動AI進(jìn)入工業(yè)大生產(chǎn)階段。