今年,是AI大模型落地應(yīng)用元年。企業(yè)對AI大模型寄予厚望,落地場景越來越多樣、縱深,并正在以結(jié)構(gòu)性的力量對產(chǎn)業(yè)進行重塑。
9月6日,2024騰訊全球數(shù)字生態(tài)大會互聯(lián)網(wǎng)AI應(yīng)用專場在深圳舉行??苿?chuàng)南方來到活動現(xiàn)場,并在會后參與對話騰訊云副總裁許華彬。
在這前一天,騰訊正式發(fā)布新一代大模型“混元Turbo”,效果在多個基準測試上對標GPT-4o,推理效率提升100%,推理成本降低50%,第三方測評居國內(nèi)第一。據(jù)了解,目前騰訊內(nèi)部近700個業(yè)務(wù)及場景已接入,包含騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等。
據(jù)了解,目前騰訊云AI產(chǎn)品已覆蓋超過400家互聯(lián)網(wǎng)頭部企業(yè),累計服務(wù)超過12萬家互聯(lián)網(wǎng)客戶。
以混元為代表的AI大模型驅(qū)動著產(chǎn)業(yè)創(chuàng)新發(fā)展,在業(yè)務(wù)高效創(chuàng)新上展現(xiàn)出了更強勢的產(chǎn)品力,并且不斷給用戶帶來全新的體驗?,F(xiàn)場介紹,值得買科技、燧原科技、趣丸、獵聘、騰訊新聞等,都在混元大模型、騰訊云的基礎(chǔ)上,開展了一系列互聯(lián)網(wǎng)AI應(yīng)用實踐,要么用以提升業(yè)務(wù)效率,要么用以創(chuàng)造用戶新體驗。
生成式AI成為大熱門,云有什么變化?在許華彬看來,生成式AI帶來更大規(guī)模的數(shù)據(jù)交互,更高的能耗以及不同的運維體系。
同時,面對大模型浪潮到來下企業(yè)需求的變化,許華彬告訴科創(chuàng)南方,AI很可能成為未來的第二增長曲線,云行業(yè)客戶需求從早期的視覺領(lǐng)域拓展到數(shù)字人的應(yīng)用等方面,而在這一過程中,騰訊云在AI基礎(chǔ)設(shè)施上的能力也變得越來越成熟,以適應(yīng)行業(yè)的發(fā)展需求。
AI搜索,可以說是離我們生活最近的AI應(yīng)用之一了。我們每天都離不開搜索,那如果AI和搜索結(jié)合起來,會如何重塑我們的搜索使用習慣?在值得買科技首席技術(shù)官王云峰看來,人與搜索工具的使用過程,其實就是一個相關(guān)馴化的過程。早期,我們用傻瓜式提問期待搜索引擎做出全面回答,但是當時技術(shù)并不支持;如今,當AI搜索出現(xiàn)后,我們卻反而是用關(guān)鍵詞去向AI進行提問。
在和騰訊云副總裁許華彬、值得買科技首席技術(shù)官王云峰的對話中,我們對云+AI的發(fā)展、生成式AI在泛互聯(lián)網(wǎng)行業(yè)的落地趨勢等方面有了更深入的了解。
對話騰訊云副總裁許華彬:AI搜索還在早期階段,AI成為云計算第二增長點
▲騰訊云副總裁 許華彬
對話騰訊云副總裁許華彬:AI搜索還在早期階段,AI成為云計算第二增長點
▲值得買科技首席技術(shù)官 王云峰
以下為部分整理后的采訪實錄:
問題:現(xiàn)在Chat GPT發(fā)布一年多了,大型的云廠商也逐漸構(gòu)建起了比較完善的AI產(chǎn)品服務(wù)體系,并且每個運營廠商有自己的特點,有的主打開放生態(tài),有的是閉源生態(tài),也有專注于工具層的。騰訊云走的是什么路線?為什么要走這種路線?
許華彬:作為云廠商我們側(cè)重兩個方面,第一是我們做好基礎(chǔ)的設(shè)施,大家知道算力是最基本的要素,包括訓(xùn)練數(shù)據(jù)的存儲、網(wǎng)絡(luò),這是一個基本點。第二是站在運營商的角度看,對每家模型我們本身還是比較開放的,大家看到我們的平臺,其實結(jié)合了多家的模型,除了騰訊自己的混元大模型,也有國內(nèi)的各個廠商的大模型。
問題:在大模型興起之前的、傳統(tǒng)的云,和現(xiàn)在生成式AI的云,它的需求以及需要的能力有什么不同?
許華彬:傳統(tǒng)云業(yè)務(wù)的數(shù)據(jù)流量相對較小,而生成式AI的云業(yè)務(wù),尤其是訓(xùn)練集群,涉及多臺機器間的大規(guī)模數(shù)據(jù)交互,流量通常達到T級別以上。因此,這兩者在數(shù)據(jù)需求上存在顯著差異。此外,功耗需求也不同,生成式AI所需的H級機柜可能需要幾千瓦甚至更高的電力支持。同時,運維體系也存在區(qū)別。
其實騰訊早已在AI領(lǐng)域展開了實踐,在OpenAI發(fā)布ChatGPT之前,騰訊已經(jīng)開發(fā)了自己的模型,雖然當時的模型可能與現(xiàn)在的大模型有所不同,但這一領(lǐng)域的探索已經(jīng)持續(xù)多年。
問題:AI搜索是現(xiàn)在比較熱的話題,都說有搜索框的地方就有AI搜索,您怎么看待AI搜索的?
王云峰(值得買科技首席技術(shù)官):我最初的工作是在搜狗,負責搜索相關(guān)的業(yè)務(wù)。我有特別深的一個感觸——當年用戶向搜索引擎提出的問題,正是我們現(xiàn)在希望他們向AI提出的問題。
AI對話剛推出時,很多用戶使用它的方式其實和他們使用搜索引擎的方式很相似。如果用戶像20年前那樣使用搜索引擎——明確提出自己的問題并期待答案——我們反而會更高興。那時候,用戶會直接表達他們的問題,并希望從搜索引擎得到解答。然而,現(xiàn)在人們更多地依賴關(guān)鍵詞搜索。
這種變化體現(xiàn)了搜索引擎和用戶之間的一種“互相馴化”。早期,人們期望通過簡單提問從搜索引擎獲取答案,但技術(shù)水平有限,無法完全滿足需求。而現(xiàn)在,AI具備了更強的理解能力,但用戶的習慣已經(jīng)被關(guān)鍵詞搜索固化了。
在我看來,云計算和AI的發(fā)展規(guī)律類似,是一個使用者和工具相互適應(yīng)的過程。工具的能力會影響用戶的使用方式,反過來,用戶也會學會如何更好地使用這些工具。
AI對搜索引擎的影響尤其明顯。過去,人們通過提問尋找答案,而如今,AI不僅可以提供答案,還能結(jié)合新的檢索技術(shù),進一步提升準確性。當然,AI在某些方面仍然存在局限性,比如數(shù)據(jù)時效性的問題,但搜索引擎的檢索技術(shù)可以很好地彌補這一點。所以,我認為,AI和搜索的結(jié)合,將為用戶帶來更加優(yōu)質(zhì)的體驗。
問題:現(xiàn)在很多公司都在做AI搜索,你們覺得可能哪些特質(zhì)的公司最后跑出來成為AI時代做AI搜索的贏家?
王云峰(值得買科技首席技術(shù)官):我認為,目前AI搜索還處于早期階段,這個階段很像當年搜索引擎剛起步的時候?;叵隚oogle的早期版本,很多人覺得它的搜索效果并不好,每次更新后結(jié)果都會有所不同,規(guī)律難以把握。但隨著不斷優(yōu)化,它逐漸變得越來越好。AI搜索也處在類似的發(fā)展階段。雖然搜索本身在信息獲取上有局限性,但并非所有問題都能通過信息獲取解決。
能夠在AI搜索領(lǐng)域脫穎而出的公司應(yīng)該具備兩方面的特質(zhì)。首先,這家公司需要對產(chǎn)品有極強的追求。就像當年搜索引擎經(jīng)歷了多年的調(diào)優(yōu)過程,AI搜索同樣需要不斷調(diào)整和改進。只有在產(chǎn)品上持續(xù)追求卓越,才能在這個領(lǐng)域取得成功。
其次,成功的公司必須在信息檢索方面有一定的積累。我特別強調(diào)信息檢索,因為這不僅僅是搜索技術(shù)本身的積累,還包括整體搜索體驗的積累。比如,在一些通用領(lǐng)域,可能傳統(tǒng)的搜索方式已經(jīng)能夠滿足需求,但在更為專業(yè)的垂直領(lǐng)域,公司需要對這些領(lǐng)域有深入的理解,才能為用戶提供真正有用的答案。
正因為如此,我認為積累深厚的公司更容易找到合適的合作伙伴,并在AI搜索領(lǐng)域取得成功。畢竟,覆蓋所有領(lǐng)域是不現(xiàn)實的,但對某些領(lǐng)域的深刻認知和積累可以幫助他們走得更遠。
問題:因為您之前一直就是負責云業(yè)務(wù),在這一波大模型浪潮來了之后,感覺客戶需求跟之前有什么改變,遇到的最大的挑戰(zhàn)是什么?
許華彬:隨著大模型浪潮的來臨,客戶需求相較以前有了顯著的變化。AI很可能成為未來的第二增長曲線,我所負責的云行業(yè)客戶圍繞AI的需求明顯增多。過去,AI需求主要集中在視覺領(lǐng)域,比如OCR、圖片識別、圖文識別以及語音識別和合成等應(yīng)用。近年來,隨著大模型的發(fā)展,數(shù)字人的應(yīng)用也變得更加廣泛和成熟,需求也從原來的腳本編寫擴展到利用語言模型驅(qū)動的應(yīng)用。
騰訊云不僅在模型開發(fā)上發(fā)力,還提供了覆蓋整個數(shù)據(jù)處理鏈條的服務(wù),包括數(shù)據(jù)清洗、數(shù)據(jù)存儲、數(shù)據(jù)庫能力、數(shù)據(jù)湖能力等工具。同時,云服務(wù)的底座基于多種異構(gòu)化選擇,使得騰訊云在AIGC時代有較強的準備能力。此外,云服務(wù)在上線過程中,內(nèi)容風控也是至關(guān)重要的一環(huán)。騰訊云能夠提供從前端到后端的全面云場景能力輸出,滿足客戶的多樣化需求。
數(shù)據(jù)中心時代,云服務(wù)的一個顯著優(yōu)勢在于“開箱即用”。無論是整體解決方案、局部服務(wù)還是插件,客戶都可以按需下單使用,享受云服務(wù)帶來的彈性伸縮、研發(fā)便利性以及資源規(guī)?;?yīng)。
雖然AI的應(yīng)用前景廣闊,但仍然面臨許多挑戰(zhàn)。尤其是從去年開始,業(yè)界對大模型的預(yù)期非常高,但在實現(xiàn)過程中,存在不少技術(shù)上的困難。過去,大家已經(jīng)關(guān)注文本和語言模型技術(shù)多年,但由于參數(shù)受限,進展相對緩慢。然而,隨著OpenAI推出ChatGPT后,市場的需求和期望變得更加復(fù)雜。
我還想起來,在2022年底或2023年初時,很多公司都在構(gòu)建訓(xùn)練集群,而算力設(shè)備容易發(fā)生故障,導(dǎo)致訓(xùn)練中斷。為了應(yīng)對這個問題,騰訊云花費時間優(yōu)化了故障恢復(fù)的效率,從最初的30分鐘縮短到20分鐘,直到如今可以在10分鐘甚至幾分鐘內(nèi)恢復(fù)訓(xùn)練進度。這些持續(xù)的優(yōu)化讓騰訊云在AI基礎(chǔ)設(shè)施上的能力變得越來越成熟,適應(yīng)行業(yè)的發(fā)展需求。
問題:關(guān)于混元大模型,騰訊云最近上線了多模態(tài)的MOE模型,想問下為什么選MOE這個架構(gòu),出于什么考慮?
許華彬:選擇MOE架構(gòu)并不是最近才做出的決定,早在2022年甚至更早,騰訊混元團隊就已經(jīng)在使用MOE模型,并在此基礎(chǔ)上不斷升級。選擇MOE架構(gòu)是基于多方面的考慮。
一方面,很多場景中希望模型的參數(shù)越大越好,MOE模型能夠很好地平衡參數(shù)規(guī)模與不同專家領(lǐng)域的知識儲備需求。其次,MOE模型在成本控制方面表現(xiàn)優(yōu)異,特別是在全推理場景中,計算成本通常非常高,而MOE模型能夠在提供大規(guī)模參數(shù)的同時,降低推理成本。
另一方面,是在成本上。關(guān)于大模型和小模型的各種爭議一直存在,但總體來說,模型參數(shù)越大,結(jié)果往往會更好。然而,在實際應(yīng)用中,還需根據(jù)不同場景靈活調(diào)整。例如,在騰訊會議中,AI總結(jié)和會議紀要等功能的使用量非常大,因此需要在效果、成本和可持續(xù)發(fā)展之間找到平衡。有時候,會通過蒸餾技術(shù)將大模型壓縮為較小的模型,以應(yīng)對高成本壓力。所以我們要既考慮效果,又要考慮成本,也要考慮持續(xù)性健康的發(fā)展,最終選擇了MOE架構(gòu)。