智東西(公眾號(hào):zhidxcom)
作者 | 香草
編輯 | 李水青

智東西4月2日?qǐng)?bào)道,今天,亞馬遜云科技(AWS)與智東西等少數(shù)媒體分享了與AI創(chuàng)企Anthropic合作的最新進(jìn)展,并現(xiàn)場(chǎng)演示了Claude 3大模型的多模態(tài)、長(zhǎng)文本、語境理解等能力。

AWS近日宣布向Anthropic追加投資27.5億美元,截至目前已經(jīng)向這家OpenAI強(qiáng)力競(jìng)對(duì)累計(jì)注資40億美元。此外,雙方的合作關(guān)系也再次加深,Amazon Bedrock引入了Anthropic最新發(fā)布的Claude 3模型。

會(huì)后,AWS大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建向我們分享了大模型落地實(shí)踐的解讀。在他看來,大模型想要打通落地最后N公里,需要選擇一個(gè)具體的、簡(jiǎn)單的切入點(diǎn),從點(diǎn)到面逐步擴(kuò)展應(yīng)用場(chǎng)景,由簡(jiǎn)單到復(fù)雜逐步切入。

當(dāng)談到AWS下一步的發(fā)展戰(zhàn)略時(shí),他稱從客戶需求來看,目前芯片等硬件設(shè)施仍然落后于大模型的發(fā)展,其迭代速度跟不上模型參數(shù)規(guī)模的指數(shù)級(jí)提升,如何將底層能力與大模型復(fù)雜度相匹配,是現(xiàn)在面臨的主要挑戰(zhàn)。

一、從基礎(chǔ)設(shè)施、工具鏈到AI應(yīng)用,構(gòu)建生成式AI完整技術(shù)棧

陳曉建首先解讀了AWS的生成式AI技術(shù)棧。目前,AWS在基礎(chǔ)設(shè)施層面提供GPUs、自研Trainium芯片、Nitro系統(tǒng)等底層設(shè)施,在大模型構(gòu)建工具層面提供大模型托管平臺(tái)Amazon Bedrock,在應(yīng)用層面則推出了智能助手Amazon Q、代碼助手Amazon CodeWhisperer等。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲AWS生成式AI技術(shù)棧

在模型層面,除了此前提供的AI21Labs、Cohere、Meta、Stability AI以及亞馬遜自研的模型之外,近期新增了Anthropic和法國(guó)創(chuàng)企Mistral AI的新模型。其中,Anthropic的Claude 3以其多模態(tài)推理、翻譯、總結(jié)等方面的優(yōu)異能力突出。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Amazon Bedrock提供的基礎(chǔ)模型

Claude 3于3月初推出,分為Opus、Sonnet、Haiku三個(gè)規(guī)模,其中性能最強(qiáng)的Opus模型引各方面測(cè)評(píng)結(jié)果超越GPT-4一舉成為“最強(qiáng)大模型”。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3各模型性能對(duì)比

與Claude 2相比,Claude 3最明顯的迭代體現(xiàn)在多模態(tài)能力、幻覺的降低、長(zhǎng)文本能力等方面。例如借助視覺能力,Claude 3可以理解圖表、圖形、報(bào)告等文件,并從中提取數(shù)據(jù)。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3的多模態(tài)能力

在準(zhǔn)確率方面,Claude 3大幅改善了幻覺問題,對(duì)沒有把握的答案會(huì)進(jìn)行標(biāo)明,而不是直接給出錯(cuò)誤答案。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3幻覺降低

在應(yīng)用場(chǎng)景上,Claude 3可以適用于代碼輔助、內(nèi)容續(xù)寫、長(zhǎng)文本知識(shí)召回總結(jié)等,也可以用在亞馬遜的“老本行”電商領(lǐng)域,用來撰寫電商商品描述。

基于Amazon Bedrock的能力,AWS面向企業(yè)提供了知識(shí)庫(kù)工具Knowledge Bases,為基礎(chǔ)模型和Agents提供來自企業(yè)內(nèi)部數(shù)據(jù)源的上下文信息,用于RAG(檢索增強(qiáng)生成),從而提供更相關(guān)、更準(zhǔn)確和更個(gè)性化的響應(yīng)。

Amazon Bedrock的Agents功能則利用基礎(chǔ)模型,提供使用自然語言進(jìn)行交互和響應(yīng)來執(zhí)行多步驟業(yè)務(wù)任務(wù)的能力。

二、現(xiàn)場(chǎng)演示為老黃續(xù)寫PPT,扮演不同MBTI人格答題

AWS技術(shù)人員為我們現(xiàn)場(chǎng)演示了Claude 3“中杯”模型Sonnet的多模態(tài)、長(zhǎng)文本、代碼、翻譯等能力。

在第一個(gè)演示中,演示人員輸入了一張英偉達(dá)CEO黃仁勛演講的PPT,讓Claude總結(jié)PPT的內(nèi)容。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲輸入的PPT圖像

明顯能看出,Amazon Bedrock上搭載的Claude 3生成速度非常快,迅速總結(jié)出了PPT上主要內(nèi)容。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3總結(jié)PPT內(nèi)容

隨后,演示人員追問Claude 3下一頁P(yáng)PT可以考慮放哪些內(nèi)容,又讓其按年份總結(jié)圖中內(nèi)容,并歸納為表格形式。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3將PPT內(nèi)容總結(jié)為表格形式

第二個(gè)演示展現(xiàn)了Claude 3的長(zhǎng)文本能力。演示人員輸入小說《流浪地球》中的一個(gè)片段,在其中插入了一句《三體》中的內(nèi)容,讓Claude 3從中找出不合理的部分。

這是大模型長(zhǎng)文本能力評(píng)測(cè)中十分重要的一種測(cè)試。AWS大中華區(qū)產(chǎn)品技術(shù)總監(jiān)王曉野談道,之所以長(zhǎng)文本能力這么重要,是因?yàn)樵谇楦信惆?、資料讀取等應(yīng)用場(chǎng)景中,對(duì)大模型的“記憶”能力要求很高。尤其是AI陪伴類產(chǎn)品,如果大模型能記住幾個(gè)月甚至幾年前用戶聊過的內(nèi)容,體驗(yàn)感會(huì)大幅提升。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3大海撈針能力

隨后演示人員又展示了Claude 3的詩(shī)歌翻譯能力,并與GPT-4做對(duì)比。雖然二者都未達(dá)到“信達(dá)雅”的水準(zhǔn),但Claude 3的翻譯用語更貼合中文用詞習(xí)慣一些。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3翻譯能力

第四個(gè)演示針對(duì)代碼能力,演示人員要求Claude 3生成一個(gè)貪吃蛇游戲的Python代碼設(shè)計(jì),并給出了基本玩法和失敗條件。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲貪吃蛇游戲Prompt

Claude 3按照需求生成了一個(gè)完整的代碼文檔,演示人員將代碼復(fù)制到編譯器中運(yùn)行,貪吃蛇游戲成功運(yùn)行起來,并且符合失敗條件,在蛇撞到地圖邊緣時(shí)游戲結(jié)束。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲貪吃蛇游戲演示

最后,演示人員展示了Claude 3的開放性問題理解能力。通過一個(gè)網(wǎng)上很火的性格測(cè)試MBTI的問題,讓大模型判斷不同MBTI人格對(duì)同一個(gè)問題的反應(yīng):如果看到一匹馬進(jìn)入酒吧,你認(rèn)為馬會(huì)說什么?

在扮演ESTJ、ENFP兩種不同人格時(shí),Claude 3分別站在理性務(wù)實(shí)、富有想象力和創(chuàng)造力的角度回答了這個(gè)問題。

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3扮演ESTJ人格

AWS搭載“最強(qiáng)大模型”!40億美元投向OpenAI競(jìng)對(duì),打通商業(yè)化落地“最后三公里”

▲Claude 3扮演ENFP人格

結(jié)語:AWS為企業(yè)客戶打通大模型落地“最后三公里”

通過投資Anthropic和提供Claude 3模型,AWS再次提升了作為云平臺(tái)的競(jìng)爭(zhēng)力。相比直接使用Claude 3的API(應(yīng)用程序接口),Amazon Bedrock能夠提供更為穩(wěn)定的大模型能力,并通過知識(shí)庫(kù)、Agents等工具提供差異化價(jià)值,幫助企業(yè)平衡成本與模型能力。

通過構(gòu)建完整的生成式AI技術(shù)棧,從基礎(chǔ)設(shè)施到工具鏈,再到具體的AI應(yīng)用,AWS全方位支持企業(yè)客戶數(shù)字化轉(zhuǎn)型。Amazon Bedrock平臺(tái)為企業(yè)提供了強(qiáng)大的知識(shí)庫(kù)工具和Agents功能,使得大模型的應(yīng)用更加貼合實(shí)際業(yè)務(wù)需求,同時(shí),AWS還通過試驗(yàn)迭代、專業(yè)培訓(xùn)、原型開發(fā)等服務(wù),為企業(yè)用戶提供打通大模型落地的“最后三公里”。