智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月17日報道,隨著DeepSeek展現(xiàn)出開源的威力,大模型競賽有了新的敘事方式,各路云計算廠商接連宣布接入DeepSeek模型,但實際提供的服務質(zhì)量卻參差不齊。這與云服務背后的基礎設施和工程化能力密切相關(guān)。

企業(yè)部署和使用模型過程中,需要綜合考量性能與成本之間的權(quán)衡、能否針對私有數(shù)據(jù)進行定制優(yōu)化、數(shù)據(jù)和模型安不安全、是否便于實現(xiàn)各種智能體的復雜調(diào)度等因素。亞馬遜云科技則通過在云和AI領(lǐng)域展開的全棧式創(chuàng)新,兼具云端本身的優(yōu)勢、多樣化模型選擇的優(yōu)勢,并提供了一系列快速將模型運用到企業(yè)化生產(chǎn)環(huán)境中所需的重要工具。

作為最早適配并上線DeepSeek的云巨頭之一,亞馬遜云科技現(xiàn)已推出針對DeepSeek-R1模型多種不同的部署方式,以便企業(yè)能在熟悉的亞馬遜云科技環(huán)境中輕松部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過Amazon Bedrock自定義導入功能或Amazon EC2 Trn1實例中部署DeepSeek-R1-Distill系列模型。

一、云端部署:靈活可擴展,與豐富服務無縫集成

相比本地部署,云端部署的優(yōu)勢是算力資源更充足,而且靈活可擴展。同時在云端部署能夠與豐富且成熟的分析、數(shù)據(jù)等基礎服務進行無縫集成。作為全球云計算的開創(chuàng)者,亞馬遜云科技近20年來積累了深厚的技術(shù)根基,引領(lǐng)了一代代的云端基礎設施創(chuàng)新,在提高算力利用率、加速模型開發(fā)等方面都有長期經(jīng)驗。

比如在自研芯片領(lǐng)域,亞馬遜云科技推出了基于Amazon Trainium2的EC2 Trn2實例,性價比比當時GPU實例高30%-40%。還有第二代的UltraCluster網(wǎng)絡架構(gòu),支持超過20000個GPU協(xié)同工作,帶寬達10Pb/s,延遲低于10ms,這一升級能夠?qū)⒛P陀柧殨r間縮短至少15%。

亞馬遜云科技推出的新一代Amazon SageMaker,將快速SQL分析、PB級大數(shù)據(jù)處理、數(shù)據(jù)探索和集成、模型開發(fā)和訓練以及生成式AI等功能統(tǒng)一到一個集成平臺,從而為客戶提供一個單一的數(shù)據(jù)和AI開發(fā)環(huán)境,用戶可以在其中查找和訪問其組織中的所有數(shù)據(jù),為各種常見的數(shù)據(jù)用例選擇最佳工具,并將數(shù)據(jù)和AI項目擴展至團隊內(nèi)不同分工角色以實現(xiàn)協(xié)作。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建談道,亞馬遜云科技不僅在云的核心服務層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應用的每一個技術(shù)堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。

他相信只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新,才能真正滿足當今客戶的發(fā)展需求,加速前沿技術(shù)的價值釋放。

二、多樣化模型選擇,按需組出性價比

跟其他云服務大廠相比,亞馬遜云科技生成式AI服務的一大特色,就是模型選擇多。

基于“不會有一個模型一統(tǒng)天下”的判斷,亞馬遜云科技在自研大模型的同時,也將來自不同企業(yè)、不同功能的領(lǐng)先大模型匯聚在一起,放到云中的“大模型貨架”上,供客戶按需實現(xiàn)最具性價比的組合。

在實際構(gòu)建生成式AI應用時,不同應用場景需要的性能、成本、響應速度、微調(diào)能力、知識庫協(xié)調(diào)能力、多模態(tài)支持能力等技術(shù)指標各不相同。比如在快速響應場景,需要花一些時間推理的DeepSeek R1深層思考模式就不太適用,其生成首個token的用時可能要超過30秒;而Amazon Nova模型的響應就非???,只耗時數(shù)百毫秒。

此前其“大模型貨架”上已經(jīng)有來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等知名廠商的大模型。亞馬遜云科技還在不斷擴展其模型“朋友圈”。

比如上個月Amazon Bedrock平臺剛剛上線了Luma AI的最新版視頻生成模型Ray 2模型,可以廣泛用于內(nèi)容創(chuàng)建、娛樂、廣告和媒體使用案例,從而簡化從概念到執(zhí)行的創(chuàng)意流程。

亞馬遜云科技的Amazon Bedrock Marketplace功能為客戶提供100多個熱門、新興及專業(yè)模型,DeepSeek-R1就包含在內(nèi)。

怎么用DeepSeek高效開發(fā)應用?解讀亞馬遜云科技三大秘籍▲在Amazon SageMaker Jumpstart中快速部署DeepSeek模型

三、企業(yè)級AI工具全家桶:從性能提升到復雜多智能體編排

選擇合適的模型,下一步是如何高效解決工程化難題。

Amazon Bedrock聚焦企業(yè)應用AI的實際需求,提供了企業(yè)AI工具全家桶,涉及模型從原型走向企業(yè)化生產(chǎn)環(huán)境時必須要考慮的方方面面的工具,以便開發(fā)者基于領(lǐng)先模型來快速構(gòu)建應用。

例如DeepSeek模型有不同參數(shù)量,小至幾十億,多達6710億。要實現(xiàn)完整部署R1并實現(xiàn)盡可能好的推理和響應,需要如Amazon EC2 P5e性能級別的硬件和配套的便捷工具。

怎么用DeepSeek高效開發(fā)應用?解讀亞馬遜云科技三大秘籍▲通過Amazon Bedrock Marketplace部署DeepSeek-R1,可選實例包括EC2 P5e的48xlarge型號,單個實例包含8顆H200 GPU,以及3200Gbps的網(wǎng)絡帶寬,充分滿足DeepSeek-R1的性能需求

亞馬遜云科技提供的實用工具有助于優(yōu)化成本、根據(jù)自有數(shù)據(jù)定制提升準確性、安全性以及針對未來復雜的多智能體構(gòu)建和管理等??梢院喴爬橐韵?類:

1、優(yōu)化效果、延遲和成本:如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。其中模型蒸餾功能可將特定知識從功能強大的大模型轉(zhuǎn)移到更小更高效的模型,運行速度最快可提高500%,成本降低75%。

2、基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化:模型微調(diào)功能、知識庫功能不斷豐富,現(xiàn)已支持GraphRAG等圖數(shù)據(jù),能夠快速且經(jīng)濟高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉(zhuǎn)換為結(jié)構(gòu)化格式的Amazon Bedrock Data Automation功能等。

3、負責任AI的安全和審查:Amazon Bedrock不斷豐富其護欄功能,以簡化企業(yè)實施負責任AI所需的投入,例如為其加入自動推理檢查功能,從而能夠輕松識別事實性錯誤,以提升生成回答的準確性。

4、實現(xiàn)復雜功能的多智能體功能:Amazon Bedrock不但提供智能體功能,還進一步推出了多智能體協(xié)作功能,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來執(zhí)行復雜的工作流程??蛻艨梢酝ㄟ^為項目的特定步驟創(chuàng)建和分配專用智能體,獲得更準確的結(jié)果并加速任務。

怎么用DeepSeek高效開發(fā)應用?解讀亞馬遜云科技三大秘籍

▲在Amazon Bedrock模型定制頁面部署DeepSeek 88Llama Model

結(jié)語:用全棧式創(chuàng)新托舉企業(yè)級AI構(gòu)建

在2024 re:Invent上,亞馬遜CEO Andy Jassy曾分享亞馬遜自身部署AI中的三項關(guān)鍵洞察:首先,隨著生成式AI應用規(guī)模的擴大,計算成本變得至關(guān)重要;人們非??释@得更高的性價比;其次,構(gòu)建一個真正優(yōu)秀的生成式AI應用非常困難;第三,永遠不會有單一的工具能夠統(tǒng)治世界,要提供多樣化的模型,讓開發(fā)者自由選擇。

亞馬遜云科技在云端部署方面的靈活可擴展性、多樣化模型選擇以及實用工具的提供,則無一不是對這些洞察的有力回應。

通過上述三大優(yōu)勢,亞馬遜云科技正在幫助企業(yè)更快更好地運用領(lǐng)先的模型。亞馬遜云科技對DeepSeek的積極擁抱,也在踐行其此前向客戶所承諾的——托管最流行的、具有創(chuàng)新性的AI模型。隨著DeepSeek催化開源風暴,未來我們將看到更多優(yōu)質(zhì)新模型的誕生,而無論模型種類如何繁多,亞馬遜云科技的全棧式創(chuàng)新都形成穩(wěn)固的托舉。