智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影

智東西5月31日報道,5月29日-30日,亞馬遜云科技中國峰會在上海舉行。峰會第二日,亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建分享了構建和應用生成式AI的多款創(chuàng)新產(chǎn)品;亞馬遜云科技大中華區(qū)解決方案架構總經(jīng)理代聞以橋梁設計做精巧比喻,從三個方向分享生成式AI時代下架構的演進與迭代。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

企業(yè)開展生成式AI應用落地的過程中面臨新的挑戰(zhàn),主要體現(xiàn)在:1)底層算力資源短缺;2)缺乏合適的工具,用于訪問和部署世界一流模型,從而進行端到端的生成式AI應用構建;3)缺少匹配自身需求的,可開箱即用快速上手的應用。

為了助力企業(yè)生成式AI應用落地,亞馬遜云科技打造三層生成式AI技術棧:

1)底層是以GPU和自研芯片為代表的基礎設施,用于基礎模型的訓練以及在生產(chǎn)環(huán)境中運行推理;

2)中間層是以Amazon Bedrock為代表的,提供可以訪問所需基礎模型,以及構建和擴展生成式AI應用程序的工具;

3)頂層則是以Amazon Q為代表的,利用基礎模型構建的開箱即用的生成式AI應用程序,用戶無需任何專業(yè)知識即可快速上手生成式AI。

一、技術棧底層:聯(lián)手英偉達構建AI超算,上線零一萬物、百川智能基礎模型

亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建談道,生成式AI應用開始于基礎模型的訓練和推理,這兩種工作負載對算力有大量需求,也是限制企業(yè)模型開發(fā)步伐的關鍵制約因素。

為了幫助企業(yè)降低經(jīng)濟壓力,亞馬遜云科技推出了一系列專門構建的、高性價比的芯片和計算實例供企業(yè)選擇,用于運行模型的訓練和推理工作負載。

今天的模型規(guī)模需要分布式的調(diào)度以及相應的存儲和網(wǎng)絡的性能。以訓練500億參數(shù)量的模型為例,需要提供1T(1萬億)token的數(shù)據(jù)量,如果用一張A100的GPU需要74年的時間才能完成,而用2048張GPU則只需要13天。Stability AI訓練Stable Diffusion用了4000張A100 GPU,而Meta訓練Llama 3則使用了超過16000張A100 GPU。

算法工程師通過分布式訓練的技術,同時使用數(shù)千張甚至上萬張的GPU卡來訓練基礎模型,需要更好的卡到卡之間,實例到實例之間的高帶寬來降低通信延遲,提高GPU利用率,進而縮短整個集群的訓練時間。

Amazon?UltraCluster提供了超大規(guī)模、超高帶寬以及超高穩(wěn)定的高性能計算集群,F(xiàn)Sx for Lustre和S3提供了高性能存儲的穩(wěn)定方案。

基于英偉達全新GPU資源的系列實例建立在亞馬遜云科技的高性能存儲和網(wǎng)絡服務基礎之上,支持廣泛的編排選項和開源框架,通過EFA網(wǎng)絡,允許企業(yè)配置高達2萬個GPU的超級集群來支持最大工作負載。

Project Ceiba項目是亞馬遜云科技為英偉達構建的AI超級計算機,由英偉達和亞馬遜云科技聯(lián)合開發(fā),搭載了超過2萬個英偉達Grace架構的Blackwell GB200超級芯片和亞馬遜云科技第四代EFA網(wǎng)絡。每個超級芯片可提供高達800Gbps的網(wǎng)絡帶寬,其算力將能達到驚人的414Exaflops。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

基于英偉達 A10G GPU的Amazon EC2 G5實例在中國區(qū)正式可用,性能達到Amazon EC2?G4DN的3倍,推理性價比提高了40%。

過去5年,亞馬遜云科技在定制芯片領域的投資帶來了機器學習訓練和推理成本的大幅下降。其中,基于Amazon Trainium的Trn1 EC2實例和基于Amazon Inferentia芯片的Inf2 EC2實例,與基于英偉達GPU的Amazon EC2實例相比,可分別將訓練成本降低高達50%,推理成本降低高達40%。

訓練和推理也需要合適的軟件工具。亞馬遜云科技推出了Amazon SageMaker托管機器學習服務,幫助企業(yè)輕松構建、訓練、微調(diào)和部署模型。

亞馬遜云科技宣布來自零一萬物的Yi-1.5 6B/9B/34B的基礎模型在中國區(qū)域正式上線SageMaker Jumpstart,同時來自百川智能的Baichuan-2 7B基礎模型也即將上線中國區(qū)域的SageMaker Jumpstart,為開發(fā)生成式AI應用提供更多基礎模型選擇。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

Amazon SageMaker JumpStart是Amazon SageMaker的一項重要服務,可幫助客戶獲取、微調(diào)和部署來自業(yè)界最新公開的可用預訓練基礎模型,包括Meta Llama 3、Cohere Command等。

該服務還為機器學習從業(yè)者提供深度模型定制和評估功能,允許其通過已經(jīng)使用的環(huán)境輕松訪問基礎模型。

此外,Amazon SageMaker HyperPod正式可用,專門助力大規(guī)模分布式訓練,能夠將訓練模型的時間減少多達40%。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

二、技術棧中間層:用基礎模型加速應用構建,四大價值讓生成式AI觸手可及

技術棧的中間層對于大部分企業(yè)來說更加重要,構建生成式AI應用通常是從選用既有的基礎模型開始,而不是直接參與構建基礎模型。

所以如何選擇更加適合自身業(yè)務的模型,便成為了企業(yè)首先需要作答的問題。

在模型選擇方面,Amazon Bedrock是一項全面托管的服務,用戶可通過單一的API訪問來自Al21 Labs、Anthropic、Cohere、Meta、Mistral Al、Stability AI和亞馬遜等領先AI公司的高性能基礎模型。

值得一提的是最新推出的亞馬遜云科技自研Embedding模型Amazon Titan Text Embeddings V2模型,針對檢索增強生成(RAG)工作流程進行了優(yōu)化。

另一款最新推出的Titan Text Premier基礎模型,是Titan Text系列中先進的型號,旨在為各種企業(yè)應用程序提供卓越的性能,并對RAG及Agent提供了專門優(yōu)化,提供了更高的準確性。

為了幫助企業(yè)選擇合適的模型,亞馬遜云科技正式推出了Amazon Bedrock模型評估功能,可將模型評估時間從數(shù)個星期壓縮至幾個小時。

在模型定制方面,Amazon Bedrock支持企業(yè)自定義模型的導入。企業(yè)可將基于Amazon SageMaker或其他工具開發(fā)的存儲在Amazon S3里面的定制模型導入到Amazon Bedrock中,以完全托管的API形式進行訪問,而無需管理底層基礎設施。

目前Amazon Bedrock自定義模型導入已提供預覽版,支持Llama、Mistral、Flan-T5三種流行的開放模型架構,同時還將在未來進一步擴展支持范圍。

從數(shù)據(jù)準備到數(shù)據(jù)運用,亞馬遜云科技打造了一套全面的數(shù)據(jù)服務體系,涵蓋數(shù)據(jù)庫、數(shù)據(jù)湖、數(shù)據(jù)治理、數(shù)據(jù)分析、機器學習和生成式AI五大維度。

該體系可以幫助企業(yè)連接現(xiàn)有的數(shù)據(jù)源,定制面向生成式AI應用構建的高質量企業(yè)數(shù)據(jù)資源,配合Amazon Bedrock提供的微調(diào)、持續(xù)預訓練、RAG等功能,打造與企業(yè)業(yè)務相關的生成式AI應用。

為了進一步幫助企業(yè)使用RAG技術優(yōu)化模型的個性化響應,亞馬遜云科技正式推出了 完全托管的Amazon Bedrock知識庫功能。

該功能支持企業(yè)使用上下文相關的內(nèi)部數(shù)據(jù)自定義基礎模型響應。Amazon Bedrock上的知識庫會自動執(zhí)行端到端的RAG工作流程,使用者無需編寫自定義代碼來集成數(shù)據(jù)源和管理查詢。

在應用集成方面,Amazon Bedrock的Agent功能提供了一種工具,支持開發(fā)人員定義特定的任務、工作流程或決策過程,增強控制和自動化,同時確保與預期用例保持一致。

Agents for Amazon Bedrock現(xiàn)已支持Claude 3 Sonnet和Haiku模型。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

亞馬遜云科技還提供了一站式生成式AI應用開發(fā)工作站Amazon Bedrock Studio。借助這一工作站,開發(fā)者可以使用簡單易用的交互界面進行模型選擇、模型評估,還可以與團隊成員協(xié)作,共同試驗,創(chuàng)建和完善生成式AI應用。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

在負責任的AI方面,亞馬遜云科技承諾以負責任的方式構建服務,同時重點考慮公正性、隱私性和安全性、可解釋性、可治理性、穩(wěn)健性、透明性6大方面。

企業(yè)在構建生成式AI應用程序時,通常希望其客戶和應用之間的交互是安全并遵守企業(yè)指導方針的。對此,亞馬遜云科技推出了Amazon Bedrock的Guardrails功能,可幫助企業(yè)輕松實施生成式AI應用程序的保護措施,并根據(jù)自身需求和負責任AI政策進行定制。

同Amazon Bedrock上基礎模型原生提供的保護能力相比,Amazon Bedrock的Guardrails功能可幫助企業(yè)用戶阻止多達85%的有害內(nèi)容。

三、技術棧上層:開箱即用的生成式AI應用

亞馬遜云科技構建的生成式AI助手Amazon Q可幫助企業(yè)達成加速軟件開發(fā)、發(fā)揮業(yè)務數(shù)據(jù)價值等目標。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

目前,Amazon Q Developer、Amazon Q Business、Amazon Q in Connect、Amazon Q in QuickSight均已正式可用。

Amazon Q Developer可協(xié)助開發(fā)人員完成從編碼、測試、升級應用到故障排查、安全掃描和修復、優(yōu)化云資源等繁瑣重復的工作,讓開發(fā)者把更多時間專注于創(chuàng)新體驗的開發(fā),加快應用部署速度。

在實際應用中,Amazon Q Developer共包含3大核心應用場景:1)大規(guī)模消除技術冗余;2)提高開發(fā)人員生產(chǎn)力;3)近乎實時生成代碼建議和推薦,幫助開發(fā)人員更快、更安全地進行構建。

為了幫助企業(yè)發(fā)揮大量難以訪問和解析的數(shù)據(jù)的價值,亞馬遜云科技推出了具有從任意數(shù)據(jù)中獲取洞見能力的Amazon Q Business。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

通過它,企業(yè)員工可以通過連接企業(yè)數(shù)據(jù)庫,來提問關于公司政策、產(chǎn)品信息、業(yè)務結果、代碼庫、人員等諸多問題,從而總結數(shù)據(jù)邏輯、分析趨勢并就數(shù)據(jù)進行對話。

Amazon Q Business有四大應用場景:統(tǒng)一的對話檢索式體驗、生成總結與提煉關鍵發(fā)現(xiàn)、提升內(nèi)容創(chuàng)作的效率、簡化任務流程。

Amazon Q Business中的Amazon Q Apps功能公開預覽。借此創(chuàng)建應用程序非常簡單,員工可以用自然語言描述他們想要的應用程序類型,或者只需告訴Amazon Q Apps從Amazon Q幫助解決問題的對話中執(zhí)行即可。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

Amazon Q Developer 和 Amazon Q Business截止到6月30號免費試用。

四、亞馬遜云科技全方位助力人才成長,三大力量驅動架構創(chuàng)新

亞馬遜云科技計劃到2025年向全球2900萬人提供免費培訓,而目前已經(jīng)有2100萬人受益。

為了讓更多的開發(fā)者有機會低門檻體驗到前沿的生成式AI服務,亞馬遜云科技推出了云上探索實驗室CloudLab平臺。開發(fā)者不需要注冊賬號、不需要購買云資源,只需掃碼進入云上探索實驗室,即可在24小時之內(nèi)盡情構建。

同時,亞馬遜云科技還為中國開發(fā)者量身定做了“從基礎到應用:LLM 全景培訓”課程。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

生成式AI時代,構建應用有什么不一樣的方法?有何種新的架構趨勢?

亞馬遜云科技大中華區(qū)解決方案架構總經(jīng)理代聞說,技術架構演進過程里面不變的三個主題需求——基礎組件能力,架構體系創(chuàng)新,多元技術融合。

代聞從橋梁發(fā)展歷程入手,提出橋梁的發(fā)展和構建是由基礎材料,建筑架構和多元化需求三者共同作用的結果,而技術的發(fā)展往往也是如此。

最基礎的組件,例如材料、技術往往決定了能采用的架構。對于信息技術來說,最基礎的材料就是算力。

云計算的最基礎組件是計算、存儲和網(wǎng)絡,其中又以計算作為最核心的組件。

自2006年推出Amazon EC2服務以來,Amazon EC2從最初的70種實例類型增長到超過750種,亞馬遜云科技在虛擬化技術和硬件加速方面正持續(xù)進步。

亞馬遜云科技已發(fā)布五代Nitro芯片。Nitro提供了一個隔離的敏感數(shù)據(jù)處理環(huán)境Nitro Enclaves,可以為客戶自己的實例帶來額外的隔離,保護正在使用的數(shù)據(jù)免受任何未經(jīng)授權的訪問,即使是來自客戶管理員級別的用戶。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

在自研處理器方面,從2018年的Amazon Graviton到2023年的Amazon Graviton4,每一代的Graviton都會上一代有兩位數(shù)的性能提升,并且單位算力的功耗在不斷下降。

亞馬遜云科技在全球規(guī)?;峁┑幕贕raviton的Amazon EC2實例種類達150多個,已經(jīng)構建的Graviton處理器數(shù)量超過200萬個,并擁有超過50000客戶。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

如今亞馬遜云科技的諸多托管服務都全面采用了Graviton架構,如Amazon DocumentDB、Amazon Aurora、Amazon RDS等,這些服務不僅提高了性能,還降低了成本,為客戶提供了更高的性價比。

代聞認為,構建的風險管理意識非常重要,企業(yè)在構建時往往要面臨著大量的不確定性,各種風險因素層出不窮,因此架構韌性成為了重中之重。

通過單元化架構,亞馬遜云科技將IAM拆分成細小的計算和存儲單元,實現(xiàn)了高可用性和極小的故障影響范圍,不僅保障了服務的穩(wěn)定性,也使得IAM能夠每秒處理超過10億個API調(diào)用。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

架構創(chuàng)新的第三大驅動力量是多元技術融合。

通過Zero-ETL集成,亞馬遜云科技消除了數(shù)據(jù)提取、轉換和加載的復雜性,使得用戶可以無縫地將數(shù)據(jù)從Amazon DocumentDB同步到Amazon OpenSearch Service,或者將 Amazon DynamoDB的數(shù)據(jù)直接用于Amazon Redshift的分析。這種無縫集成不僅簡化了數(shù)據(jù)流動,也提高了數(shù)據(jù)的價值和業(yè)務的敏捷性。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創(chuàng)新

結語:推動服務和架構創(chuàng)新,助力生成式AI普惠化

過去十年,云計算為創(chuàng)新和創(chuàng)業(yè)提供了前所未有的便利。未來十年,生成式AI帶來了重塑各行各業(yè)的新機遇。

整體應用架構是多元技術均衡的結果,需要考慮成本、合規(guī)、擴展性、可持續(xù)發(fā)展、韌性、安全、性能、訪問可達性、可用性等因素。一個良好的架構需能隨著多元因素的影響不斷演進。

亞馬遜云科技的優(yōu)良架構體系到現(xiàn)在已經(jīng)超過十年,從卓越運營、安全、可靠、性能效率四個維度演進到六個維度,新增了可持續(xù)發(fā)展和成本優(yōu)化。隨著客戶對各種組件更深入的使用,架構師的決定和組件選擇會直接影響到整塊的應用負載在云上的成本。

伴隨著技術的進步,亞馬遜云科技將繼續(xù)推動架構的演進,通過創(chuàng)新的服務和架構,突破技術壁壘,助力生成式AI普惠化。