智東西(公眾號(hào):zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西11月29日拉斯維加斯報(bào)道,北京時(shí)間11月30日,在年度“云計(jì)算春晚”AWS re:Invent大會(huì)舉行的第三天,AWS數(shù)據(jù)與AI副總裁Swami Sivasubramanian發(fā)表主題演講,公布AWS幫助客戶構(gòu)建生成式AI應(yīng)用的一系列工具與技術(shù)。

除了在Amazon Bedrock平臺(tái)發(fā)布更多第三方和自研基礎(chǔ)模型、語言模型外,Sivasubramanian還分享了AWS幫助客戶負(fù)責(zé)任且更加輕松地構(gòu)建、訓(xùn)練和部署生成式AI模型的多項(xiàng)創(chuàng)新措施。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

一、提供更多第三方大模型,自研多模態(tài)基礎(chǔ)模型上新

Sivasubramanian說,構(gòu)建生成式AI應(yīng)用離不開4個(gè)要素:基礎(chǔ)模型、利用數(shù)據(jù)的隱私環(huán)境、易用的工具、特制的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

他將Amazon Bedrock平臺(tái)稱作是“在基礎(chǔ)模型和大語言模型上構(gòu)建和擴(kuò)展生成式AI應(yīng)用的最簡(jiǎn)單方式”,提供包括第三方模型和自研模型在內(nèi)的廣泛模型選擇。超過10000個(gè)客戶正在使用Amazon Bedrock。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

1、提供更多第三方大模型

在上述基礎(chǔ)上,AWS宣布明星AI安全獨(dú)角獸企業(yè)Anthropic的Claude 2.1、科技巨頭Meta的Llama 2 70B等大語言模型均已在Amazon Bedrock上推出。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

2、推出Amazon Titan多模態(tài)嵌入

向量是定制生成式AI應(yīng)用的關(guān)鍵。下圖是不使用與使用向量嵌入的搜索結(jié)果對(duì)比,向量嵌入有助于提高搜索結(jié)果準(zhǔn)確性。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

多種模型混合增加了搜索方式的復(fù)雜性,會(huì)影響客戶體驗(yàn)。為此,AWS推出Amazon Titan多模態(tài)嵌入,幫助客戶為最終用戶提供更準(zhǔn)確且與上下文相關(guān)的搜索和推薦體驗(yàn)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

“多模態(tài)”是指模型可以為圖像和文本生成嵌入,并將其存儲(chǔ)在客戶的矢量數(shù)據(jù)庫(kù)中,最終用戶可以使用文本、圖像或圖文混合提交搜索查詢。

該模型將多達(dá)128個(gè)標(biāo)記的圖像和短英文文本轉(zhuǎn)換為嵌入,從而捕獲數(shù)據(jù)之間的語義和關(guān)系;默認(rèn)情況下會(huì)生成1024維的向量。

3、Amazon Titan文本嵌入上新

Amazon Titan文本嵌入可將文本翻譯成數(shù)值表示,支持語義搜索、文本注釋和聚類,支持超過25種語言。

Amazon Titan Text Lite和Amazon Titan Text Express兩款大語言模型均已可用,支持總結(jié)、翻譯、對(duì)話、代碼生成等豐富的文本相關(guān)任務(wù),能夠幫助優(yōu)化準(zhǔn)確性、性能與成本。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

其中Lite高度可定制,性價(jià)比高,最大上下文長(zhǎng)度為4096個(gè)token,非常適合英語任務(wù),可以對(duì)文章總結(jié)、寫文案等任務(wù)進(jìn)行微調(diào)。

Express使用范圍更廣泛,最大上下文長(zhǎng)度為8192個(gè)token,適合開放式文本生成、對(duì)話聊天等任務(wù),并支持檢索增強(qiáng)生成(RAG)工作流。

4、推出Amazon Titan圖像生成模型預(yù)覽版

在圖像生成方向,AWS推出Amazon Titan圖像生成模型預(yù)覽版。用戶輸入文字,就能實(shí)現(xiàn)擴(kuò)展或更換背景、調(diào)整主體方向、改變圖像尺寸等圖像編輯要求。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

該模型由高質(zhì)量、多樣化的數(shù)據(jù)訓(xùn)練而成,可以理解復(fù)雜的提示詞,創(chuàng)建更準(zhǔn)確的輸出,例如具有包容性屬性和有限失真的逼真圖像。企業(yè)還可以用專有數(shù)據(jù)來定制模型。

Sivasubramanian強(qiáng)調(diào)說,Titan圖像生成模型支持負(fù)責(zé)任的AI使用,其生成的所有圖像都包含一個(gè)不可見的水印,通過提供一種謹(jǐn)慎的機(jī)制來識(shí)別AI生成的圖像,幫助減少錯(cuò)誤信息傳播。

二、三大功能讓基礎(chǔ)模型定制更安全準(zhǔn)確

“數(shù)據(jù)是生成式AI應(yīng)用的差異所在?!?/p>

Sivasubramanian分享道,Amazon Bedrock支持用私有數(shù)據(jù)安全地定制基礎(chǔ)模型,該平臺(tái)提供的定制Amazon Titan模型新功能包括微調(diào)、持續(xù)預(yù)訓(xùn)練、RAG。

借助微調(diào),企業(yè)可以通過提供自己的特定標(biāo)注訓(xùn)練數(shù)據(jù)集來提高模型準(zhǔn)確性。Amazon Bedrock支持對(duì)Meta Llama 2、Cohere Command Light等第三方模型和AWS自研模型Amazon Titan進(jìn)行微調(diào)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

持續(xù)預(yù)訓(xùn)練可以幫助模型在原始訓(xùn)練之外,通過積累更多的健壯知識(shí)和適應(yīng)性,變得更加特定于領(lǐng)域。通過持續(xù)預(yù)訓(xùn)練,企業(yè)可以在具有客戶管理密鑰的安全托管環(huán)境中使用自己的未標(biāo)注數(shù)據(jù)來訓(xùn)練模型。

持續(xù)預(yù)訓(xùn)練可用于Amazon Titan Text模型的公開預(yù)覽版,包括Titan Text Express和Titan Text Lite。預(yù)訓(xùn)練完成后,用戶可以收到唯一的模型ID,定制模型將由Amazon Bedrock再次存儲(chǔ)。

Amazon Bedrock知識(shí)庫(kù)已全面開放。通過知識(shí)庫(kù),企業(yè)可以安全地將Amazon Bedrock中的基礎(chǔ)模型與自有數(shù)據(jù)連接起來,以用于檢索增強(qiáng)生成,訪問附加數(shù)據(jù)以生成更相關(guān)、更具體和更準(zhǔn)確的響應(yīng),而無需不斷重新訓(xùn)練基礎(chǔ)模型。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

該知識(shí)庫(kù)可管理初始向量存儲(chǔ)設(shè)置,處理嵌入和查詢,并提供生產(chǎn)檢索增強(qiáng)生成應(yīng)用程序所需的源屬性和短期內(nèi)存。企業(yè)還可以定制檢索增強(qiáng)生成工作流以滿足特定的用例需求,或者將檢索增強(qiáng)生成與其他生成式AI工具及應(yīng)用程序集成。

Amazon Bedrock提供了豐富的向量數(shù)據(jù)庫(kù)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

三、Agents for Amazon Bedrock全面可用,自動(dòng)編排完成復(fù)雜任務(wù)

Agents for Amazon Bedrock通過使用基礎(chǔ)模型的推理能力,將用戶請(qǐng)求的任務(wù)分解為多個(gè)步驟,創(chuàng)建編排計(jì)劃,然后調(diào)用公司API和使用檢索增強(qiáng)生成訪問知識(shí)庫(kù)來執(zhí)行該計(jì)劃,幫助用戶加速生成式AI應(yīng)用開發(fā)。

借助Agents for Amazon Bedrock,用戶輕點(diǎn)幾下,就能讓生成式AI應(yīng)用完成復(fù)雜任務(wù)。

其對(duì)編排的改進(jìn)控制功能變得更強(qiáng),對(duì)思維推理鏈也具有更好的可見性。開發(fā)人員使用跟蹤功能可以來跟蹤執(zhí)行計(jì)劃時(shí)使用的推理,查看業(yè)務(wù)流程中的中間步驟,并據(jù)此對(duì)問題進(jìn)行故障排除;還可以訪問和修改agent自動(dòng)創(chuàng)建的提示詞,進(jìn)一步增強(qiáng)終端用戶體驗(yàn)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

Agents在專注于特定任務(wù)時(shí)表現(xiàn)更好,指令越清晰、可用的API越集中,基礎(chǔ)模型就越容易推理并確定正確的步驟。

AWS生成式AI創(chuàng)新中心收到很好的反饋,即將支持定制Anthropic Claude模型的計(jì)劃。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

四、5項(xiàng)Amazon SageMaker新功能:讓構(gòu)建與部署生成式AI模型更輕松

從收集數(shù)據(jù)、創(chuàng)建聚類(clusters)、分布模型訓(xùn)練、checkpoint模型到修復(fù)硬件問題,訓(xùn)練基礎(chǔ)模型的過程充滿挑戰(zhàn)。對(duì)此,Amazon SageMaker機(jī)器學(xué)習(xí)平臺(tái)提供了覆蓋推理、創(chuàng)新和MLOps的一系列創(chuàng)新功能。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

Sivasubramanian宣布了全托管服務(wù)Amazon SageMaker的5項(xiàng)新功能,讓客戶能夠更輕松地構(gòu)建、訓(xùn)練和部署生成式AI模型。

1)SageMaker HyperPod:自動(dòng)在數(shù)百或數(shù)千個(gè)加速器之間分配訓(xùn)練工作負(fù)載,幫助客戶將模型訓(xùn)練時(shí)間縮短多達(dá)40%。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

2)SageMaker Inference:支持客戶將多個(gè)模型部署到同一個(gè)AWS實(shí)例,更好地利用底層加速器并降低部署成本和延遲。

3)SageMaker Clarify:幫助客戶評(píng)估、比較、選擇適合其特定用例的最佳模型,根據(jù)選擇的參數(shù)來支持負(fù)責(zé)任地使用AI。

4)兩項(xiàng)SageMaker Canvas增強(qiáng)功能:無需編寫任何代碼即可構(gòu)建自定義模型,讓客戶能夠更輕松、更快地將生成式AI集成到工作流程中。

五、提供數(shù)據(jù)基礎(chǔ)全套服務(wù),向量搜索為生成式AI準(zhǔn)確性護(hù)航

Sivasubramanian說,強(qiáng)大的數(shù)據(jù)基礎(chǔ)是生成式AI的關(guān)鍵。AWS提供了數(shù)據(jù)基礎(chǔ)的全套服務(wù)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

向量搜索是機(jī)器學(xué)習(xí)領(lǐng)域的一種新興技術(shù),通過使用距離或相似性度量比較向量表示,來找到與給定數(shù)據(jù)相似的數(shù)據(jù)點(diǎn)。這種方法能實(shí)現(xiàn)精確的信息檢索,對(duì)構(gòu)建生成式AI應(yīng)用非常有用。

Amazon Aurora PostgreSQL、Amazon RDS for PostgreSQL、Amazon OpenSearch Service、Amazon OpenSearch Serverless等服務(wù)均提供向量搜索能力。

AWS最新正式發(fā)布的Amazon OpenSearch Serverless向量引擎是一種簡(jiǎn)單、可擴(kuò)展且高性能的相似度搜索功能。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

向量引擎支持通過在同一查詢中組合向量搜索和全文搜索,來優(yōu)化和調(diào)整混合搜索的結(jié)果,讓用戶無需管理底層向量數(shù)據(jù)庫(kù)基礎(chǔ)設(shè)施,即可輕松構(gòu)建機(jī)器學(xué)習(xí)增強(qiáng)搜索體驗(yàn)和生成式AI應(yīng)用程序,幾毫秒可存儲(chǔ)、更新和搜索數(shù)十億個(gè)有數(shù)千個(gè)維度的向量嵌入。

AWS還宣布Amazon DocumentDB和DynamoDB內(nèi)置的向量搜索功能全面可用,支持用戶在文檔數(shù)據(jù)庫(kù)中以毫秒級(jí)響應(yīng)時(shí)間存儲(chǔ)、索引和搜索數(shù)百萬個(gè)向量,并推出Amazon MemoryDB for Redis向量搜索功能的預(yù)覽版。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

分析數(shù)據(jù)庫(kù)引擎Amazon Neptune Analytics也正式發(fā)布,更易發(fā)現(xiàn)圖形與向量之間的關(guān)系,還可以使用它增強(qiáng)基礎(chǔ)模型的提示,讓圖形數(shù)據(jù)分析更高效簡(jiǎn)便。初步基準(zhǔn)測(cè)試標(biāo)明,Neptune Analytics從Amazon S3加載數(shù)據(jù)的速度比現(xiàn)有的AWS解決方案快80倍。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

AWS還推出了Amazon OpenSearch Service zero-ETL與Amazon S3集成的預(yù)覽版,使客戶能夠直接查詢其運(yùn)營(yíng)數(shù)據(jù),降低復(fù)制數(shù)據(jù)或管理多個(gè)分析工具的操作復(fù)雜性,避免過多重復(fù)管理,減少了成本和操作時(shí)間。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

此外,AWS發(fā)布了由生成式AI支持的Amazon DataZone自動(dòng)化功能預(yù)覽版。

該功能由Amazon Bedrock的大語言模型提供支持,可以使傳統(tǒng)勞動(dòng)密集型數(shù)據(jù)編目過程自動(dòng)化,生成數(shù)據(jù)資產(chǎn)及其模式的詳細(xì)描述,并建議分析用例,從而大大減少為組織數(shù)據(jù)提供上下文所需的時(shí)間,讓數(shù)據(jù)編目和發(fā)現(xiàn)進(jìn)一步簡(jiǎn)化。

為了幫助客戶和合作伙伴在不共享原始數(shù)據(jù)的情況下應(yīng)用機(jī)器學(xué)習(xí)模型,AWS推出AWS Clean Rooms ML預(yù)覽版。該功能可幫助企業(yè)及其合作伙伴在無需相互復(fù)制或共享原始數(shù)據(jù)的情況下共同訓(xùn)練模型,多則可節(jié)約數(shù)月時(shí)間。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

六、用AI優(yōu)化數(shù)據(jù)管理,給開發(fā)人員持續(xù)減負(fù)增效

AI為優(yōu)化數(shù)據(jù)基礎(chǔ)提供了更多燃料,使得數(shù)據(jù)管理更容易、更好用、更直觀、更易訪問。

AWS昨日發(fā)布的生成式AI助手Amazon Q能夠支持開發(fā)者全生命周期,根據(jù)企業(yè)業(yè)務(wù)進(jìn)行定制,通過連接到企業(yè)的信息庫(kù)、代碼、數(shù)據(jù)和企業(yè)系統(tǒng),向開發(fā)人員和IT專業(yè)人員提供對(duì)話問答、優(yōu)化Amazon EC2實(shí)例選擇、直接在控制臺(tái)中排除和解決錯(cuò)誤、網(wǎng)絡(luò)故障排除協(xié)助等功能,使其無論是構(gòu)建應(yīng)用程序、研究最佳實(shí)踐、編程還是解決問題,都能快速訪問答案并獲得想法上的幫助。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

啟用AI驅(qū)動(dòng)擴(kuò)展和優(yōu)化的Amazon Redshift Serverless,會(huì)根據(jù)查詢復(fù)雜性、頻率、數(shù)據(jù)集大小等維度主動(dòng)和自動(dòng)擴(kuò)展容量,提供平衡價(jià)格與性能的優(yōu)化。

Amazon? Redshift查詢編輯器中的Amazon Q生成式SQL預(yù)覽版可根據(jù)自然語言提示生成SQL建議,讓編寫有效的SQL查詢更高效。數(shù)據(jù)庫(kù)管理員還可以授權(quán)模型使用AWS帳戶中所有用戶的查詢歷史記錄來生成更相關(guān)的SQL語句。

AWS Glue數(shù)據(jù)質(zhì)量功能預(yù)覽版即將發(fā)布,用機(jī)器學(xué)習(xí)來檢測(cè)統(tǒng)計(jì)異常情況,幫助提高數(shù)據(jù)質(zhì)量,無需寫代碼即可深入了解數(shù)據(jù)質(zhì)量問題、數(shù)據(jù)質(zhì)量評(píng)分、可用于持續(xù)監(jiān)視異常的規(guī)則建議。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

業(yè)務(wù)用戶經(jīng)常需要分享其數(shù)據(jù)發(fā)現(xiàn)。對(duì)此,AWS推出QuickSight的Amazon Q預(yù)覽版。它可以幫助業(yè)務(wù)用戶創(chuàng)建格式優(yōu)美的敘述來描述數(shù)據(jù),在QuickSight中輕松與他人共享文檔、幻燈片格式的視覺效果、圖像與文本,還可以幫助理解儀表板上的關(guān)鍵亮點(diǎn)、提供數(shù)據(jù)問答服務(wù)。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

結(jié)語:生成式AI仍處于早期階段,負(fù)責(zé)任的AI日益受關(guān)注

在Sivasubramanian看來,生成式AI仍處于早期階段,依賴于干凈的數(shù)據(jù)和人工輸入才能取得成功。數(shù)據(jù)、生成式AI和人類三者相輔相成,共同為客戶提供創(chuàng)新和更好的體驗(yàn)。

比如Amazon Bedrock創(chuàng)建應(yīng)用程序,用戶輸入自然語言就能收集完成項(xiàng)目的詳細(xì)步驟、材料、工具和建議的列表,Code Whisperer提供了AI驅(qū)動(dòng)的編程建議,Amazon Q通過扮演AWS及商業(yè)專家角色來加速生產(chǎn)力。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全

由AWS委托、Morning Consult對(duì)美國(guó)商業(yè)領(lǐng)袖代表性樣本進(jìn)行的一項(xiàng)新調(diào)查顯示,隨著越來越多的公司和組織將生成式AI應(yīng)用于其業(yè)務(wù),負(fù)責(zé)任的AI變得越來越重要。77%的受訪者表示他們熟悉負(fù)責(zé)任的AI,47%的受訪者計(jì)劃在2024年對(duì)負(fù)責(zé)任的AI進(jìn)行比2023年更多的投資。

最后,針對(duì)在開發(fā)所有階段都至關(guān)重要的模型評(píng)估,AWS推出Amazon Bedrock模型評(píng)估預(yù)覽版,為開發(fā)人員提供用于構(gòu)建生成式AI應(yīng)用程序的評(píng)估工具,使其能夠評(píng)估、比較和選擇適用于自家用例的最佳基礎(chǔ)模型。

AWS發(fā)布圖像生成模型!5項(xiàng)SageMaker新功能炸場(chǎng),讓構(gòu)建生成式AI應(yīng)用更輕松安全