智東西(公眾號(hào):zhidxcom)
作者 | ?程茜
編輯 |? 心緣

智東西8月9日?qǐng)?bào)道,本周三、四,在北京舉行的Google I/O?Connect?China(2024谷歌開發(fā)者大會(huì))上,谷歌來自全球不同領(lǐng)域的技術(shù)專家闡釋了谷歌的最新開發(fā)者工具和技術(shù)。

其中重點(diǎn)分享了谷歌最新的AI工具和技術(shù)更新,以及在Web、Mobile、Cloud等領(lǐng)域?yàn)槌龊i_發(fā)者帶來的產(chǎn)品升級(jí)。Google Developer X和開發(fā)者關(guān)系副總裁兼總經(jīng)理 Jeanine Banks重點(diǎn)提到了Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro三種多模態(tài)Gemini模型,Gemini系列模型已集成到眾多開發(fā)工具中,包括Android Studio、Chrome DevTools、Project IDX等。同時(shí)谷歌的應(yīng)用開發(fā)框架Flutter升級(jí)到了3.24和Dart 3.5版本,可以支持開發(fā)者跨平臺(tái)構(gòu)建應(yīng)用。

谷歌大中華區(qū)總裁陳俊延談道,中國(guó)是全球最大的開發(fā)者市場(chǎng)之一,過去一年,中國(guó)25個(gè)開發(fā)者團(tuán)隊(duì),開發(fā)了31款游戲和應(yīng)用,在全球不同地區(qū)獲得50個(gè)Google Play年度最佳獎(jiǎng)項(xiàng)。

他還重點(diǎn)提到了兩大案例,數(shù)字營(yíng)銷行業(yè),網(wǎng)易游戲在海外借助Google Cloud Vertex AI平臺(tái),提升了廣告文案創(chuàng)作效率,工作時(shí)間從原本一周多減到幾個(gè)小時(shí),每月累計(jì)可生成超700條定制文案;國(guó)際家居在線服務(wù)平臺(tái)Homary,基于Google AI的海外廣告投放中,通過用戶預(yù)測(cè)潛在購(gòu)買品類,提升了49%的投資回報(bào)率和50%的轉(zhuǎn)換效率。

此外,谷歌開發(fā)者中文網(wǎng)站上推出了谷歌AI頁面,開發(fā)者可以獲取相關(guān)技術(shù)更新與資訊,中文專題頁面的CodelabChrome、Web專題頁面均已上線。

一、Gemini三大模型可滿足不同開發(fā)需求,小米SU7應(yīng)用基于Flutter開發(fā)

Google Developer X和開發(fā)者關(guān)系副總裁兼總經(jīng)理Jeanine?Banks帶來了AI工具和技術(shù)更新的分享。

AI正在從根本上重塑軟件開發(fā),讓每一位開發(fā)者提升開發(fā)效率,谷歌提供了三種不同規(guī)格的Gemini模型,包括Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro。

其中Gemini Nano可以直接在設(shè)備端運(yùn)行,能實(shí)現(xiàn)快速響應(yīng)和保護(hù)數(shù)據(jù)隱私;Gemini 1.5 Flash是谷歌目前最快最經(jīng)濟(jì)的模型,適合處理高容量任務(wù),為開發(fā)者提供了100萬個(gè)Tokens的超長(zhǎng)上下文窗口;Gemini 1.5 Pro的回答質(zhì)量更高,適合處理復(fù)雜任務(wù),谷歌已經(jīng)面向使用Gemini 1.5 Pro的所有開發(fā)者開放了200萬個(gè)Tokens的上下文窗口。

更大的上下文窗口可以提升模型性能,還有助于開發(fā)者發(fā)掘新的應(yīng)用場(chǎng)景,也會(huì)消耗大量的計(jì)算資源,基于此,谷歌近日為Gemini 1.5 Flash、Gemini 1.5 Pro推出了上下文緩存功能,開發(fā)者可以將提示中不變的內(nèi)容進(jìn)行緩存,后續(xù)可以即時(shí)調(diào)用。

做出海應(yīng)用的開發(fā)者可以使用AI Studio免費(fèi)使用這些模型,省去訓(xùn)練和維護(hù)模型的時(shí)間。

Gemma系列模型可以滿足開發(fā)者希望根據(jù)具體應(yīng)用場(chǎng)景對(duì)AI進(jìn)行微調(diào)的需求,Jeanine稱,Gemma和Gemini系列模型一脈相承,共享底層技術(shù)和工具。

谷歌已經(jīng)正式發(fā)布Gemma 2模型,新增了參數(shù)規(guī)模達(dá)到90億和270億的兩種模型。270億參數(shù)規(guī)模的模型針對(duì)英偉達(dá)GPU進(jìn)行了優(yōu)化,可以在Google Cloud的單個(gè)英偉達(dá)GPU、Vertex AI的單個(gè)GPU上高效運(yùn)行。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

Jeanine稱,Gemma 2的性能表現(xiàn)超越了參數(shù)規(guī)模比它大兩倍的模型。

Gemini已經(jīng)集成到Android Studio、Chrome?DevTools等諸多開發(fā)工具中,可以獲取應(yīng)用設(shè)置、性能數(shù)據(jù)、日志和源代碼等信息,幫助開發(fā)者編寫、調(diào)試和測(cè)試代碼、生成文檔等。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

谷歌開源的應(yīng)用開發(fā)框架Flutter升級(jí)到3.24和Dart 3.5版本,改進(jìn)了在macOS上對(duì)Platform View和Webview的支持。新的API早期預(yù)覽版Flutter GPU直接內(nèi)置在Flutter SDK中,可以允許開發(fā)者使用Dart代碼訪問GPU,提升圖形的渲染能力。

Jeanine稱,中國(guó)的Flutter開發(fā)活躍度位列全球前三。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

谷歌正在構(gòu)建User Scene的軟件包,可以將不同行業(yè)標(biāo)準(zhǔn)的3D模型直接導(dǎo)入Flutter項(xiàng)目中。

小米電動(dòng)汽車SU7的配置應(yīng)用就是基于Flutter打造,小米汽車的應(yīng)用程序提供了一整套功能,可以實(shí)現(xiàn)遠(yuǎn)程車輛控制、接收車輛狀態(tài)的實(shí)時(shí)更新等。小米汽車智能座艙手機(jī)APP客戶端高級(jí)研發(fā)工程師陳作斌談道,他們預(yù)估使用Flutter比使用原生框架的效率要高60%。

此外,Android Studio Project IDX的早期預(yù)覽版已經(jīng)推出,完全運(yùn)行在瀏覽器中,開發(fā)者可以快速搭建起運(yùn)行Android Studio的工作區(qū),開始編寫、構(gòu)建和測(cè)試原生Android應(yīng)用。本地Android Studio和云端IDX工作區(qū)都可以滿足開發(fā)者開發(fā)需求。

在安全性方面, Firebase?AI Monitoring可以實(shí)時(shí)監(jiān)控開發(fā)者使用大語言模型構(gòu)建的功能,在生產(chǎn)環(huán)境下的性能和行為,目前這一產(chǎn)品處于非公開預(yù)覽階段。谷歌還推出了Checks AI Safety,可以用于評(píng)估監(jiān)控和監(jiān)督AI模型和代理的合規(guī)性。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

三、Gemini Nano已內(nèi)置Chrome桌面客戶端,多項(xiàng)UI設(shè)計(jì)工具已發(fā)布

設(shè)備端的AI模型為云端模型提供了補(bǔ)充,讓開發(fā)者能以更低的成本、更少的容量限制、更強(qiáng)的數(shù)據(jù)隱私保護(hù)來交付解決方案,無論基于哪個(gè)模型構(gòu)建響應(yīng)AI功能,WebGPU和Web Assembly都是端側(cè)Web AI的基石。

WebGPU已經(jīng)支持16位浮點(diǎn)數(shù)值,Web Assembly集成了Memory 64和JavaScript Promise,基于此,開發(fā)者構(gòu)建的模型可以在全球絕大多數(shù)設(shè)備上高效運(yùn)行。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

谷歌Chrome開發(fā)技術(shù)推廣部主管Paul?Kinlan談道,視頻彈幕平臺(tái)BiliBili結(jié)合使用了Web Assembly和MediaPipe的圖像識(shí)別技術(shù),成功實(shí)現(xiàn)了彈幕不遮擋畫面人物的功能,使得會(huì)話時(shí)長(zhǎng)增加30%,點(diǎn)擊率增長(zhǎng)19%。

從Chrome 126瀏覽器版本開始,Gemini Nano會(huì)直接內(nèi)置到Chrome桌面客戶端中。其中“幫我寫”這個(gè)功能就可以幫助海外用戶撰寫商品評(píng)價(jià)、客戶反饋等。為了實(shí)現(xiàn)這個(gè)功能,谷歌對(duì)Gemini模型最高效版本進(jìn)行了微調(diào)。

谷歌還在開發(fā)Prompt API,開發(fā)者可以通過這一工具使用自然語言,向Chrome中的Gemini Nano發(fā)送指令,全程不會(huì)有數(shù)據(jù)離開本地設(shè)備。

強(qiáng)大的AI功能離不開優(yōu)質(zhì)UI,谷歌也推出了新功能幫助開發(fā)者打造應(yīng)用。

谷歌發(fā)布Speculation Rules API,可以通過在后臺(tái)預(yù)讀取、預(yù)渲染頁面,提升站內(nèi)的瀏覽速度。面向單頁應(yīng)用,谷歌推出了View Transitions API,可以實(shí)現(xiàn)更加順暢的導(dǎo)航。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

在調(diào)試和優(yōu)化應(yīng)用方面,Chrome Devtools能夠在網(wǎng)站發(fā)生錯(cuò)誤時(shí)發(fā)出警告和提示,同時(shí)Chrome Devtools Insight可以快速分析問題所在,并且根據(jù)代碼提供合理的解決方案。

三、Gemini Nano沒網(wǎng)也可運(yùn)行,Compose簡(jiǎn)化跨設(shè)備應(yīng)用構(gòu)建流程

谷歌安卓開發(fā)技術(shù)推廣部主管史婧羽談道,使用Gemini Nano實(shí)現(xiàn)的AI功能不需要網(wǎng)絡(luò)就可以在設(shè)備上完成所有操作。

Gemini Nano通過AICore系統(tǒng)服務(wù)實(shí)現(xiàn),為了應(yīng)對(duì)管理打包和分發(fā)大語言模型的復(fù)雜難題,AICore可以負(fù)責(zé)管理設(shè)備上的基礎(chǔ)模型,開發(fā)者能直接使用。

Gemini Nano和AICore現(xiàn)已登陸谷歌Pixel 8和三星Galaxy S24系列。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

未來幾個(gè)月,谷歌將進(jìn)一步開放Gemini Nano的使用權(quán)限。

今年,谷歌將支持跨平臺(tái)代碼復(fù)用技術(shù)Kotlin Multiplatform用于業(yè)務(wù)端,使得開發(fā)者可以在Web、服務(wù)器和桌面平臺(tái)間共享代碼。谷歌在DataStore、ViewModel、Room等多個(gè)Jetpack庫(kù)添加了Kotlin Multiplatform支持。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

寫作工具Compose增加了共享元素過渡等功能,可以幫開發(fā)者處理過渡中大小變化、文字動(dòng)畫等,同時(shí)原生支持了預(yù)測(cè)返回手勢(shì)。谷歌打造了一系列新Compose API,幫助開發(fā)者構(gòu)建符合設(shè)計(jì)規(guī)范的自適應(yīng)布局。

谷歌聯(lián)合小米、OPPO、三星等手機(jī)玩家,將這些品牌的設(shè)備實(shí)驗(yàn)室接入由FireBase支持的Android Device Streaming測(cè)試平臺(tái),開發(fā)者可以在真機(jī)設(shè)備上直接驗(yàn)證自適應(yīng)應(yīng)用,包括折疊屏手機(jī)和平板電腦。

谷歌同樣助力和簡(jiǎn)化了困難的開發(fā)任務(wù),例如Android Studio中的Crashlytics功能,不僅可以在源代碼中快速定位錯(cuò)誤,還能基于Gemini的分析能力提供修復(fù)建議。

開發(fā)者可以在內(nèi)置AI隱私設(shè)置中,選擇分享或不分享哪些數(shù)據(jù)。

四、拆解谷歌云端新平臺(tái)五大特征,Vertex AI一站搞定模型訓(xùn)練、調(diào)優(yōu)和部署

Google Cloud首席布道師Richard Seroter介紹了谷歌打造的云端新平臺(tái)的五個(gè)特征。

首先是實(shí)力超群,優(yōu)勢(shì)獨(dú)享。云端新平臺(tái)能帶來全新構(gòu)建方式、自動(dòng)化、多功能、深度集成等。Vertex AI可以一站搞定模型訓(xùn)練、調(diào)優(yōu)和部署。

Gemini 1.5 Pro可以支持超200萬個(gè)Tokens的上下文窗口,相當(dāng)于2小時(shí)視頻、20小時(shí)音頻、1500頁文檔和6萬行代碼。Vertex AI在處理谷歌中國(guó)一段25萬個(gè)Tokens的講座視頻時(shí),Gemini 1.5 Pro可以同時(shí)識(shí)別視頻中的聲音和畫面,并能自動(dòng)翻譯。

谷歌掏出一攬子開發(fā)者利器,小米SU7已經(jīng)用上

其次是自成體系,靈活拓展。Google Cloud可以配置服務(wù)生產(chǎn)集默認(rèn)值,及對(duì)開源接口的支持。Vertex AI中提供了150多種模型,包括谷歌自家、Anthropic、Meta等發(fā)布的模型。

第三是破除壁壘,便捷跨云。云端新平臺(tái)可以為開發(fā)者量身打造解決方案,滿足其在本地JKE集群部署或者其他云平臺(tái)部署的需求,讓用戶在不同云平臺(tái)之間遷移和管理資源。如BigQuery Omni允許用戶在多個(gè)主流云平臺(tái)上運(yùn)行BigQuery而無需遷移數(shù)據(jù);AloyDB Omni提供了無限制的數(shù)據(jù)庫(kù)部署環(huán)境。

第四是化繁為簡(jiǎn),輕松構(gòu)建。Google Cloud平臺(tái)通過自動(dòng)化和智能默認(rèn)設(shè)置,簡(jiǎn)化了云基礎(chǔ)設(shè)施的搭建和管理過程?,F(xiàn)在開發(fā)者可以在45分鐘內(nèi)搭建起生產(chǎn)級(jí)的云基礎(chǔ)設(shè)施,實(shí)現(xiàn)多方面功能。

最后是AI助力,智能隨心。Gemini for Google Cloud深度融入云體驗(yàn),包括IDE插件提供代碼生成、補(bǔ)全、解釋和測(cè)試生成等功能;Gemini in Databases將AI智能融入SQL生成、數(shù)據(jù)庫(kù)操作等任務(wù)。

結(jié)語:谷歌用AI新工具,助力中國(guó)開發(fā)者出海

谷歌此次重磅發(fā)布了新的開發(fā)工具,可以為開發(fā)者提供更強(qiáng)大的功能和更便捷的界面,幫助開發(fā)者基于大模型能力更快速地構(gòu)建、測(cè)試和部署應(yīng)用程序。

從Gemini API的強(qiáng)大數(shù)據(jù)處理能力到谷歌AI Studio的集成開發(fā)環(huán)境,再到AI技術(shù)的跨平臺(tái)應(yīng)用,谷歌正不斷幫助開發(fā)者拓寬應(yīng)用構(gòu)建的邊界,這或許會(huì)加速國(guó)內(nèi)開發(fā)者更快構(gòu)建應(yīng)用,讓產(chǎn)品在全球市場(chǎng)更具競(jìng)爭(zhēng)力。