智東西(公眾號:zhidxcom)
編 | 海中天
導語:PCMag記者在谷歌總部呆了一天,深入了解AI與機器學習是如何在谷歌內(nèi)部滲透的。他們采訪了許多高管,谷歌的目標就是圍繞AI打造一個生態(tài)系統(tǒng),將重復(fù)的人工處理變成自動流程,用AI為企業(yè)服務(wù)。
Makoto Koike是日本一名農(nóng)民,種植黃瓜。之前他是嵌入式系統(tǒng)設(shè)計師,在日本汽車行業(yè)工作,2015年他回到故鄉(xiāng),幫助父母種黃瓜。很快,他就發(fā)現(xiàn)要給黃瓜分類很麻煩,農(nóng)民要根據(jù)顏色、形狀、尺寸、特點(比如是否多刺)給黃瓜分類,工作很棘手,比種黃瓜還要費力。谷歌開發(fā)了AI軟件AlphaGo,受到谷歌的啟發(fā),Makoto Koike想將任務(wù)變成自動化流程。
現(xiàn)在企業(yè)已經(jīng)開始通過各種方式將AI應(yīng)用于實際,不過還沒有人看到過類似的技術(shù)出現(xiàn)過。Koike之前從沒有從事過AI技術(shù)方面的工作,有了開源TensorFlow機器學習技術(shù),他開始將黃瓜的圖片輸入系統(tǒng)。計算機視覺算法已經(jīng)可以識別對象,深度學習可以根據(jù)黃瓜的細微差別訓練TensorFlow,Koike意識到它可以用來識別、分類蔬菜,精準度很高。然后,Koike只用了TensorFlow和一臺便宜的Raspberry Pi 3計算機就制作出自動分類機器,今天農(nóng)場還在使用這臺機器。
市場上有許多的開源算法和工具,TensorFlow只是其中之一,企業(yè)和開發(fā)者想用AI解決一些問題,TensorFlow可以為他們的工作帶來革命性影響。谷歌將這些技術(shù)和應(yīng)用程序界面(API)放進自己所做的一切事情中,將機器學習植入產(chǎn)品,從根本上重新定義了軟件的運行流程。
最近,PCMag拜訪了Googleplex(也就是谷歌總部),采訪了一些高管,他們來自G Suite、谷歌云平臺(Google Cloud Platform)、機器學習先進解決方案實驗室(Machine Learning Advanced Solution Lab,ML ASL),了解谷歌是如何用AI技術(shù)重塑自我的。
AI無處不在
假設(shè)你的一個客戶遇到了問題,公司服務(wù)部門的一名代理用Google My Business與客戶在網(wǎng)上溝通,Google My Business是一個聊天功能,目前還處在試點階段。要幫助客戶解決問題,用戶需要將一些敏感個人數(shù)據(jù)發(fā)給代理?,F(xiàn)在假設(shè)客戶是你的祖母??蛻舴?wù)代表要求你的祖母發(fā)一些數(shù)據(jù),少量的數(shù)據(jù),你的祖母在聊天過程中上傳一張圖片,一張社會保障卡的圖片,但是她提交的信息比要求的多。
現(xiàn)在谷歌不是這樣做的,它會將個人身份信息(PII)歸檔,帶有社會保障號的圖片出現(xiàn)之后,其它PII信息也會自動匹配。代理看不到多余的信息,也不會有任何數(shù)據(jù)放進谷歌加密檔案。在加州谷歌山景城總部,公司員工演示了Google My Business的新功能,到底機器學習算法是怎樣完成使命的呢?谷歌揭開了神秘的面紗。
谷歌云計算信任與安全營銷主管Rob Sadowski解釋稱,自動編輯是通過谷歌數(shù)據(jù)損失預(yù)防(DLP) API完成的,它是底層技術(shù),給敏感數(shù)據(jù)分類是表面。算法還可以用同樣的方式處理一些數(shù)據(jù),比如信用卡號碼,如果號碼是假的,它可以分析模式,進行識別。谷歌想將AI放進體驗中,讓企業(yè)、開發(fā)者(比如Koike)有資源做同樣的事情,這只是谷歌精妙策略的一個例證。
有許多科技巨頭正在嘗試將互聯(lián)智能層植入軟件,不只是谷歌這樣做,還有亞馬遜和微軟,不過與它們相比谷歌的云智能工具和服務(wù)無疑寬泛很多。分析谷歌產(chǎn)品,你會發(fā)現(xiàn)谷歌助手、多種機器學習系統(tǒng)、計算機視覺API無處不在。
谷歌搜索在RankBrain AI系統(tǒng)使用了機器學習技術(shù),根據(jù)眾多變量處理精煉提問、重新排序、聚合數(shù)據(jù),不斷改進搜索結(jié)果。谷歌Photos用計算機視覺技術(shù)拼接照片,將它化為回憶,將同一個地點的多張圖片變成全景圖。Inbox可以自動生成“智能回復(fù)(Smart Replies)”,供用戶選擇,通過將相似類型的郵件捆綁,讓高度相關(guān)的郵件突出顯示。新的谷歌Allo聊天APP內(nèi)置了谷歌助手。還有更多的工具使用了AI技術(shù)。
所有這些APP都是在谷歌云基礎(chǔ)設(shè)施上運行的,谷歌在數(shù)據(jù)中心使用了機器學習技術(shù),用它降低能耗,根據(jù)負載、天氣信息調(diào)整冷卻泵。Sadowski說,在谷歌的安全戰(zhàn)略中,機器學習也是最后的防護層,谷歌在安全堆棧中用機器智力、風險評分判斷系統(tǒng)使用可預(yù)測分析是否存在缺陷。
Sadowski解釋稱:“谷歌開發(fā)了許多機器學習和AI模型,公司從安全角度著眼將所有模型優(yōu)化。與IT大多的部分相比,安全是變化比較大的。3年或者4年前,有些產(chǎn)品是安全基礎(chǔ)設(shè)施的核心,比如防火墻、端點防護,這些技術(shù)仍然很重要,但是我們想提供更深的防護,讓它規(guī)?;瘧?yīng)用,將它作為默認技術(shù)放置在多租戶基礎(chǔ)設(shè)施上,每天可以有幾百萬活躍用戶?!?/p>
“我們從底層數(shù)據(jù)中心硬件開始起步,比如最新的Titan芯片?!盨adowski繼續(xù)說,“在此之上是應(yīng)用服務(wù)、身份驗證,數(shù)據(jù)與通信完全加密。再上層是用戶身份。如何才能7天24小時監(jiān)控、偵測、響應(yīng)事件,這是最后的防護層。例如,如果要讓用戶通過身份認知代理遠程接入,我們就會有類似的技術(shù)確保安全。它是一項可編程的DLP服務(wù),能夠發(fā)現(xiàn)并防范數(shù)據(jù)泄露,幫助管理數(shù)據(jù),增強安全性。我們的目標是讓這些功能變得更容易使用,變成可消費服務(wù),大規(guī)模推廣?!?/p>
智能G Suite
機器學習技術(shù)已經(jīng)植入谷歌G Suite生產(chǎn)應(yīng)用中。G Suite產(chǎn)品管理主管Allan Livingston介紹了一些谷歌所采用的方法,這些方法使得G Suite更智能、更能感知環(huán)境,甚至連用戶都意識不到。
Livingston解釋稱:“你可以想像一下,G Suite將所有應(yīng)用以更自然的方式整合在一起。你從其中一個應(yīng)用開始工作,以適當?shù)姆绞竭^渡到其它應(yīng)用。你在Drive中打開Gmail附件,它將你帶到Docs,完全自動?!?/p>
“我們努力站在用戶的角度思考,當中會涉及到機器學習。我們最先從Gmail智能回復(fù)開始,然后在Inbox取得了成功,接下來又在Docs、Sheets、Slides中引進了Explore功能。”
Explore于去年秋天推出,它將自然語言處理技術(shù)應(yīng)用于程序內(nèi)生產(chǎn)體驗。例如,在Docs中,Explore可以根據(jù)文檔內(nèi)容瞬間提供建議,還可以自動推薦相關(guān)主題和資源。在Slides中,它可以生成設(shè)計建議,讓用戶精簡陳述格式。Livingston解釋了Explore是如何用機器學習簡化數(shù)據(jù)分析、商業(yè)智能情報的。
“許多用戶不知道數(shù)據(jù)透視表是什么,也不知道如何利用它將數(shù)據(jù)表視覺化?!?Livingston解釋稱,“假設(shè)你要處理一名客戶的銷售數(shù)據(jù),每一行都是一件已經(jīng)銷售的商品。Explore允許你用自然語言提問,比如:‘黑色星期五最暢銷的是什么商品?’系統(tǒng)會回答說:‘你賣了563條褲子?!跀?shù)據(jù)分析過程中我們可以節(jié)省時間,因為決策是以數(shù)據(jù)作為基礎(chǔ)的,我們用機器學習以更自然的方式提高解決普通問題的能力?!?/p>
Livingston還說,谷歌準備將這種機器學習云搜索功能提供給第三方,它開始圍繞新技術(shù)建立一個生態(tài)系統(tǒng)。谷歌的總思路實際上與AI的實用性有關(guān):讓人工處理實現(xiàn)自動化,將用戶解放出來,讓他們從事更有創(chuàng)造性的工作。這種思路實際上已經(jīng)成為大多機器學習APP的核心:讓重復(fù)性業(yè)務(wù)流程自動化,讓日常任務(wù)(包括黃瓜分類)變成自動化流程。
“在商業(yè)行為中,與消費者溝通時,用戶已經(jīng)使用這些自然交互模式。向云計算和移動生產(chǎn)力轉(zhuǎn)移改變了人們的工作方式,而機器學習技術(shù)又是其根本。”Livingston說,“因為我們在機器學習方面有優(yōu)勢,因為我們的產(chǎn)品可以作為基礎(chǔ)提供服務(wù),因為所有數(shù)據(jù)全都放在我們的云計算網(wǎng)絡(luò)中,所以我們占據(jù)了最佳位置,可以使用它,以規(guī)?;绞綉?yīng)用。”

為機器學習革命提供動力
谷歌在AI方面所做的一切工作都是以API、算法、開源工具作為根基的。谷歌TensorFlow 資源庫是GitHub平臺上最流行的機器學習工具,許多應(yīng)用程序采用,比如Koike黃瓜分類程序。整套API就是谷歌云計算的根本,正是它為谷歌APP和服務(wù)的每一個AI功能提供動力。
谷歌研究與機器智能產(chǎn)品經(jīng)理Francisco Uribe為引擎核心工作,正是這個核心改變了谷歌的運行模式。Uribe掌管谷歌ML ASL,它是一個實驗室,谷歌機器學習專家直接與企業(yè)合作,將AI解決方案植入企業(yè)。通過谷歌API和云計算機器學習引擎,實驗室與企業(yè)攜手合作,幫助企業(yè)在生產(chǎn)過程中訓練、部署模型。
Uribe在AI領(lǐng)域工作了10多年。他成立了BlackLocus,這是一家數(shù)據(jù)創(chuàng)業(yè)公司,為零售商開發(fā)自動比價引擎,2012年被家德寶收購。之后Uribe加入谷歌,在搜索廣告團隊工作了4年,用機器學習改進廣告體驗。2016年,他進入ML ASL,負責開發(fā)工作,成為Launchpad Accelerator的導師。Uribe說,企業(yè)和開發(fā)者積極使用谷歌工具,他感到相當驚訝。
“我們看到工具應(yīng)用于多個領(lǐng)域,包括健康護理、金融、零售和農(nóng)業(yè)?!盪ribe解釋說,“我們正在努力幫助客戶增強感知能力。語音翻譯、圖像識別、視頻API、自然語言:它們都是民主接入機器、深度學習算法的組成部分,這些算法終于變得適用了?!?/p>
ML ASL與匯豐銀行合作,用機器學習解決方案反制洗錢活動,預(yù)測信用評分。ML ASL還與聯(lián)合服務(wù)汽車協(xié)會(USAA)合作,幫它訓練機器學習工程師,將技術(shù)應(yīng)用于保險領(lǐng)域。eBay用谷歌工具訓練ShopBot 數(shù)字助手。Uribe解釋稱,當ML ASL與企業(yè)合作時,整個過程包含4個重要部分。
“機器學習工作的要求很高,你需要強大的計算產(chǎn)品才能滿足要求,你還要用GCP的分布式光纖骨干網(wǎng)絡(luò)傳輸數(shù)據(jù),以很高的效率從一個節(jié)點傳輸?shù)搅硪粋€節(jié)點?!盪ribe說,“我們有云機器學習引擎(Cloud Machine Learning Engine),可以幫助客戶訓練模型,我們利用Kaggle社區(qū)幫助客戶處理數(shù)據(jù),那里有800名活躍的數(shù)據(jù)科學家。最終,你還需要人才,在研發(fā)方面,我們有Brain Residency Program,這個項目用復(fù)雜的機器學習課程培訓工程師。它們都是組成部分,共同幫助客戶構(gòu)建智能應(yīng)用?!?/p>
所有這些東西都放進了開源社區(qū)和第三方生態(tài)系統(tǒng)。年初時,谷歌宣布舉辦機器學習創(chuàng)業(yè)公司挑戰(zhàn)賽,機器學習創(chuàng)業(yè)公司如果拿獎,最高可獲50萬美元投資。Uribe談到了一些創(chuàng)業(yè)應(yīng)用,這些應(yīng)用是Uribe在谷歌技術(shù)中看到的,未來也許會出現(xiàn)其它的變化。
“假設(shè)你有一家客戶服務(wù)分析公司,你們用語音API轉(zhuǎn)化語音呼叫,然后分析情感,提高客服質(zhì)量?!盪ribe說,“到了外國,你可以用視覺API拍一張街道標志的照片,然后翻譯API就可以實時在APP中將內(nèi)容翻譯出來。它不只可以提高效率,還可以創(chuàng)造新穎、獨特的用戶體驗?!?/p>
Uribe認為,因為TensorFlow等工具的存在,在市場上大規(guī)模推廣機器學習技術(shù)變得更容易了。谷歌是什么?谷歌如何開發(fā)產(chǎn)品?現(xiàn)在這些技術(shù)已經(jīng)成為核心,不只如此,Uribe還相信廣泛存在的機器學習技術(shù)可以優(yōu)化業(yè)務(wù)、創(chuàng)造新的營收流、發(fā)明新型智能APP。
他還說:“我們可以將它視為新的工業(yè)革命,這些工具可以大幅提高效率,帶來前年未有的體驗。創(chuàng)業(yè)公司積極采用,我們感到驚訝??纯慈毡痉N黃瓜的農(nóng)民,他用TensorFlow開發(fā)一個模型,根據(jù)模樣、尺寸、紋理等標準給黃瓜分類,然后自己制作特殊硬件執(zhí)行。這是一種民主化進程,讓人驚嘆,我們現(xiàn)在只是觸及表面?!?/p>



