智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西5月12日報道,在IT領(lǐng)域,云原生、人工智能(AI)是時下最熱的概念之一。盡管許多企業(yè)心向往之,但并不是每位工程師都能準確地理解“云原生AI”的含義,以及了解如何將它們落地到真實的企業(yè)業(yè)務(wù)場景中。

在4月28日直播的《八點一“課”,紅帽企業(yè)開源講堂》第三期中,紅帽資深解決方案架構(gòu)師趙錫漪對這一話題進行解讀,并分享了紅帽近些年在AI領(lǐng)域的投入。他還談到如何使用開放數(shù)據(jù)中心(Open Data Hub)為AI提供助力、如何通過Open Data Hub在OpenShift中搭建數(shù)據(jù)科學實驗室等話題。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

為了說明云原生AI的價值,趙錫漪舉了個例子,在工業(yè)制造領(lǐng)域,過去基本上一個月才能改變一次生產(chǎn)線,現(xiàn)在很多制造企業(yè)一個月甚至能造一個工廠,或者工廠生產(chǎn)的產(chǎn)品一個月內(nèi)完全換成另一種產(chǎn)品,那么幾天就要將生產(chǎn)線上所有的機械臂調(diào)優(yōu)優(yōu)化。此時,工廠需要一種能將AI快速部署到前端的手段。

而云原生中的DevOps特別適合這種場景,因為DevOps或CI/CD場景是持續(xù)不斷地把從云端設(shè)計好的東西傳遞到生產(chǎn)線上,整個過程無需人參與。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

因此,現(xiàn)在國家的許多標準會強調(diào)軟式PRC,紅帽的OpenShift也可以跑在一個PRC中。當前紅帽正在幫一些制造業(yè)企業(yè)在設(shè)計這樣的場景,如果用CI/CD的方法把容器以及AI的邏輯調(diào)度起來,它就能更快地做生產(chǎn)轉(zhuǎn)型。這會給工業(yè)生產(chǎn)帶來巨大價值。

做AI開發(fā)、數(shù)據(jù)科學、應用開發(fā)都是一個CI/CD過程,但做事情的角度不同,需要一個平臺將其串聯(lián),實現(xiàn)多段協(xié)同。紅帽提倡的云原生AI可以做到兩件事:一是隔離,讓有限的資源被用在特定的事情上;二是共享,按政策相互間可以聯(lián)通協(xié)作。

用戶在OpenShift上可同時調(diào)度英特爾OpenVINO和英偉達GPU框架,并支持軟性的多GPU共享,即一個數(shù)據(jù)中心能將GPU分給了很多用戶。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

趙錫漪說,作為一個開源的、中立的、平臺型廠商,紅帽的優(yōu)勢是可以集合大家的優(yōu)勢。這些優(yōu)勢應用到整個AI算法構(gòu)建過程中,就變成了一個逐步可完善的過程。

使用AI能力通常有兩種方式:一種是研究數(shù)據(jù),然后進行模型構(gòu)建,這是紅帽O(jiān)pen Data Hub產(chǎn)品中最核心的;另一種是已經(jīng)寫好更底層的代碼,直接用GPU資源,這時可以用OpenShift虛擬化,將GPU切成很多個vGPU。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

上圖的8個組件,均可由Open Data Hub調(diào)度起來。Open Data Hub可通過MLflow模式,將這些組件經(jīng)提供好的參數(shù),直接匹配成一套可運行的環(huán)境,用戶在Python上直接寫代碼即可,不需要自己在底層配置。

其中有一個組件SELODM很有價值,它可以把不同的AI模型組合在一起,把它描述成一個協(xié)同工作的模型。比如說有三個模型,先做兩個模型的運算,然后通過前兩個模型算出來誰的接近率最高,例如誰的接近率到90%以上,就把它用到的B模型的輸入里面,然后B模型再輸出,最終形成一個總的運算結(jié)果。

有了SELODM,用戶可同時將幾個模型下發(fā)到生產(chǎn)中,按照比例設(shè)置這邊用多少、那邊用多少,然后最后評估誰的模型更有效,以此發(fā)布一個更有效的模型。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

AI實踐有兩個常見瓶頸:一是怎么開始,二是怎么投產(chǎn)。應用開發(fā)師未必能很好地理解算法工程師或數(shù)學科學家研究的成果。但如果將多方間的耦合變成一種平臺化的對接行為,就能減少溝通方面的瓶頸。這也是Open Data Hub能在云端幫助用戶做AI所起到的作用。

至于如何在OpenShift快速搭建數(shù)據(jù)科學實驗室,趙錫漪提到一個典型的工業(yè)制造項目MANUfacturing Edge Lightweight Accelerator。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

它包括多域、多云如何組合、這些云之間如何協(xié)同、怎樣在傳統(tǒng)系統(tǒng)上獨立構(gòu)建出一個新的數(shù)學科學實驗室,然后把原來已經(jīng)在生產(chǎn)線的數(shù)據(jù)采集之后交給數(shù)學實驗室,由數(shù)學實驗室形成一些AI模型,再下發(fā)給生產(chǎn)線上的一些監(jiān)控設(shè)備和監(jiān)控窗口,從而形成一個對原有監(jiān)控體系的完整體系?!盁o論你想做什么樣的事情,都可以在這個架構(gòu)上開始?!壁w錫漪說。

MANUfacturing Edge Lightweight Accelerator是輕量級的,并帶有邊緣計算特性,因此這對于一些邊緣計算的場景應用也是個很好的起步項目。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能

當被問及多云環(huán)境對AI開發(fā)有什么影響,他解釋說沒有太大影響,像紅帽的AI開發(fā)基本上在 Open Data Hub上做,至于當前在哪個AI實驗室里做對整個AI發(fā)布不算大事。

趙錫漪透露,紅帽將推出AI/ML on OpenShift動手實驗營,會提供一個免費的線上培訓環(huán)境。此外,紅帽AI/ML Innovation Lab創(chuàng)新實驗室很快會進入中國市場,通過深入客戶的開發(fā)、運維、設(shè)計團隊,幫助客戶從開源環(huán)境搭建選擇及需求整理直到最終做一個原型的過程。

云原生AI如何落地到業(yè)務(wù)場景?紅帽專家解讀開源新技能