帶你認(rèn)識(shí)DataOps

什么是DataOps

DataOps(數(shù)據(jù)運(yùn)維)是一門(mén)新興學(xué)科犁享,它將DevOps團(tuán)隊(duì)與數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家角色召集在一起况毅,以提供工具晓殊,流程和組織結(jié)構(gòu)來(lái)支持以數(shù)據(jù)為中心的企業(yè)碗短。
DataOps(數(shù)據(jù)操作)是一種敏捷的凤优,面向過(guò)程的方法悦陋,用于開(kāi)發(fā)和交付分析。它匯集了DevOps團(tuán)隊(duì)筑辨,數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家俺驶,以提供工具,流程和組織結(jié)構(gòu)來(lái)支持以數(shù)據(jù)為中心的企業(yè)棍辕。Forrester的副總裁兼首席分析師Michele Goetz將DataOps定義為“具有從基礎(chǔ)設(shè)施到體驗(yàn)的所有技術(shù)層暮现,實(shí)現(xiàn)解決方案,開(kāi)發(fā)數(shù)據(jù)產(chǎn)品以及激活數(shù)據(jù)以實(shí)現(xiàn)商業(yè)價(jià)值的能力楚昭∑艽”

DataOps目標(biāo)

根據(jù)[Dataversity的]說(shuō)法,[DataOps]的目標(biāo)是基于數(shù)據(jù)和數(shù)據(jù)分析來(lái)簡(jiǎn)化應(yīng)用程序的設(shè)計(jì)抚太,開(kāi)發(fā)和維護(hù)塘幅。它試圖改善數(shù)據(jù)管理和產(chǎn)品創(chuàng)建的方式昔案,并將這些改進(jìn)與業(yè)務(wù)目標(biāo)進(jìn)行協(xié)調(diào)。

DataOps與DevOps

DevOps是一種軟件開(kāi)發(fā)方法晌块,通過(guò)將開(kāi)發(fā)團(tuán)隊(duì)和運(yùn)營(yíng)團(tuán)隊(duì)合并為一個(gè)負(fù)責(zé)產(chǎn)品或服務(wù)的單一部門(mén)爱沟,將持續(xù)交付交付到系統(tǒng)開(kāi)發(fā)生命周期。DataOps通過(guò)增加數(shù)據(jù)專(zhuān)家(數(shù)據(jù)分析師匆背,數(shù)據(jù)開(kāi)發(fā)人員呼伸,數(shù)據(jù)工程師和/或數(shù)據(jù)科學(xué)家)建立在該概念的基礎(chǔ)上,以專(zhuān)注于數(shù)據(jù)流的協(xié)作開(kāi)發(fā)和整個(gè)組織中數(shù)據(jù)的連續(xù)使用钝尸。

“您已經(jīng)有了開(kāi)發(fā)運(yùn)維的現(xiàn)代趨勢(shì)括享,但是越來(lái)越多的人正在將某種數(shù)據(jù)科學(xué)能力注入到開(kāi)發(fā)和系統(tǒng)中,因此珍促,您需要在運(yùn)維團(tuán)隊(duì)中擁有一個(gè)具有數(shù)據(jù)心態(tài)的人铃辖。” HPE MapR的CTO Ted Dunning和《[機(jī)器學(xué)習(xí)物流:現(xiàn)實(shí)世界中的模型管理》的]合著者猪叙。

DataOps原則

像DevOps一樣娇斩,DataOps借鑒了敏捷方法。該方法重視以持續(xù)滿(mǎn)足客戶(hù)需求為主要目標(biāo)的分析見(jiàn)解的交付穴翩。

根據(jù)《[DataOps宣言》]犬第,DataOps團(tuán)隊(duì)重視有效的分析,并通過(guò)其提供的見(jiàn)解來(lái)衡量數(shù)據(jù)分析的性能芒帕。DataOps團(tuán)隊(duì)還接受變化歉嗓,并尋求不斷了解不斷變化的客戶(hù)需求。他們圍繞目標(biāo)進(jìn)行自我組織背蟆,并尋求減少“英雄主義”鉴分,而采用可持續(xù)且可擴(kuò)展的團(tuán)隊(duì)和流程。

DataOps團(tuán)隊(duì)還尋求從頭到尾協(xié)調(diào)數(shù)據(jù)带膀,工具志珍,代碼和環(huán)境,以提供可重復(fù)的結(jié)果垛叨。DataOps團(tuán)隊(duì)傾向于將分析管道視為類(lèi)似于精益生產(chǎn)線(xiàn)碴裙,并定期反映客戶(hù),團(tuán)隊(duì)成員和運(yùn)營(yíng)統(tǒng)計(jì)信息所提供的反饋点额。

適用于DataOps的地方

當(dāng)今的企業(yè)越來(lái)越多地將機(jī)器學(xué)習(xí)注入到眾多產(chǎn)品和服務(wù)中舔株,DataOps是一種旨在滿(mǎn)足機(jī)器學(xué)習(xí)的端到端需求的方法。

“例如还棱,這種樣式使數(shù)據(jù)科學(xué)家更容易獲得軟件工程的支持载慈,以提供在部署過(guò)程中將模型移交給運(yùn)營(yíng)時(shí)所需的東西,” Dunning和合著者珍手,HPE首席技術(shù)專(zhuān)家艾倫·弗里德曼(Ellen Friedman)寫(xiě)道办铡。 辞做。

他們補(bǔ)充說(shuō):“ DataOps方法不僅限于機(jī)器學(xué)習(xí)」丫撸” “這種組織風(fēng)格對(duì)于任何面向數(shù)據(jù)的工作都是有用的秤茅,從而使利用全球數(shù)據(jù)結(jié)構(gòu)所帶來(lái)的好處變得更加容易⊥”

他們還指出框喳,DataOps非常適合微服務(wù)架構(gòu)。

實(shí)踐中的DataOps

根據(jù)Dunning和Friedman的說(shuō)法厦坛,為了充分利用DataOps五垮,企業(yè)必須發(fā)展其數(shù)據(jù)管理策略,以大規(guī)模處理數(shù)據(jù)并響應(yīng)發(fā)生的現(xiàn)實(shí)事件杜秸。

他們寫(xiě)道:“傳統(tǒng)上孤立的角色可能過(guò)于僵化和緩慢放仗,無(wú)法很好地適應(yīng)正在進(jìn)行數(shù)字化轉(zhuǎn)型的大數(shù)據(jù)組織∏说” “這就是DataOps風(fēng)格可以提供幫助的地方诞挨。”

由于DataOps建立在DevOps之上呢蛤,因此跨職能團(tuán)隊(duì)跨越諸如運(yùn)營(yíng)亭姥,軟件工程,體系結(jié)構(gòu)和計(jì)劃顾稀,產(chǎn)品管理,數(shù)據(jù)分析坝撑,數(shù)據(jù)開(kāi)發(fā)和數(shù)據(jù)工程之類(lèi)的“技能行會(huì)”是必不可少的静秆,因此應(yīng)在以下位置管理DataOps團(tuán)隊(duì):確保開(kāi)發(fā)人員,運(yùn)營(yíng)專(zhuān)業(yè)人員和數(shù)據(jù)專(zhuān)家之間加強(qiáng)協(xié)作和溝通的方式巡李。

據(jù)Dunning稱(chēng)抚笔,數(shù)據(jù)科學(xué)家也可能是DataOps團(tuán)隊(duì)的重要成員。他說(shuō):“我認(rèn)為侨拦,在這里要做的最重要的事情就是不要堅(jiān)持傳統(tǒng)的象牙塔組織殊橙,在該組織中數(shù)據(jù)科學(xué)家與開(kāi)發(fā)團(tuán)隊(duì)分開(kāi)居住∮樱” “您可以采取的最重要的步驟實(shí)際上是將數(shù)據(jù)科學(xué)家納入DevOps團(tuán)隊(duì)膨蛮。當(dāng)他們住在同一房間,吃相同的飯菜季研,聽(tīng)到相同的抱怨時(shí)敞葛,他們自然會(huì)結(jié)盟∮胛校”

但是Dunning還指出惹谐,數(shù)據(jù)科學(xué)家可能不需要永久地嵌入到DataOps團(tuán)隊(duì)中持偏。

Dunning說(shuō):“通常,團(tuán)隊(duì)中有一段時(shí)間是一位數(shù)據(jù)科學(xué)家氨肌『韪眩” “他們的能力和敏感性開(kāi)始減弱。然后怎囚,團(tuán)隊(duì)中的某個(gè)人擔(dān)當(dāng)了數(shù)據(jù)工程師和某種低預(yù)算數(shù)據(jù)科學(xué)家的角色卿叽。然后,嵌入團(tuán)隊(duì)中的實(shí)際數(shù)據(jù)科學(xué)家就隨波逐流了桩了。這是一個(gè)不穩(wěn)定的情況附帽。”

如何建立一個(gè)DataOps團(tuán)隊(duì)

弗里德曼說(shuō)井誉,大多數(shù)基于DevOps的企業(yè)已經(jīng)掌握了DataOps團(tuán)隊(duì)的核心蕉扮。一旦他們確定了需要數(shù)據(jù)密集型開(kāi)發(fā)的項(xiàng)目,他們只需要向團(tuán)隊(duì)添加經(jīng)過(guò)數(shù)據(jù)培訓(xùn)的人員即可颗圣。該人甚至可能是數(shù)據(jù)工程師喳钟,而不是專(zhuān)職數(shù)據(jù)科學(xué)家。

通常在岂,團(tuán)隊(duì)將由技能重疊的個(gè)人組成奔则,或者根據(jù)專(zhuān)業(yè)知識(shí),個(gè)人可能在DataOps團(tuán)隊(duì)中擔(dān)任多個(gè)角色蔽午。

Dunning和Friedman在他們的書(shū)中寫(xiě)道:“在大型項(xiàng)目中易茬,一個(gè)特定的DataOps角色可能會(huì)由多個(gè)人擔(dān)任,但是有些人會(huì)承擔(dān)多個(gè)角色也很常見(jiàn)及老〕槔常” “操作和軟件工程技能可能會(huì)重疊;具有軟件工程經(jīng)驗(yàn)的團(tuán)隊(duì)成員也可能具有數(shù)據(jù)工程師的資格骄恶。數(shù)據(jù)科學(xué)家通常具有數(shù)據(jù)工程技能食铐。但是,很少看到數(shù)據(jù)科學(xué)與操作之間存在重疊僧鲁∨吧耄”

根據(jù)Forrester的Goetz所說(shuō),DataOps團(tuán)隊(duì)的一些專(zhuān)業(yè)知識(shí)關(guān)鍵領(lǐng)域包括:

  • 資料庫(kù)
  • 一體化
  • 數(shù)據(jù)進(jìn)行業(yè)務(wù)流程編排
  • 數(shù)據(jù)策略部署
  • 數(shù)據(jù)和模型整合
  • 數(shù)據(jù)安全和隱私控制

無(wú)論組成如何寞秃,DataOps團(tuán)隊(duì)都必須有一個(gè)共同的目標(biāo):他們支持的服務(wù)的數(shù)據(jù)驅(qū)動(dòng)需求斟叼。

Dunning說(shuō):“有了工程團(tuán)隊(duì),優(yōu)秀的工程師春寿,您需要做的是設(shè)定好目標(biāo)犁柜。” “一旦有一個(gè)共同的目標(biāo)堂淡,即解決問(wèn)題馋缅,那么團(tuán)隊(duì)通常會(huì)為解決該問(wèn)題而組織起來(lái)扒腕。當(dāng)不同的人看到問(wèn)題的不同方面時(shí),困難就來(lái)了萤悴。運(yùn)維人員將擔(dān)心可靠性瘾腰,您會(huì)得到一個(gè)問(wèn)題。在一定時(shí)間內(nèi)給出答案覆履。數(shù)據(jù)科學(xué)人員傾向于關(guān)注答案的準(zhǔn)確性蹋盆。您已經(jīng)有些分歧了,但是如果他們?cè)噲D解決相同的問(wèn)題并且他們?cè)敢馔讌f(xié)關(guān)于如何解決這個(gè)問(wèn)題硝全,我認(rèn)為這是一個(gè)非常容易建立的社會(huì)結(jié)構(gòu)栖雾。”

DataOps角色

根據(jù)Goetz的說(shuō)法伟众,DataOps團(tuán)隊(duì)成員包括:

  • 數(shù)據(jù)專(zhuān)家析藕,他們支持?jǐn)?shù)據(jù)格局和開(kāi)發(fā)最佳實(shí)踐
  • 數(shù)據(jù)工程師,為BI凳厢,分析和業(yè)務(wù)應(yīng)用程序提供臨時(shí)和系統(tǒng)支持
  • 首席數(shù)據(jù)工程師账胧,他們是從事產(chǎn)品和面向客戶(hù)的交付物的開(kāi)發(fā)人員

DataOps薪水

根據(jù)[PayScale的]數(shù)據(jù),以下是與DataOps相關(guān)的一些最受歡迎的職位以及每個(gè)職位的平均工資 :

  • Analytics(分析)經(jīng)理:68K- 127K
  • 助理數(shù)據(jù)科學(xué)家:6萬(wàn)至10.2萬(wàn)美元
  • 商業(yè)智能分析師:50K- 95K
  • 數(shù)據(jù)分析師:43K- 85K
  • 數(shù)據(jù)架構(gòu)師:76K- 155K
  • 數(shù)據(jù)工程師:65K- 132K
  • 數(shù)據(jù)科學(xué)家:67K- 134K
  • 數(shù)據(jù)科學(xué)家先紫,IT:6萬(wàn)美元至13.4萬(wàn)美元
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末治泥,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子遮精,更是在濱河造成了極大的恐慌居夹,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,640評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件本冲,死亡現(xiàn)場(chǎng)離奇詭異准脂,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)眼俊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)粟关,“玉大人疮胖,你說(shuō)我怎么就攤上這事∶瓢澹” “怎么了澎灸?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,011評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)遮晚。 經(jīng)常有香客問(wèn)我性昭,道長(zhǎng),這世上最難降的妖魔是什么县遣? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,755評(píng)論 1 294
  • 正文 為了忘掉前任糜颠,我火速辦了婚禮汹族,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘其兴。我一直安慰自己顶瞒,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布元旬。 她就那樣靜靜地躺著榴徐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪匀归。 梳的紋絲不亂的頭發(fā)上坑资,一...
    開(kāi)封第一講書(shū)人閱讀 51,610評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音穆端,去河邊找鬼袱贮。 笑死,一個(gè)胖子當(dāng)著我的面吹牛徙赢,可吹牛的內(nèi)容都是我干的字柠。 我是一名探鬼主播产阱,決...
    沈念sama閱讀 40,352評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼萌业,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了困后?” 一聲冷哼從身側(cè)響起枕屉,我...
    開(kāi)封第一講書(shū)人閱讀 39,257評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤常柄,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后搀擂,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體西潘,經(jīng)...
    沈念sama閱讀 45,717評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評(píng)論 3 336
  • 正文 我和宋清朗相戀三年哨颂,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了喷市。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,021評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡威恼,死狀恐怖品姓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情箫措,我是刑警寧澤腹备,帶...
    沈念sama閱讀 35,735評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站斤蔓,受9級(jí)特大地震影響植酥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評(píng)論 3 330
  • 文/蒙蒙 一友驮、第九天 我趴在偏房一處隱蔽的房頂上張望漂羊。 院中可真熱鬧,春花似錦喊儡、人聲如沸拨与。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,936評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)买喧。三九已至,卻和暖如春匆赃,著一層夾襖步出監(jiān)牢的瞬間淤毛,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,054評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工算柳, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留低淡,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,224評(píng)論 3 371
  • 正文 我出身青樓瞬项,卻偏偏與公主長(zhǎng)得像蔗蹋,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子囱淋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容