這是一篇學(xué)習(xí)和了解Oozie的文章。
什么是Oozie
- 簡(jiǎn)而言之癣蟋,Apache Oozie 是用于 Hadoop 平臺(tái)的一種工作流調(diào)度引擎。
Oozie有什么作用
- 在Hadoop中執(zhí)行的任務(wù)有時(shí)候需要把多個(gè)Map/Reduce作業(yè)連接到一起疯搅,這樣才能夠達(dá)到目的。而我們知道,在一個(gè)作業(yè)中只有一個(gè)Map和一個(gè)Reduce函數(shù)琐馆,這個(gè)時(shí)候就需要用到Oozie恒序。
- Oozie可以把多個(gè)Map/Reduce作業(yè)組合到一個(gè)邏輯工作單元中,從而完成更大型的任務(wù)歧胁。
- Oozie 工作流是控制依賴有向非循環(huán)圖 (DAG) 中安排的 Oozie 操作的集合喊巍。控制依賴(Control dependency)可確保以下操作在前面的操作已成功完成后才會(huì)啟動(dòng)崭参。
Oozie的安裝和使用
展開閱讀