h2o的使用

h2o 一個簡單方便的建模工具,提供多種接入方式.java ,python等客戶端.還有一個h2o-flow的可視化界面.總結(jié)下使用的歷程,希望有更多的人使用起來.

h2o-flow

下載地址: https://www.h2o.ai/download/

  • 使用界面如下,類似于zeppelin的使用風(fēng)格.
  • java -jar h2o.jar [各種參數(shù)] ,內(nèi)置了jetty服務(wù),直接用java -jar就可以啟動.然后訪問端口為54321.
  • flow的方式不能對數(shù)據(jù)做處理,需要將數(shù)據(jù)提前處理好.
  • 對中文的支持不是很好.顯示亂碼.主要是中文是雙字節(jié)的,h2o有自己的數(shù)據(jù)結(jié)構(gòu)(hex).hex是對單字節(jié)的處理.修改下源碼即可.
  • h2o可以直接讀取hdfs (hdfs://.......),本地等數(shù)據(jù).對于文件格式的支持有text,csv,parquet等.orc的格式需要以hadoop集群的方式啟動,才能使用.
  • 對parquet格式的支持有timestamp int96的問題.這個問題主要是parquet項(xiàng)目中timestamp使用的類型是int96造成的.spark,drill等項(xiàng)目也會遇到這個問題.但是都各自解決掉了.參照spark的修改方式.也可以修改.
  • h2o集群的部署,有三種部署方式,一種是jvm進(jìn)程組建standalone集群.另外兩種借助hadoop實(shí)現(xiàn)分布式集群.
  • standalone集群方式中,沒有HA,其中一臺壞掉了這個集群就壞掉了.
  • standalone集群也會有通信問題,在不使用多長時(shí)間后這個集群會因?yàn)楸O(jiān)聽心態(tài)通信不成功而down掉.(這個問題沒有解決),可能是ipv6的問題.
  • 使用方式很簡單,按照notebook的方式引用數(shù)據(jù),選擇模型類型.很快就能看到各個模型的指標(biāo)了.
  • h2o 中文社區(qū)我是沒有找到.整個社區(qū)也不是很活躍.
image.png

h2o-python

python 客戶端的使用方式, 需要安裝 python 的h2o的客戶端.可以在官網(wǎng)找到.

  • 如何使用python客戶端連接 h2o server服務(wù)器的話,必須主要版本號必須一致.小版本號也好一致.否則會有問題. h2o.connect("localhost")
  • 如果使用的是python自己啟動的實(shí)例就沒有這樣的問題. h2o.init()
  • python 可以有些數(shù)據(jù)處理的動作,然后在模型部署前,將python文件和模型一起打包完成線上模型的部署.


    image.png

線上部署模型

上面兩種方式最終都可以導(dǎo)出pojo或者mojo文件.將這個文件使用steam(h2o 的一個工具)可以打包成war.然后部署在容器中.完成線上部署.

總結(jié)

h2o快速建模,快速部署模型的方式大大縮減了開發(fā)模型到上線部署的時(shí)間周期.對于有java 和python語言基礎(chǔ)的人員來說上手速度快.
由于社區(qū)不是很活躍,對于一些水土不服的功能,需要各自修改,增添功能.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蝶防,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌封断,老刑警劉巖漠吻,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異黎侈,居然都是意外死亡痹仙,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進(jìn)店門惊奇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荆几,“玉大人,你說我怎么就攤上這事赊时《种” “怎么了?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵祖秒,是天一觀的道長诞吱。 經(jīng)常有香客問我,道長竭缝,這世上最難降的妖魔是什么房维? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮抬纸,結(jié)果婚禮上咙俩,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好阿趁,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布膜蛔。 她就那樣靜靜地躺著,像睡著了一般脖阵。 火紅的嫁衣襯著肌膚如雪皂股。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天命黔,我揣著相機(jī)與錄音呜呐,去河邊找鬼。 笑死悍募,一個胖子當(dāng)著我的面吹牛蘑辑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播坠宴,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼洋魂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了啄踊?” 一聲冷哼從身側(cè)響起忧设,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤刁标,失蹤者是張志新(化名)和其女友劉穎颠通,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體膀懈,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡顿锰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了启搂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片硼控。...
    茶點(diǎn)故事閱讀 38,650評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖胳赌,靈堂內(nèi)的尸體忽然破棺而出牢撼,到底是詐尸還是另有隱情,我是刑警寧澤疑苫,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布熏版,位于F島的核電站,受9級特大地震影響捍掺,放射性物質(zhì)發(fā)生泄漏撼短。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一挺勿、第九天 我趴在偏房一處隱蔽的房頂上張望曲横。 院中可真熱鬧,春花似錦不瓶、人聲如沸禾嫉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽夭织。三九已至吭露,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間尊惰,已是汗流浹背讲竿。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留弄屡,地道東北人题禀。 一個月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像膀捷,于是被迫代替她去往敵國和親迈嘹。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評論 2 349