【mlflow系列1】mlflow的搭建使用

背景

mlflow是Databrick開(kāi)源的機(jī)器學(xué)習(xí)管理平臺(tái)故俐,它很好的解藕了算法訓(xùn)練和算法模型服務(wù),使得算法工程師專(zhuān)注于模型的訓(xùn)練榨馁,而不需要過(guò)多的關(guān)注于服務(wù)的,
而且在我們公司已經(jīng)有十多個(gè)服務(wù)穩(wěn)定運(yùn)行了兩年多。

搭建

mlflow的搭建主要是mlflow tracking server的搭建,tracking server主要是用于模型的元數(shù)據(jù)以及模型的數(shù)據(jù)存儲(chǔ)
我們這次以minio作為模型數(shù)據(jù)的存儲(chǔ)后臺(tái)涛癌,mysql作為模型元數(shù)據(jù)的存儲(chǔ),因?yàn)檫@種模式能滿足線上的需求送火,不僅僅是用于測(cè)試

  • minio的搭建
    參考我之前的文章MinIO的搭建使用拳话,并且創(chuàng)建名為mlflow的bucket,便于后續(xù)操作

  • mlflow的搭建

    • conda的安裝
      參照install conda,根據(jù)自己的系統(tǒng)安裝不同的conda環(huán)境
    • mlfow tracking server安裝
    # 創(chuàng)建conda環(huán)境 并安裝 python 3.6  
    conda create -n mlflow-1.11.0 python==3.6
    #激活conda環(huán)境
    conda activate mlflow-1.11.0
    # 安裝mlfow tracking server python需要的依賴包
    pip install mlflow==1.11.0 
    pip install mysqlclient
    pip install boto3
    
    • mlflow tracking server的啟動(dòng)
    暴露出minio url以及需要的ID和KEY种吸,因?yàn)閙lflow tracking server在上傳模型文件時(shí)需要        
    export AWS_ACCESS_KEY_ID=AKIAIOSFODNN7EXAMPLE      
    export AWS_SECRET_ACCESS_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY      
    export MLFLOW_S3_ENDPOINT_URL=http://localhost:9001     
    mlflow server \
       --backend-store-uri mysql://root:AO,h07ObIeH-@localhost/mlflow_test \
       --host 0.0.0.0 -p 5002 \
       --default-artifact-root s3://mlflow
    

    訪問(wèn)localhost:5002, 就能看到如下界面:

    mlflow.png

使用

拷貝以下的wine.py文件

import os
import warnings
import sys

import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import ElasticNet
import mlflow.sklearn


def eval_metrics(actual, pred):
  rmse = np.sqrt(mean_squared_error(actual, pred))
  mae = mean_absolute_error(actual, pred)
  r2 = r2_score(actual, pred)
  return rmse, mae, r2


if __name__ == "__main__":
  warnings.filterwarnings("ignore")
  np.random.seed(40)

  # Read the wine-quality csv file (make sure you're running this from the root of MLflow!)
  wine_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), "wine-quality.csv")
  data = pd.read_csv(wine_path)

  # Split the data into training and test sets. (0.75, 0.25) split.
  train, test = train_test_split(data)

  # The predicted column is "quality" which is a scalar from [3, 9]
  train_x = train.drop(["quality"], axis=1)
  test_x = test.drop(["quality"], axis=1)
  train_y = train[["quality"]]
  test_y = test[["quality"]]

  alpha = float(sys.argv[1]) if len(sys.argv) > 1 else 0.5
  l1_ratio = float(sys.argv[2]) if len(sys.argv) > 2 else 0.5
  mlflow.set_tracking_uri("http://localhost:5002")
  client = mlflow.tracking.MlflowClient()
  mlflow.set_experiment('http_metrics_test')
  with mlflow.start_run():
      lr = ElasticNet(alpha=alpha, l1_ratio=l1_ratio, random_state=42)
      lr.fit(train_x, train_y)

      predicted_qualities = lr.predict(test_x)

      (rmse, mae, r2) = eval_metrics(test_y, predicted_qualities)

      print("Elasticnet model (alpha=%f, l1_ratio=%f):" % (alpha, l1_ratio))
      print("  RMSE: %s" % rmse)
      print("  MAE: %s" % mae)
      print("  R2: %s" % r2)

      mlflow.log_param("alpha", alpha)
      mlflow.log_param("l1_ratio", l1_ratio)
      mlflow.log_metric("rmse", rmse)
      mlflow.log_metric("r2", r2)
      mlflow.log_metric("mae", mae)

      mlflow.sklearn.log_model(lr, "model")

注意:
1.mlflow.set_tracking_uri("http://localhost:5002") 設(shè)置為剛才啟動(dòng)的mlflow tracking server的地址
2.mlflow.set_experiment('http_metrics_test') 設(shè)置實(shí)驗(yàn)的名字
3.安裝該程序所依賴的python包
4.如果不是在同一個(gè)conda環(huán)境中弃衍,還得執(zhí)行

    export AWS_ACCESS_KEY_ID=AKIAIOSFODNN7EXAMPLE      
    export AWS_SECRET_ACCESS_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY      
    export MLFLOW_S3_ENDPOINT_URL=http://localhost:9001

便于python客戶端上傳模型文件以及模型元數(shù)據(jù)
直接執(zhí)行 python wine.py 如果成功,訪問(wèn)mlflow tracking server ui下有如下

mlflow-ui.png

點(diǎn)擊 2020-10-30 10:34:38坚俗,如下:

mlflow-model1.png

mlflow-model2.png

啟動(dòng)mlflow 算法服務(wù)

在同一個(gè)conda環(huán)境中執(zhí)行命令

export MLFLOW_TRACKING_URI=http://localhost:5002 
mlflow models serve -m runs:/e69aed0b22fb45debd115dfc09dbc75a/model -p 1234 --no-conda

其中e69aed0b22fb45debd115dfc09dbc75a為mlflow tracking server ui中的run id

如遇到ModuleNotFoundError: No module named 'sklearn'
執(zhí)行 pip install scikit-learn==0.19.1
遇到ModuleNotFoundError: No module named 'scipy'
執(zhí)行pip install scipy

請(qǐng)求訪問(wèn)該model啟動(dòng)的服務(wù):

curl -X POST -H "Content-Type:application/json; format=pandas-split" --data '{"columns":["alcohol", "chlorides", "citric acid", "density", "fixed acidity", "free sulfur dioxide", "pH", "residual sugar", "sulphates", "total sulfur dioxide", "volatile acidity"],"data":[[12.8, 0.029, 0.48, 0.98, 6.2, 29, 3.33, 1.2, 0.39, 75, 0.66]]}' http://127.0.0.1:1234/invocations

輸出 [5.455573233630147] 則表明該模型服務(wù)成功部署

至此主要簡(jiǎn)單的mlflow使用就完成了镜盯,如果還有mlflow不支持的算法,可以參照自定義model

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末猖败,一起剝皮案震驚了整個(gè)濱河市速缆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌恩闻,老刑警劉巖艺糜,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異判呕,居然都是意外死亡倦踢,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén)侠草,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)辱挥,“玉大人,你說(shuō)我怎么就攤上這事边涕∥畹猓” “怎么了褂微?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)园爷。 經(jīng)常有香客問(wèn)我宠蚂,道長(zhǎng),這世上最難降的妖魔是什么童社? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任求厕,我火速辦了婚禮,結(jié)果婚禮上扰楼,老公的妹妹穿的比我還像新娘呀癣。我一直安慰自己,他們只是感情好弦赖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布项栏。 她就那樣靜靜地躺著,像睡著了一般蹬竖。 火紅的嫁衣襯著肌膚如雪沼沈。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,784評(píng)論 1 290
  • 那天币厕,我揣著相機(jī)與錄音列另,去河邊找鬼。 笑死劈榨,一個(gè)胖子當(dāng)著我的面吹牛访递,可吹牛的內(nèi)容都是我干的晦嵌。 我是一名探鬼主播同辣,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼惭载!你這毒婦竟也來(lái)了旱函?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤描滔,失蹤者是張志新(化名)和其女友劉穎棒妨,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體含长,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡券腔,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拘泞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纷纫。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖陪腌,靈堂內(nèi)的尸體忽然破棺而出辱魁,到底是詐尸還是另有隱情烟瞧,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布染簇,位于F島的核電站参滴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏锻弓。R本人自食惡果不足惜砾赔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望青灼。 院中可真熱鬧过蹂,春花似錦、人聲如沸聚至。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)扳躬。三九已至脆诉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間贷币,已是汗流浹背击胜。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留役纹,地道東北人偶摔。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像促脉,于是被迫代替她去往敵國(guó)和親辰斋。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348