Kubernetes
Kubernetes是一個(gè)用于容器編排的開(kāi)源工具。它在管理容器工作負(fù)載和實(shí)現(xiàn)集群及其部署的自動(dòng)化方面有很大幫助续徽。你可以在這里找到更多關(guān)于它的信息翻翩。
本文檔將解釋基本的Kubernetes概念以及在Azure AKS上設(shè)置自己的SKIL集群所需的步驟实牡。AKS是一個(gè)由Azure提供的云服務(wù)贱傀,它允許你在后端使用kubernetes創(chuàng)建、管理和部署集群胎撤。
概念
以下是有Kubernetes的一些重要的基本概念晓殊。
Pods
Pods是Kubernetes最小的可部署單元。在kubernetes中伤提,一組一個(gè)或多個(gè)容器稱(chēng)為pod巫俺。pod中的容器一起部署,并作為一個(gè)組啟動(dòng)肿男、停止和復(fù)制介汹。pod容器可以支持不同的容器運(yùn)行時(shí),例如docker舶沛,每個(gè)容器創(chuàng)建后都是用共享存儲(chǔ)/網(wǎng)絡(luò)嘹承,并帶有如何運(yùn)行容器的規(guī)范。
部署
在Kubernetes中冠王,部署是管理應(yīng)用程序伸縮性的一種方法。部署對(duì)象定義POD創(chuàng)建模板和所需的副本計(jì)數(shù)舌镶。部署使用“標(biāo)簽選擇器(label selector)”來(lái)標(biāo)識(shí)它管理的pods柱彻,并將根據(jù)需要?jiǎng)?chuàng)建或刪除pods以滿(mǎn)足副本計(jì)數(shù)豪娜。部署還用于管理安全地展開(kāi)對(duì)下在運(yùn)行的pods的更改。
服務(wù)
服務(wù)提供了一種引用具有單個(gè)靜態(tài)IP地址的一組pods的方法哟楷。它還使用“標(biāo)簽選擇器(label selectors)”來(lái)標(biāo)識(shí)它需要服務(wù)的資源瘤载。它還可以提供負(fù)載均衡,并允許為應(yīng)用程序提供外部服務(wù)卖擅。
安裝工具
你需要在你的環(huán)境中安裝docker鸣奔、azure-cli和kubectl以進(jìn)行后續(xù)操作。對(duì)于CentOS惩阶,可以按以下方式安裝:
# 安裝 docker
sudo yum install -y docker && sudo yum install docker && sudo systemctl start docker && sudo systemctl status docker && sudo systemctl enable docker
# 安裝 azure-cli
sudo rpm --import https://packages.microsoft.com/keys/microsoft.asc
sudo sh -c 'echo -e "[azure-cli]\nname=Azure CLI\nbaseurl=https://packages.microsoft.com/yumrepos/azure-cli\nenabled=1\ngpgcheck=1\ngpgkey=https://packages.microsoft.com/keys/microsoft.asc" > /etc/yum.repos.d/azure-cli.repo'
sudo yum install -y azure-cli
# 安裝 kubectl
sudo az aks install-cli
對(duì)于其他操作系統(tǒng)中的安裝挎狸,可以訪(fǎng)問(wèn)以下鏈接:
這里,對(duì)于kubectl断楷,安裝命令一般是:az aks install-cli
需要Docker鏡像
集群設(shè)置需要以下Docker鏡像:
- https://hub.docker.com/_/zookeeper/
- https://hub.docker.com/_/mysql/ (版本 5.5.59)
- https://hub.docker.com/r/skymind/skil/
分布式skil鏡像不包括JDBC驅(qū)動(dòng)程序锨匆。這是與遠(yuǎn)程mysql容器實(shí)例通信所必需的。我們必須在skil ce docker鏡像中手動(dòng)安裝mysql jdbc驅(qū)動(dòng)程序冬筒。要將其安裝在已拉取的skil鏡像中恐锣,首先創(chuàng)建一個(gè)Dockerfile(nano Dockerfile),并將以下內(nèi)容放入其中舞痰。
FROM skymind/skil
USER root
RUN yum install -y mysql-connector-java && ln -s /usr/share/java/mysql-connector-java.jar /opt/skil/lib/mysql-connector-java.jar
# PLD
EXPOSE 9008
# File Server
EXPOSE 9508
# Zeppelin
EXPOSE 8080
# DL4J UI first port
EXPOSE 9002
# ModelHistoryServer port
EXPOSE 9100
CMD ["/start-skil.sh"]
保存文件并運(yùn)行以下命令以為你的Kubernetes設(shè)置拉取和構(gòu)建所需的SKIL docker鏡像
sudo docker pull zookeeper
sudo docker pull mysql:5.5.59
sudo docker build -t skymind/skil:jdbc .
架構(gòu)
你可以使用的基本架構(gòu)是將zookeeper和mysql容器實(shí)例保存在單個(gè)pod中土榴,并將復(fù)制的skil實(shí)例保存在部署中。一個(gè)服務(wù)將向skil部署公開(kāi)pod容器响牛,另一個(gè)服務(wù)將負(fù)載均衡并公開(kāi)skil部署pod實(shí)例玷禽。它看起來(lái)像這樣:
SKIL集群的kubernetes布局架構(gòu)
Kubernetes配置
這里定義的配置與上面描述的架構(gòu)相對(duì)應(yīng)。
創(chuàng)建Zookeeper與MySQL Pod
這個(gè)pod將有兩個(gè)容器用于ZooKeeper和MySQL娃善。它被標(biāo)記為app:zksql论衍,用于能夠被公開(kāi)服務(wù)選擇。將有三卷用于保存ZooKeeper(zk-data
和 zk-datalog
)和mysql(mysql-data
)數(shù)據(jù)聚磺。其他配置部分包括設(shè)置環(huán)境變量坯台、主機(jī)設(shè)置和端口公開(kāi)。配置在下面的代碼段中定義:
Shell
apiVersion: v1
kind: Pod
metadata:
name: zookeeper-mysql
labels:
app: zksql
spec:
hostname: zksql
subdomain: zksqlsrv
containers:
- name: zookeeper
image: <loginServerName>/zookeeper # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: zkmain
containerPort: 2181
protocol: TCP
volumeMounts:
- mountPath: /data
name: zk-data
- mountPath: /datalog
name: zk-datalog
- name: mysql
image: <loginServerName>/mysql # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: sqlmain
containerPort: 3306
protocol: TCP
volumeMounts:
- mountPath: /var/lib/mysql
name: mysql-data
env:
- name: MYSQL_ALLOW_EMPTY_PASSWORD
value: "true"
- name: MYSQL_DATABASE
value: "skil_migrations"
volumes:
- name: zk-data
emptyDir: {}
- name: zk-datalog
emptyDir: {}
- name: mysql-data
emptyDir: {}
創(chuàng)建Skil部署
此部署設(shè)置包括用于SKIL容器的“2”個(gè)pod單元大小的復(fù)本瘫寝。它們按標(biāo)簽分組:app:skil蜒蕾。然后,服務(wù)(負(fù)載均衡器)可以選擇此標(biāo)簽公開(kāi)它焕阿,并對(duì)傳入的請(qǐng)求進(jìn)行負(fù)載均衡咪啡。此外,zookeeper和mysql pod中定義的主機(jī)設(shè)置可以轉(zhuǎn)換為DNS暮屡,即:zksql.zksqlsrv.default.svc.cluster.local
撤摸。查看下面的代碼片段,了解如何在環(huán)境變量(skil_db_url和zookeeper_host)中使用它。
YAML
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: skil
spec:
replicas: 2
template:
metadata:
labels:
app: skil
spec:
containers:
- name: skil
image: <loginServerName>/skymind/skil # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: skilmain
containerPort: 9008
protocol: TCP
- name: skilzep
containerPort: 8080
protocol: TCP
env:
- name: SKIL_USE_EMBEDDED_DB
value: "false"
- name: SKIL_DB_NAME
value: "skil_migrations"
- name: SKIL_DB_DRIVER
value: "com.mysql.jdbc.Driver"
- name: SKIL_DB_URL
value: "jdbc:mysql://zksql.zksqlsrv.default.svc.cluster.local:3306/skil_migrations"
- name: SKIL_DB_USER
value: "root"
- name: MODEL_HISTORY_SERVER_LAUNCH_DEFAULT
value: "false"
- name: ZEPPELIN_LAUNCH_DEFAULT
value: "false"
- name: ZOOKEEPER_HOST
value: "zksql.zksqlsrv.default.svc.cluster.local"
- name: ZOOKEEPER_PORT
value: "2181"
- name: ZOOKEEPER_EMBEDDED
value: "false"
創(chuàng)建服務(wù)
下面定義的兩個(gè)服務(wù)使用app:zksql選擇器將zookeeper和mysql內(nèi)部公開(kāi)到SKIL部署准夷,使用app:skil將SKIL部署外部公開(kāi)钥飞。
YAML
apiVersion: v1
kind: Service
metadata:
name: zksqlsrv
spec:
ports:
- port: 2181
targetPort: 2181
protocol: TCP
name: zkmain
- port: 3306
targetPort: 3306
protocol: TCP
name: sqlmain
selector:
app: zksql
clusterIP: None
---
apiVersion: v1
kind: Service
metadata:
name: skil
spec:
type: LoadBalancer
ports:
- port: 9008
targetPort: 9008
protocol: TCP
name: skilmain
- port: 8080
targetPort: 8080
protocol: TCP
name: skilzep
selector:
app: skil
匯總配置文件
下面匯總了上面創(chuàng)建的所有kubernetes組件。創(chuàng)建名為skil-app.yaml(nano skil-app.yaml)的文件衫嵌,并將以下內(nèi)容放入其中读宙。
YAML
apiVersion: v1
kind: Pod
metadata:
name: zookeeper-mysql
labels:
app: zksql
spec:
hostname: zksql
subdomain: zksqlsrv
containers:
- name: zookeeper
image: <loginServerName>/zookeeper # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: zkmain
containerPort: 2181
protocol: TCP
volumeMounts:
- mountPath: /data
name: zk-data
- mountPath: /datalog
name: zk-datalog
- name: mysql
image: <loginServerName>/mysql # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: sqlmain
containerPort: 3306
protocol: TCP
volumeMounts:
- mountPath: /var/lib/mysql
name: mysql-data
env:
- name: MYSQL_ALLOW_EMPTY_PASSWORD
value: "true"
- name: MYSQL_DATABASE
value: "skil_migrations"
volumes:
- name: zk-data
emptyDir: {}
- name: zk-datalog
emptyDir: {}
- name: mysql-data
emptyDir: {}
---
apiVersion: v1
kind: Service
metadata:
name: zksqlsrv
spec:
ports:
- port: 2181
targetPort: 2181
protocol: TCP
name: zkmain
- port: 3306
targetPort: 3306
protocol: TCP
name: sqlmain
selector:
app: zksql
clusterIP: None
---
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: skil
spec:
replicas: 2
template:
metadata:
labels:
app: skil
spec:
containers:
- name: skil
image: <loginServerName>/skymind/skil # You'll find the loginServerName at the end of this document as you follow along
ports:
- name: skilmain
containerPort: 9008
protocol: TCP
- name: skilzep
containerPort: 8080
protocol: TCP
env:
- name: SKIL_USE_EMBEDDED_DB
value: "false"
- name: SKIL_DB_NAME
value: "skil_migrations"
- name: SKIL_DB_DRIVER
value: "com.mysql.jdbc.Driver"
- name: SKIL_DB_URL
value: "jdbc:mysql://zksql.zksqlsrv.default.svc.cluster.local:3306/skil_migrations"
- name: SKIL_DB_USER
value: "root"
- name: MODEL_HISTORY_SERVER_LAUNCH_DEFAULT
value: "false"
- name: ZEPPELIN_LAUNCH_DEFAULT
value: "false"
- name: ZOOKEEPER_HOST
value: "zksql.zksqlsrv.default.svc.cluster.local"
- name: ZOOKEEPER_PORT
value: "2181"
- name: ZOOKEEPER_EMBEDDED
value: "false"
---
apiVersion: v1
kind: Service
metadata:
name: skil
spec:
type: LoadBalancer
ports:
- port: 9008
targetPort: 9008
protocol: TCP
name: skilmain
- port: 8080
targetPort: 8080
protocol: TCP
name: skilzep
selector:
app: skil
這些是在使用kubernetes集群之前準(zhǔn)備容器鏡像所需的一些初始步驟。這些鏡像需要存在于在線(xiàn)注冊(cè)表中楔绞,以便在上面為每個(gè)容器模板定義的規(guī)范中的鏡像選擇器中解析结闸。
在ACR中創(chuàng)建和注冊(cè)鏡像
ACR是“Azure容器注冊(cè)表”,用于在Azure上上載和注冊(cè)容器鏡像酒朵,稍后可與AKS一起使用桦锄。為此,首先使用az登錄名登錄到Azure耻讽,如下所示:
Shell
sudo az login
按照命令行輸出上顯示的步驟完成登錄過(guò)程察纯。 登錄后,確保所需的
Azure service providers與 az provider register
已啟用 针肥。
Shell
az provider register -n Microsoft.Network
az provider register -n Microsoft.Storage
az provider register -n Microsoft.Compute
az provider register -n Microsoft.ContainerService
你需要一個(gè)資源組來(lái)包含你的ACR饼记。創(chuàng)建一個(gè)資源組,然后創(chuàng)建一個(gè)ACR慰枕,然后登錄到它具则。
Shell
export RESOURCE_GROUP_NAME=<resource_group_name> # 將此替換為唯一的資源組名稱(chēng)
export ACR_NAME=<acr_name> # 將其替換為唯一的ACR名稱(chēng)
az group create --name $RESOURCE_GROUP_NAME --location eastus
az acr create --resource-group $RESOURCE_GROUP_NAME --name $ACR_NAME --sku Basic
sudo az acr login --name $ACR_NAME
每個(gè)容器鏡像都需要用注冊(cè)表的“l(fā)oginServer”名稱(chēng)進(jìn)行標(biāo)記。當(dāng)將容器鏡像推送到鏡像注冊(cè)表時(shí)具帮,此標(biāo)記用于路由博肋。你可以使用以下命令獲取登錄服務(wù)器名稱(chēng):
Shell
export ACR_LOGIN_SERVER="$(az acr list --resource-group $RESOURCE_GROUP_NAME --query "[].{acrLoginServer:loginServer}" --output table | tail -n1)"
echo $ACR_LOGIN_SERVER # 打印loginServer名稱(chēng)
運(yùn)行上述命令時(shí),請(qǐng)確保將skil-app.yaml
文件中的loginServerName
替換為控制臺(tái)中打印的登錄服務(wù)器名稱(chēng)蜂厅。要標(biāo)記和推送Docker鏡像匪凡,請(qǐng)運(yùn)行以下命令
Shell
sudo docker tag zookeeper ${ACR_LOGIN_SERVER}/zookeeper
sudo docker tag mysql:5.5.59 ${ACR_LOGIN_SERVER}/mysql
sudo docker tag skymind/skil:jdbc ${ACR_LOGIN_SERVER}/skymind/skil
sudo docker push ${ACR_LOGIN_SERVER}/zookeeper
sudo docker push ${ACR_LOGIN_SERVER}/mysql
sudo docker push ${ACR_LOGIN_SERVER}/skymind/skil
az acr repository list --name $ACR_NAME --output table # Outputs the list of images present in the registry
創(chuàng)建K8集群
你可以通過(guò)如下方式提供集群名稱(chēng)、節(jié)點(diǎn)數(shù)量掘猿、VM大小和OS磁盤(pán)大小來(lái)創(chuàng)建集群:
Shell
export K8_CLUSTER_NAME=<your_cluster_name> # Replace this with the cluster name
export NODE_VM_SIZE=<your_vm_size> # Replace this with the cluster size. Standard_D4_v2 is preferable
export NODE_OSDISK_SIZE=100 # Size in GB for a single cluster VM node.
export NODE_COUNT=1 # Number of nodes in the cluster
az aks create --resource-group $RESOURCE_GROUP_NAME --name $K8_CLUSTER_NAME --node-count $NODE_COUNT --node-osdisk-size $NODE_OSDISK_SIZE --node-vm-size $NODE_VM_SIZE --generate-ssh-keys
配置ACR身份驗(yàn)證
需要在AKS集群和ACR注冊(cè)表之間配置身份驗(yàn)證病游。這涉及授予AKS標(biāo)識(shí)從ACR注冊(cè)表中拉取鏡像的適當(dāng)權(quán)限。運(yùn)行以下命令以完成該任務(wù)稠通。
Shell
export CLIENT_ID=$(az aks show --resource-group $RESOURCE_GROUP_NAME --name $K8_CLUSTER_NAME --query "servicePrincipalProfile.clientId" --output tsv)
export ACR_ID=$(az acr show --name $ACR_NAME --resource-group $RESOURCE_GROUP_NAME --query "id" --output tsv)
az role assignment create --assignee $CLIENT_ID --role Reader --scope $ACR_ID
現(xiàn)在衬衬,你可以使用創(chuàng)建的kubernetes集群配置已安裝的kubectl工具。
Shell
az aks get-credentials --resource-group $RESOURCE_GROUP_NAME --name $K8_CLUSTER_NAME
使用kubectl查詢(xún)集群改橘,并使用先前創(chuàng)建的保存的skil-app.yaml文件創(chuàng)建skil集群部署滋尉。
Shell
kubectl get nodes # 獲取群集中的節(jié)點(diǎn)詳細(xì)信息
kubectl create -f skil-app.yaml #使用提供的配置創(chuàng)建集群
kubectl get service skil --watch # 監(jiān)控服務(wù)可用性的看門(mén)狗
監(jiān)視過(guò)程中的外部-IP將在開(kāi)始時(shí)掛起,一旦外部-IP地址從掛起更改為有效的IP地址飞主,你可以停止Kubectl監(jiān)控進(jìn)程狮惜。訪(fǎng)問(wèn)url“http://external-ip:9008”高诺,查看已部署的SKIL應(yīng)用程序。
擴(kuò)展應(yīng)用程序
您可以分別使用az aks scale和kubectl scale增加集群大小和擴(kuò)展部署碾篡。
Shell
az aks scale --resource-group $RESOURCE_GROUP_NAME --name $K8_CLUSTER_NAME --node-count 2
kubectl scale --replicas=3 deployment/skil