Jupyter Notebook是用于科學(xué)數(shù)據(jù)分析的利器膀曾,JupyterHub可以在服務(wù)器環(huán)境下為多個(gè)用戶托管Jupyter運(yùn)行環(huán)境县爬。本文將詳細(xì)介紹如何使用Rancher安裝JupyterHub來為數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)開發(fā)創(chuàng)建可擴(kuò)展的工作區(qū)。
本文來自 Rancher Labs
人工智能(AI)和機(jī)器學(xué)習(xí)(ML)正在成為技術(shù)領(lǐng)域的關(guān)鍵差異化因素添谊。從本質(zhì)上講财喳,人工智能和機(jī)器學(xué)習(xí)都是計(jì)算量巨大的工作負(fù)載桑寨,它們需要一流的分布式計(jì)算環(huán)境才能夠蓬勃發(fā)展允扇。因此,AI和ML為Kubernetes提供了一個(gè)完美的用例仰禽,他們能夠最大化展現(xiàn)Kubernetes可以運(yùn)行大量工作負(fù)載的特點(diǎn)喊废。
什么是JupyterHub祝高?
Jupyter Notebook是用于科學(xué)數(shù)據(jù)分析的利器,JupyterHub可以在服務(wù)器環(huán)境下為多個(gè)用戶托管Jupyter運(yùn)行環(huán)境污筷。JupyterHub是一個(gè)多用戶數(shù)據(jù)探索工具工闺,通常是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)研究與開發(fā)的關(guān)鍵工具。它為工程師瓣蛀、科學(xué)家陆蟆、研究人員和學(xué)生提供了云或數(shù)據(jù)中心的計(jì)算能力,同時(shí)仍然像本地開發(fā)環(huán)境一樣易于使用惋增。本質(zhì)上叠殷,JupyterHub使用戶可以訪問計(jì)算環(huán)境和資源,而不會給他們增加安裝和維護(hù)任務(wù)的負(fù)擔(dān)诈皿。用戶可以在工作區(qū)中使用共享資源林束,系統(tǒng)管理員會對其進(jìn)行有效管理像棘。
在AI/ML工作負(fù)載中使用Kubernetes
Kubernetes非常擅長讓我們利用大型分布式計(jì)算環(huán)境。因?yàn)槠渎暶魇皆O(shè)計(jì)和基于發(fā)現(xiàn)的服務(wù)器尋址方法壶冒,所以將計(jì)算資源應(yīng)用于工作負(fù)載很容易缕题。通常在AI/ML工作負(fù)載中,工程師或研究人員需要分配更多的資源胖腾。而Kubernetes讓在物理基礎(chǔ)架構(gòu)之間遷移工作負(fù)載更加可行烟零。在本文中,我們將展示如何使用Rancher安裝JupyterHub咸作。
使用Rancher安裝JupyterHub
首先锨阿,假設(shè)我們在Rancher環(huán)境中擁有現(xiàn)代化的Kubernetes部署。在本文發(fā)布時(shí)记罚,Kubernetes的穩(wěn)定版本是1.16墅诡。對于JupyterHub來說,其中一個(gè)前期準(zhǔn)備是持久化存儲毫胜,所以你將需要思考如何在這個(gè)集群中提供它书斜。出于演示的目的诬辈,我們可以使用Rancher Catalog中包含的實(shí)驗(yàn)性NFS提供程序來提供持久化存儲酵使。點(diǎn)開App Catalog并選擇【啟動】。然后搜索NFS提供程序焙糟。保留默認(rèn)設(shè)置口渔,然后單擊屏幕底部的【啟動】。如果你已經(jīng)有持久化存儲的解決方案穿撮,也可以直接使用它缺脉。
導(dǎo)航到Rancher App Catalog
搜索NFS提供程序
啟動NFS提供程序
現(xiàn)在我們已經(jīng)有了存儲提供程序并且定義了默認(rèn)存儲類,我們可以繼續(xù)部署應(yīng)用程序組件悦穿。我們將使用Helm3來完成這一操作攻礼。查看helm官方文檔(https://helm.sh/docs/intro/install/ ),在你的電腦上安裝helm3客戶端栗柒。另外礁扮,你也可以使用Rancher Catalog來部署helm chart,而無需任何其他工具瞬沦。需要確保將repo添加到Rancher catalog中太伊。
在我們使用helm之前,我們需要為應(yīng)用程序創(chuàng)建一個(gè)命名空間逛钻。在Rancher UI中僚焦,進(jìn)入集群并選擇頂端菜單欄的【項(xiàng)目/命名空間】。你可以為JupyterHub創(chuàng)建一個(gè)新的命名空間曙痘。例如芳悲,我們將命名空間稱為“jhub“立肘。請注意此名稱,因?yàn)槲覀儗⒅髸褂谩?/p>
創(chuàng)建一個(gè)命名空間
接下來名扛,我們可以為將要使用的JupyterHub Chart添加Helm repo赛不。如果使用的是Rancher catalog,你需要在UI上完成此操作而不是Helm CLI:
helm repo add jupyterhub https://jupyterhub.github.io/helm-chart/
helm repo update
然后罢洲,讓我們創(chuàng)建一個(gè)config文件踢故,其中包含了我們要與此chart一起使用的設(shè)置。我們將該文件命名為config.yaml:
proxy:
secretToken: "<secret token>"
ingress:
enabled: true
hosts:
- <host name>
讓我們替換幾個(gè)項(xiàng)目惹苗,使它們是唯一的殿较。用以下輸出替換secretToken:
openssl rand -hex 32
并替換為你打算用來訪問JyupiterHub UI的可解析DNS名稱。
有了配置文件之后桩蓉,就可以安裝chart了淋纲。我們將引用該配置文件,因此請確保該文件存在你當(dāng)前的工作目錄中:
RELEASE=jhub
NAMESPACE=jhub
helm upgrade --install $RELEASE jupyterhub/jupyterhub --namespace $NAMESPACE --version=0.8.2 --values config.yaml
Helm現(xiàn)在應(yīng)該部署所需的組件院究。這將需要一些時(shí)間洽瞬,但是最終你應(yīng)該能夠通過之前設(shè)置的主機(jī)名訪問UI。你也可以通過轉(zhuǎn)到Rancher UI中的“工作負(fù)載“選項(xiàng)卡來檢查狀態(tài)业汰。當(dāng)我們嘗試在瀏覽器中設(shè)置的主機(jī)名時(shí)伙窃,它將顯示以下登錄界面:
主機(jī)名登錄界面
在撰寫本文時(shí),有一個(gè)issue是Kubernetes 1.16中的更改導(dǎo)致Jyupiter Hub的代碼在嘗試與Kuberentes API交互時(shí)中斷样漆。如果要立即修復(fù)为障,我們可以運(yùn)行以下patch命令:
kubectl patch deploy -n $NAMESPACE hub --type json --patch '[{"op": "replace", "path": "/spec/template/spec/containers/0/command", "value": ["bash", "-c", "\nmkdir -p ~/hotfix\ncp -r /usr/local/lib/python3.6/dist-packages/kubespawner ~/hotfix\nls -R ~/hotfix\npatch ~/hotfix/kubespawner/spawner.py << EOT\n72c72\n< key=lambda x: x.last_timestamp,\n---\n> key=lambda x: x.last_timestamp and x.last_timestamp.timestamp() or 0.,\nEOT\n\nPYTHONPATH=$HOME/hotfix jupyterhub --config /srv/jupyterhub_config.py --upgrade-db\n"]}]'
你現(xiàn)在已經(jīng)在Rancher上部署了可以正常工作的JupyterHub環(huán)境。默認(rèn)情況下放祟,JupyterHub使用PAM身份驗(yàn)證鳍怨。因此,可以使用系統(tǒng)上的任何有效Linux用戶登錄跪妥。登錄后鞋喇,我們應(yīng)該能夠創(chuàng)建新的notebook:
Jupyter登錄界面
創(chuàng)建新的notebook
另外,你可以查看其他你可能想配置的身份驗(yàn)證選項(xiàng)眉撵。例如侦香,你可以使用Github身份驗(yàn)證來允許用戶登錄并且創(chuàng)建基于他們Github ID的notebook。你選擇好一個(gè)身份驗(yàn)證的工具之后执桌,需要按照說明更新我們之前創(chuàng)建的config.yml文件鄙皇,然后重新運(yùn)行helm upgrade
命令。
總 結(jié)
在本文中仰挣,我們展示了如何使用Rancher安裝JupyterHub來為數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)開發(fā)創(chuàng)建可擴(kuò)展的工作區(qū)伴逸。如果你想要安裝功能齊全的JupyterHub安裝,你可能還需要考慮其他因素膘壶。本文只是向你展示了如何快速搭建一個(gè)基礎(chǔ)功能的JupyterHub错蝴,希望能幫助你快速開啟AI旅程洲愤!