實(shí)踐-數(shù)據(jù)分析及可視化(1)-環(huán)境配置
一只小胖子
[互聯(lián)網(wǎng)運(yùn)營 | 直播電商 | 廣告行業(yè)] 從業(yè)者
如果你不想配置Jupyter環(huán)境來學(xué)習(xí),也是可以的,你可以直接使用如下在線平臺(tái), 它們是已經(jīng)配置好了的JupyterLab環(huán)境,直接打開瀏覽器訪問即可.
如下鏈接為: Google Colab、Observable在線平臺(tái),你可跳過本文后續(xù)的內(nèi)容,直接使用即可.
歡迎使用 Colaboratory - Colaboratory (google.com)
Observable - Make sense of the world with data, together / Observable (observablehq.com)
>>>>>--------本文正文從此開始-------
在數(shù)據(jù)分析領(lǐng)域,我們習(xí)慣選用R語言,Python語言來實(shí)現(xiàn)數(shù)據(jù)的處理/分析及整個(gè)可視化工作.因?yàn)橄鄬?duì)其它程序語言而言,它們擁有豐富封裝好的類庫可以直接調(diào)用,而且語言學(xué)習(xí),入門使用相對(duì)簡單,和其它編程語言相比,實(shí)現(xiàn)同樣功能語法相對(duì)簡潔,代碼量更少.
同時(shí)在各大院樣教學(xué)場(chǎng)景以及科研機(jī)構(gòu)普遍都采用這兩種語言作為數(shù)據(jù)分析及理論研究的情況下,在數(shù)據(jù)處理領(lǐng)域,它們已經(jīng)擁有被大眾普遍認(rèn)知和可接受的基礎(chǔ).因此后續(xù)我們系列的文章,都是選擇使用Python,R兩種語言作為基礎(chǔ),并使用VS Code / Jupyter Lab 等集成平臺(tái)進(jìn)行學(xué)習(xí).
一. 環(huán)境配置
搭建Python語言的環(huán)境,有很多種形式. 你可以自己安裝PyCharm社區(qū)版,Python的獨(dú)立應(yīng)用安裝包即可進(jìn)行基礎(chǔ)開發(fā), 然后在不同業(yè)務(wù)場(chǎng)景中,按需要安裝使用到的pip包即可. 現(xiàn)在市面上也有一系列全部集成好的環(huán)境,減少了使用者配置軟件環(huán)境的工作量,即安裝開箱即用,不需額外安裝Python及各業(yè)務(wù)場(chǎng)景下的pip包了.
常見集成安裝方案,有如下列舉的幾種. 經(jīng)作者的一些對(duì)比,最終我們采用的是第三種方式安裝.
方案一:
一是使用Anaconda集成包安裝,它會(huì)自動(dòng)安裝你需要的包括如Python軟件,PyCharm,Spyder等IDE基礎(chǔ)環(huán)境,pandas/numpy/matplotlib等幾百個(gè)常用到的庫,這種方式比較簡單,相當(dāng)于一次把所有內(nèi)容安裝好,以后開箱即用.但問題就是安裝包太大,可能會(huì)安裝上很多你用不上的東西,而且由于Anaconda公司可能的收費(fèi)策略,如果你比較再意這些,就不太建議大家使用這種方式了.
一只小胖子:JupyterLab 快速環(huán)境配置 (一)0 贊同 · 0 評(píng)論文章
方案二:
二是使用以上Anaconda集成包安裝方式的優(yōu)化方案,使用了基于Anaconda的MiniConda方案來安裝,MiniConda只包括了Python 程序,Conda包管理器,以及少量必用的pip包,它算是一個(gè)免費(fèi)而且迷你版的Anaconda 環(huán)境,因此可以較好的避免方案一的一些弊端.
一只小胖子:MiniConda 快速環(huán)境配置 (二)0 贊同 · 0 評(píng)論文章
方案三:
三是除了以上的兩種方式,還有一種安裝方式是使用開源的Miniforge,相對(duì)于MiniConda,它的優(yōu)點(diǎn)是可以支持蘋果的M1芯片系統(tǒng),而且本身有多個(gè)分支,在CPython的分支外,開發(fā)了基于Python分支的PyPy來提升性能,同時(shí)提供了和Conda一樣功能的Mamba來替代Conda.
即在對(duì)性能提升基礎(chǔ)上,支持更多CPU架構(gòu),同時(shí)避免開了Anaconda及Conda方案的部分風(fēng)險(xiǎn).
開始安裝程序
因此,此文中我們使用Miniforge來搭建數(shù)據(jù)分析環(huán)境基礎(chǔ).相關(guān)的安裝你可以參考如下鏈接:
風(fēng)影忍著:Anaconda商用要收費(fèi)了怎么辦谦炒?沒關(guān)系,我們有miniforge28 贊同 · 3 評(píng)論文章
解決安裝錯(cuò)誤
使用上面的鏈接安裝Miniforge下的notebook時(shí),我在中途遇到了一些錯(cuò)誤,具體如下:
執(zhí)行命令 mamba install -c conda-forge notebook時(shí)報(bào)錯(cuò)如下:
ERROR Could not write out repodata file /Users/Likey/ProgramFiles/mambaforge/pkgs/cache/fb3d5425.json: No such file or directory
經(jīng)多次嘗試: rm -rf /Users/Likey/ProgramFiles/mambaforge/pkgs/cache/ *
刪除緩存文件,再次安裝即可,再次安裝時(shí)最好開啟外網(wǎng)或者配置國內(nèi)源環(huán)境避免其它問題.
除了可以安裝notebook來使用Jupyter Notebook, 還可以用:
mamba install -c conda-forge jupyterlab
安裝 Jupyter Lab,并在終端使用jupyter lab或jupyter-lab來運(yùn)行.
更換鏡像源
確實(shí)現(xiàn)在miniforge我們已安裝成功,并能正常使用,但對(duì)于國內(nèi)用戶來講茄茁,下載速度實(shí)在是太慢了蝗岖,我們需更改其默認(rèn)鏡像源,比如我將其改為清華鏡像源進(jìn)行下載秫筏,那下載速度簡直不要太快
首先打開終端诱鞠,輸入以下命令
conda?config?--add?channels?Index?of?/anaconda/cloud/msys2/ conda?config?--add?channels?Error conda?config?--add?channels?Index?of?/anaconda/pkgs/free/ conda?config?--set?show_channel_urls?yes
確認(rèn)回車運(yùn)行沒問題后,打開訪達(dá)跳昼,搜索condarc般甲,打開此文件
找到- dafaults此行,刪除此行后退出鹅颊,此時(shí)已完成更改鏡像源敷存,再進(jìn)行庫的安裝后會(huì)發(fā)現(xiàn)下載速度非常快.
參考鏈接:
M1芯片Mac上Anaconda的暫時(shí)替代:miniforge_yc11tentgy的博客-CSDN博客_miniforge
二. 集成平臺(tái)
微軟團(tuán)隊(duì)宣布已發(fā)布2020年11月版的Visual Studio Code Python 集成環(huán)境堪伍,并在此版本中引入了單獨(dú)的Jupyter插件锚烦。
關(guān)于Jupyter Notebook | Jupyter Lab
Jupyter Notebook | Jupyter Lab是基于網(wǎng)頁的用于交互計(jì)算的應(yīng)用程序。其可被應(yīng)用于全過程計(jì)算:開發(fā)帝雇、文檔編寫涮俄、運(yùn)行代碼和展示結(jié)果。
簡而言之尸闸,Jupyter Notebook | Jupyter Lab 是以網(wǎng)頁的形式打開彻亲,可以在網(wǎng)頁頁面中直接編寫代碼和運(yùn)行代碼,代碼的運(yùn)行結(jié)果也會(huì)直接在代碼塊下顯示吮廉。如在編程過程中需要編寫說明文檔苞尝,可在同一個(gè)頁面中直接編寫,便于作及時(shí)的說明和解釋宦芦,它是一個(gè)高效的數(shù)據(jù)科學(xué)工具宙址。
VS Code 中 Jupyter插件介紹
除用以上終端的?jupyter notebook 或 jupyter lab?命令運(yùn)行網(wǎng)頁版Jupyter外. 在微軟VS Code 中安裝微軟官方的Python插件,新建一個(gè)*.ipynb文件,也是可以直接操作jupyter的功能的,VS Code自己開了一個(gè)服務(wù)器,所以我們不用運(yùn)行jupyter notebook等命令也可以直接在VS Code 的IDE中完成交互.
VS Code的Python集成環(huán)境提供對(duì) Jupyter Notebook 的原生支持已超過一年,并且越來越受歡迎调卑。Jupyter Notebook還可以與Python以外的其他編程語言一起使用抡砂,例如R、Julia和Scala恬涧。為了給其他語言也提供相同豐富的Jupyter Notebook體驗(yàn)注益,微軟團(tuán)隊(duì)已經(jīng)將基于Python集成環(huán)境的Jupyter原生支持重構(gòu)為最近發(fā)布的Jupyter插件。使用Jupyter插件溯捆,可以讓它本身不依賴于Pytho開發(fā)環(huán)境或Python插件聊浅,從而為Python以外的語言構(gòu)建新的Jupyter體驗(yàn)。不過Python的Jupyter原生支持的使用體驗(yàn)不會(huì)改變现使。
Jupyter插件為現(xiàn)在Jupyter Notebooks支持的編程語言內(nèi)核提供了基本的Notebook支持,許多編程語言內(nèi)核無需修改即可使用旷痕。
參考鏈接:?微軟 VS Code 重大更新碳锈!Jupyter 插件不再是 Python 專屬 - 知乎 (zhihu.com)
至此,本文結(jié)束....