實(shí)踐-數(shù)據(jù)分析及可視化(1)-環(huán)境配置


實(shí)踐-數(shù)據(jù)分析及可視化(1)-環(huán)境配置


一只小胖子

[互聯(lián)網(wǎng)運(yùn)營 | 直播電商 | 廣告行業(yè)] 從業(yè)者


如果你不想配置Jupyter環(huán)境來學(xué)習(xí),也是可以的,你可以直接使用如下在線平臺(tái), 它們是已經(jīng)配置好了的JupyterLab環(huán)境,直接打開瀏覽器訪問即可.

如下鏈接為: Google Colab、Observable在線平臺(tái),你可跳過本文后續(xù)的內(nèi)容,直接使用即可.
歡迎使用 Colaboratory - Colaboratory (google.com)
Observable - Make sense of the world with data, together / Observable (observablehq.com)

>>>>>--------本文正文從此開始-------

在數(shù)據(jù)分析領(lǐng)域,我們習(xí)慣選用R語言,Python語言來實(shí)現(xiàn)數(shù)據(jù)的處理/分析及整個(gè)可視化工作.因?yàn)橄鄬?duì)其它程序語言而言,它們擁有豐富封裝好的類庫可以直接調(diào)用,而且語言學(xué)習(xí),入門使用相對(duì)簡單,和其它編程語言相比,實(shí)現(xiàn)同樣功能語法相對(duì)簡潔,代碼量更少.

同時(shí)在各大院樣教學(xué)場(chǎng)景以及科研機(jī)構(gòu)普遍都采用這兩種語言作為數(shù)據(jù)分析及理論研究的情況下,在數(shù)據(jù)處理領(lǐng)域,它們已經(jīng)擁有被大眾普遍認(rèn)知和可接受的基礎(chǔ).因此后續(xù)我們系列的文章,都是選擇使用Python,R兩種語言作為基礎(chǔ),并使用VS Code / Jupyter Lab 等集成平臺(tái)進(jìn)行學(xué)習(xí).

一. 環(huán)境配置

搭建Python語言的環(huán)境,有很多種形式. 你可以自己安裝PyCharm社區(qū)版,Python的獨(dú)立應(yīng)用安裝包即可進(jìn)行基礎(chǔ)開發(fā), 然后在不同業(yè)務(wù)場(chǎng)景中,按需要安裝使用到的pip包即可. 現(xiàn)在市面上也有一系列全部集成好的環(huán)境,減少了使用者配置軟件環(huán)境的工作量,即安裝開箱即用,不需額外安裝Python及各業(yè)務(wù)場(chǎng)景下的pip包了.

常見集成安裝方案,有如下列舉的幾種. 經(jīng)作者的一些對(duì)比,最終我們采用的是第三種方式安裝.

方案一:

一是使用Anaconda集成包安裝,它會(huì)自動(dòng)安裝你需要的包括如Python軟件,PyCharm,Spyder等IDE基礎(chǔ)環(huán)境,pandas/numpy/matplotlib等幾百個(gè)常用到的庫,這種方式比較簡單,相當(dāng)于一次把所有內(nèi)容安裝好,以后開箱即用.但問題就是安裝包太大,可能會(huì)安裝上很多你用不上的東西,而且由于Anaconda公司可能的收費(fèi)策略,如果你比較再意這些,就不太建議大家使用這種方式了.

一只小胖子:JupyterLab 快速環(huán)境配置 (一)0 贊同 · 0 評(píng)論文章

方案二:

二是使用以上Anaconda集成包安裝方式的優(yōu)化方案,使用了基于Anaconda的MiniConda方案來安裝,MiniConda只包括了Python 程序,Conda包管理器,以及少量必用的pip包,它算是一個(gè)免費(fèi)而且迷你版的Anaconda 環(huán)境,因此可以較好的避免方案一的一些弊端.

一只小胖子:MiniConda 快速環(huán)境配置 (二)0 贊同 · 0 評(píng)論文章

方案三:

三是除了以上的兩種方式,還有一種安裝方式是使用開源的Miniforge,相對(duì)于MiniConda,它的優(yōu)點(diǎn)是可以支持蘋果的M1芯片系統(tǒng),而且本身有多個(gè)分支,在CPython的分支外,開發(fā)了基于Python分支的PyPy來提升性能,同時(shí)提供了和Conda一樣功能的Mamba來替代Conda.

即在對(duì)性能提升基礎(chǔ)上,支持更多CPU架構(gòu),同時(shí)避免開了Anaconda及Conda方案的部分風(fēng)險(xiǎn).

Miniforge官網(wǎng)簡要介紹


開始安裝程序

因此,此文中我們使用Miniforge來搭建數(shù)據(jù)分析環(huán)境基礎(chǔ).相關(guān)的安裝你可以參考如下鏈接:

風(fēng)影忍著:Anaconda商用要收費(fèi)了怎么辦谦炒?沒關(guān)系,我們有miniforge28 贊同 · 3 評(píng)論文章

解決安裝錯(cuò)誤

使用上面的鏈接安裝Miniforge下的notebook時(shí),我在中途遇到了一些錯(cuò)誤,具體如下:

執(zhí)行命令 mamba install -c conda-forge notebook時(shí)報(bào)錯(cuò)如下:

ERROR Could not write out repodata file /Users/Likey/ProgramFiles/mambaforge/pkgs/cache/fb3d5425.json: No such file or directory

經(jīng)多次嘗試: rm -rf /Users/Likey/ProgramFiles/mambaforge/pkgs/cache/ *

刪除緩存文件,再次安裝即可,再次安裝時(shí)最好開啟外網(wǎng)或者配置國內(nèi)源環(huán)境避免其它問題.

除了可以安裝notebook來使用Jupyter Notebook, 還可以用:

mamba install -c conda-forge jupyterlab

安裝 Jupyter Lab,并在終端使用jupyter lab或jupyter-lab來運(yùn)行.


更換鏡像源

確實(shí)現(xiàn)在miniforge我們已安裝成功,并能正常使用,但對(duì)于國內(nèi)用戶來講茄茁,下載速度實(shí)在是太慢了蝗岖,我們需更改其默認(rèn)鏡像源,比如我將其改為清華鏡像源進(jìn)行下載秫筏,那下載速度簡直不要太快

首先打開終端诱鞠,輸入以下命令

conda?config?--add?channels?Index?of?/anaconda/cloud/msys2/
conda?config?--add?channels?Error
conda?config?--add?channels?Index?of?/anaconda/pkgs/free/
conda?config?--set?show_channel_urls?yes

確認(rèn)回車運(yùn)行沒問題后,打開訪達(dá)跳昼,搜索condarc般甲,打開此文件

找到- dafaults此行,刪除此行后退出鹅颊,此時(shí)已完成更改鏡像源敷存,再進(jìn)行庫的安裝后會(huì)發(fā)現(xiàn)下載速度非常快.

參考鏈接:

M1芯片Mac上Anaconda的暫時(shí)替代:miniforge_yc11tentgy的博客-CSDN博客_miniforge


二. 集成平臺(tái)

微軟團(tuán)隊(duì)宣布已發(fā)布2020年11月版的Visual Studio Code Python 集成環(huán)境堪伍,并在此版本中引入了單獨(dú)的Jupyter插件锚烦。

關(guān)于Jupyter Notebook | Jupyter Lab

Jupyter Notebook | Jupyter Lab是基于網(wǎng)頁的用于交互計(jì)算的應(yīng)用程序。其可被應(yīng)用于全過程計(jì)算:開發(fā)帝雇、文檔編寫涮俄、運(yùn)行代碼和展示結(jié)果。

簡而言之尸闸,Jupyter Notebook | Jupyter Lab 是以網(wǎng)頁的形式打開彻亲,可以在網(wǎng)頁頁面中直接編寫代碼和運(yùn)行代碼,代碼的運(yùn)行結(jié)果也會(huì)直接在代碼塊下顯示吮廉。如在編程過程中需要編寫說明文檔苞尝,可在同一個(gè)頁面中直接編寫,便于作及時(shí)的說明和解釋宦芦,它是一個(gè)高效的數(shù)據(jù)科學(xué)工具宙址。

VS Code 中 Jupyter插件介紹

除用以上終端的?jupyter notebook 或 jupyter lab?命令運(yùn)行網(wǎng)頁版Jupyter外. 在微軟VS Code 中安裝微軟官方的Python插件,新建一個(gè)*.ipynb文件,也是可以直接操作jupyter的功能的,VS Code自己開了一個(gè)服務(wù)器,所以我們不用運(yùn)行jupyter notebook等命令也可以直接在VS Code 的IDE中完成交互.

VS Code的Python集成環(huán)境提供對(duì) Jupyter Notebook 的原生支持已超過一年,并且越來越受歡迎调卑。Jupyter Notebook還可以與Python以外的其他編程語言一起使用抡砂,例如R、Julia和Scala恬涧。為了給其他語言也提供相同豐富的Jupyter Notebook體驗(yàn)注益,微軟團(tuán)隊(duì)已經(jīng)將基于Python集成環(huán)境的Jupyter原生支持重構(gòu)為最近發(fā)布的Jupyter插件。使用Jupyter插件溯捆,可以讓它本身不依賴于Pytho開發(fā)環(huán)境或Python插件聊浅,從而為Python以外的語言構(gòu)建新的Jupyter體驗(yàn)。不過Python的Jupyter原生支持的使用體驗(yàn)不會(huì)改變现使。

Jupyter插件為現(xiàn)在Jupyter Notebooks支持的編程語言內(nèi)核提供了基本的Notebook支持,許多編程語言內(nèi)核無需修改即可使用旷痕。

參考鏈接:?微軟 VS Code 重大更新碳锈!Jupyter 插件不再是 Python 專屬 - 知乎 (zhihu.com)


至此,本文結(jié)束....


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市欺抗,隨后出現(xiàn)的幾起案子售碳,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贸人,死亡現(xiàn)場(chǎng)離奇詭異间景,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)艺智,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門倘要,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人十拣,你說我怎么就攤上這事封拧。” “怎么了夭问?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵泽西,是天一觀的道長。 經(jīng)常有香客問我缰趋,道長捧杉,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任秘血,我火速辦了婚禮味抖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘直撤。我一直安慰自己非竿,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布谋竖。 她就那樣靜靜地躺著红柱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蓖乘。 梳的紋絲不亂的頭發(fā)上锤悄,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音嘉抒,去河邊找鬼零聚。 笑死,一個(gè)胖子當(dāng)著我的面吹牛些侍,可吹牛的內(nèi)容都是我干的隶症。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼岗宣,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼蚂会!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起耗式,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤胁住,失蹤者是張志新(化名)和其女友劉穎趁猴,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體彪见,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡儡司,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了余指。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捕犬。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖浪规,靈堂內(nèi)的尸體忽然破棺而出或听,到底是詐尸還是另有隱情,我是刑警寧澤笋婿,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布誉裆,位于F島的核電站,受9級(jí)特大地震影響缸濒,放射性物質(zhì)發(fā)生泄漏足丢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一庇配、第九天 我趴在偏房一處隱蔽的房頂上張望斩跌。 院中可真熱鬧,春花似錦捞慌、人聲如沸耀鸦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽袖订。三九已至,卻和暖如春嗅虏,著一層夾襖步出監(jiān)牢的瞬間洛姑,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工皮服, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留楞艾,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓龄广,卻偏偏與公主長得像硫眯,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子择同,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容