標(biāo)準(zhǔn)庫(kù)
Python的標(biāo)準(zhǔn)庫(kù)是其核心的擴(kuò)展
- 操作系統(tǒng)接口
- 文件操作
- 輸入輸出流
- 文本處理等功能
常用的兩個(gè)方法
dir() # 查看模塊中所包含的工具
help() # 展示模塊中所有的方法的說(shuō)明
六大模塊
模塊名稱(chēng) 模塊簡(jiǎn)介 應(yīng)用場(chǎng)景
數(shù)學(xué)模塊(math) 包含很多科學(xué)計(jì)算方法, 在數(shù)據(jù)挖掘中踏幻,經(jīng)常要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化枪孩,求統(tǒng)計(jì)值等
如平方根醇疼、對(duì)數(shù)計(jì)算烙肺、三角函數(shù)等等 處理钦勘,math 模塊基本上包含了所有的基本操作
日期時(shí)間模塊(datetime) 主要用于處理時(shí)間類(lèi)型的數(shù)據(jù)示血,如 數(shù)據(jù)通常都會(huì)帶有時(shí)間戳棋傍,有時(shí),時(shí)間也是一種重要的特征矾芙。
時(shí)間數(shù)據(jù)格式化舍沙、時(shí)間的獲取近上、時(shí)間數(shù)據(jù) 如新聞中剔宪,有新聞的發(fā)生時(shí)間、發(fā)布時(shí)間等壹无,此時(shí)就會(huì)用到該
與字符串的轉(zhuǎn)換等等 模塊
隨機(jī)模塊(random) 主要可以進(jìn)行隨機(jī)數(shù)的生成葱绒,隨機(jī)選取 在進(jìn)行數(shù)據(jù)采樣、數(shù)據(jù)生成時(shí)經(jīng)常用到這些隨機(jī)方法
文件操作模塊(file) 主要提供了文件操作斗锭,包括文件的讀取 數(shù)據(jù)挖掘的樣本通常都會(huì)被存放在文件中地淀,所以文件操作
和寫(xiě)入等,在處理本地?cái)?shù)據(jù)時(shí)岖是,通常都 也是基本技能之一
會(huì)用到這些操作
正則匹配模塊(re) 可以使用正則表達(dá)式來(lái)進(jìn)行字符串的匹配帮毁、 在處理文本數(shù)據(jù)時(shí)实苞,經(jīng)常需要用到正則匹配來(lái)進(jìn)行文本的檢索
檢測(cè)等, 其編寫(xiě)方式可以在網(wǎng)上搜索
系統(tǒng)接口模塊(sys) 主要實(shí)現(xiàn)了與操作系統(tǒng)交互的一些功能烈疚, 系統(tǒng)接口模塊主要是為了獲取系統(tǒng)的各種數(shù)據(jù)
如獲取當(dāng)前操作系統(tǒng)的情況黔牵、設(shè)置編碼格式
等,編寫(xiě)完整的程序通常都會(huì)用到
第三方庫(kù)
-
基礎(chǔ)模塊
名稱(chēng) 含義 Numpy Python 語(yǔ)言擴(kuò)展程序庫(kù)爷肝,支持大量的維度數(shù)組與矩陣運(yùn)算 SciPy 集成了數(shù)學(xué)猾浦、科學(xué)和工程的計(jì)算包,它用于有效計(jì)算 Numpy 矩陣灯抛,使 Numpy 和 SciPy 協(xié)同工作 Matplotlib 專(zhuān)門(mén)用來(lái)繪圖的工具包金赦,可以使用它進(jìn)行數(shù)據(jù)可視化 pandas 數(shù)據(jù)分析工具包,它給予 Numpy 構(gòu)建对嚼,納入了大量的庫(kù)和標(biāo)準(zhǔn)數(shù)據(jù)模型
-
機(jī)器學(xué)習(xí)
名稱(chēng) 含義 scikit-learn 基于 SciPy 進(jìn)行延伸的機(jī)器學(xué)習(xí)工具包夹抗,包含大量的機(jī)器學(xué)習(xí)算法模型,有 6 種大基本功能:分類(lèi)纵竖、回歸兔朦、聚類(lèi)、數(shù)據(jù)降維磨确、模型選擇和數(shù)據(jù)預(yù)處理 OpenCV 非常龐大的圖像處理庫(kù)沽甥,實(shí)現(xiàn)了非常多的圖像和視頻處理方法,如圖像視頻加載乏奥、基礎(chǔ)特征獲取摆舟、邊緣檢測(cè)等,處理圖像通常都需要其支持邓了。 NLTK 比較傳統(tǒng)的自然語(yǔ)言處理模塊恨诱,自帶很多語(yǔ)料,以及全面的傳統(tǒng)自然語(yǔ)言處理算法骗炉,比如字符串處理照宝、卡方檢驗(yàn)等,非常適合自然語(yǔ)言入門(mén)使用句葵。 Gensim 包含了淺層詞嵌入的文本處理模塊厕鹃,以及常用的自然語(yǔ)言處理相關(guān)方法,如 TF-IDF乍丈、word2vec 等模型剂碴。
-
深度學(xué)習(xí)平臺(tái)
名稱(chēng) 開(kāi)發(fā)平臺(tái) 優(yōu)點(diǎn) TensorFlow 谷歌 相對(duì)成熟、應(yīng)用廣泛轻专、服務(wù)全面忆矛、提供學(xué)習(xí)視頻和其認(rèn)證計(jì)劃。 PyTorch Facebook 支持更加快速地構(gòu)建項(xiàng)目请垛。 PaddlePaddle 百度 中文文檔全面催训,對(duì)于漢語(yǔ)的相關(guān)模型比較豐富洽议。
包的安裝
-
使用 pip 安裝擴(kuò)展包
使用pip可以對(duì) Python 擴(kuò)展包進(jìn)行查找、下載漫拭、安裝绞铃、卸載等等pip --version # 查看pip是否已經(jīng)存在 pip install -U pip # 升級(jí) pip 到最新版
用 pip 安裝擴(kuò)展包,以安裝 Tensorflow 為例子
pip install tensorflow # 安裝最新版的 tensorflow 模塊 pip install tensorflow==1.14 # 安裝版本為 1.14 的 tensorflow 模塊 pip install tensorflow>=1.14 # 安裝 1.14 版本以上的 tensorflow 模塊
用 pip 卸載某個(gè)模塊
pip uninstall tensorflow
在 pip 庫(kù)中搜索某個(gè)模塊
pip search tensorflow
用 pip 顯示已經(jīng)安裝的包
pip list
【切換鏡像源】
pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple # 這是一段代碼
【用 pip 更新配置文件嫂侍,修改默認(rèn)源】
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple # 這是一段代碼
【常用鏡像源】
鏡像名稱(chēng) 網(wǎng)站地址 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中國(guó)科技大學(xué) https://pypi.mirrors.ustc.edu.cn/simple/ 清華大學(xué) https://pypi.tuna.tsinghua.edu.cn/simple/ 豆瓣 http://pypi.douban.com/simple/ 華中理工大學(xué) http://pypi.hustunique.com/simple/ 山東理工大學(xué) http://pypi.sdutlinux.org/simple/
Anaconda
- Anaconda是 包管理器儿捧, 也是 環(huán)境管理器, 更是 Python的編輯器
- Anaconda致力于為用戶提供更便捷的方式來(lái)使用Python挑宠,進(jìn)行數(shù)據(jù)科學(xué)計(jì)算和機(jī)器學(xué)習(xí)
- 目前的開(kāi)源軟件庫(kù) sklearn菲盾、TensorFlow、SciPy 都支持 Anaconda
為什么使用 Anaconda ?
- 依賴(lài)包安裝方便
- 多平臺(tái)支持
- 多環(huán)境切換
Anaconda 的安裝各淀?
http://www.reibang.com/p/d465788f6df0