在開始之前我推薦大家下載使用 Anaconda朽褪,里面包含了 Spyder 和 Jupyter Notebook 等集成工具玻褪。到百度搜索一下就可以找到官方下載鏈接卵佛,下載個人版就可以(本文使用的 Python 版本為 3.7 颜懊,只要大家用的是 Python 3,那么語法就和文中幾乎沒有差異)吞杭。
一、數(shù)據(jù)的讀取
在工作中变丧,實驗數(shù)據(jù)和工作表格通常存儲在 Excel 的文件中芽狗。也有人使用數(shù)據(jù)庫,數(shù)據(jù)庫本身自帶簡單的求和痒蓬、計數(shù)等功能童擎。如果做深入的數(shù)據(jù)分析,就離不開像 Python Pandas攻晒、TensorFlow 等專業(yè)工具了顾复。數(shù)據(jù)庫導(dǎo)出的數(shù)據(jù)文件通常為 CSV、UNL 格式炎辨。CSV 和 UNL 格式數(shù)據(jù)也可以用 Excel 打開并正常顯示為表格捕透,它們是使用特殊分隔符(比如 ,
、|
或 ;
)的文本型數(shù)據(jù)文件。用 UltraEdit 之類的純文本編輯器打開的樣子是這樣的:
csv文件文本編輯器查看
1.1 讀取 CSV 文件
read_csv 是 Pandas 讀取 CSV 文件時使用的方法乙嘀。
import pandas as pd #首先引入pandas包末购,并稱它為pd
fpath=r'e:\tj\zt1802\car.csv' #定義文件所在的位置
df=pd.read_csv(fpath,header=0,index_col=None,encoding='gbk') #read_csv讀取數(shù)據(jù)