Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用
最近迷上了高效處理數(shù)據(jù)的pandas,其實(shí)這個(gè)是用來(lái)做數(shù)據(jù)分析的箱亿,如果你是做大數(shù)據(jù)分析和測(cè)試的跛锌,那么這個(gè)是非常的有用的!届惋!但是其實(shí)我們平時(shí)在做自動(dòng)化測(cè)試的時(shí)候髓帽,如果涉及到數(shù)據(jù)的讀取和存儲(chǔ),那么而利用pandas就會(huì)非常高效脑豹,基本上3行代碼可以搞定你20行代碼的操作郑藏!該教程僅僅限于結(jié)合檸檬班的全棧自動(dòng)化測(cè)試課程來(lái)講解下pandas在項(xiàng)目中的應(yīng)用,這僅僅只是冰山一角瘩欺,希望大家可以踴躍的去嘗試和探索必盖!
一拌牲、安裝環(huán)境:
[](javascript:void(0); "復(fù)制代碼")
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;"> 1:pandas依賴(lài)處理Excel的xlrd模塊,所以我們需要提前安裝這個(gè)歌粥,安裝命令是:pip install xlrd 2:安裝pandas模塊還需要一定的編碼環(huán)境塌忽,所以我們自己在安裝的時(shí)候,確保你的電腦有這些環(huán)境:Net.4 失驶、VC-Compiler以及winsdk_web土居,如果大家沒(méi)有這些軟件~可以咨詢(xún)我們的輔導(dǎo)員索要相關(guān)安裝工具。 3:步驟1和2 準(zhǔn)備好了之后嬉探,我們就可以開(kāi)始安裝pandas了擦耀,安裝命令是:pip install pandas
一切準(zhǔn)備就緒,就可以開(kāi)始愉快的玩松蹋咯眷蜓!
ps:在這個(gè)過(guò)程中,可能會(huì)遇到安裝不順利的情況胎围,萬(wàn)能的度娘有N種解決方案吁系,你這么大應(yīng)該要學(xué)著自己解決問(wèn)題。</pre>
](javascript:void(0); "復(fù)制代碼")
二痊远、pandas操作Excel表單
數(shù)據(jù)準(zhǔn)備垮抗,有一個(gè)Excel文件:lemon.xlsx有兩個(gè)表單氏捞,表單名分別為:Python 以及student碧聪,
Python的表單數(shù)據(jù)如下所示:
student的表單數(shù)據(jù)如下所示:
1:在利用pandas模塊進(jìn)行操作前,可以先引入這個(gè)模塊液茎,如下:
2:讀取Excel文件的兩種方式:
方法一:默認(rèn)讀取第一個(gè)表單
df=pd.read_excel('lemon.xlsx')#這個(gè)會(huì)直接默認(rèn)讀取到這個(gè)Excel的第一個(gè)表單
data=df.head()#默認(rèn)讀取前5行的數(shù)據(jù)
print("獲取到所有的值:\n{0}".format(data))#格式化輸出</pre>
得到的結(jié)果是一個(gè)二維矩陣逞姿,如下所示:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">#方法二:通過(guò)指定表單名的方式來(lái)讀取
df=pd.read_excel('lemon.xlsx',sheet_name='student')#可以通過(guò)sheet_name來(lái)指定讀取的表單
data=df.head()#默認(rèn)讀取前5行的數(shù)據(jù)
print("獲取到所有的值:\n{0}".format(data))#格式化輸出</pre>
得到的結(jié)果如下所示,也是一個(gè)二維矩陣:
](javascript:void(0); "復(fù)制代碼")
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">#方法三:通過(guò)表單索引來(lái)指定要訪問(wèn)的表單捆等,0表示第一個(gè)表單 #也可以采用表單名和索引的雙重方式來(lái)定位表單 #也可以同時(shí)定位多個(gè)表單滞造,方式都羅列如下所示
df=pd.read_excel('lemon.xlsx',sheet_name=['python','student'])#可以通過(guò)表單名同時(shí)指定多個(gè) # df=pd.read_excel('lemon.xlsx',sheet_name=0)#可以通過(guò)表單索引來(lái)指定讀取的表單 # df=pd.read_excel('lemon.xlsx',sheet_name=['python',1])#可以混合的方式來(lái)指定 # df=pd.read_excel('lemon.xlsx',sheet_name=[1,2])#可以通過(guò)索引 同時(shí)指定多個(gè)
data=df.values#獲取所有的數(shù)據(jù),注意這里不能用head()方法哦~
print("獲取到所有的值:\n{0}".format(data))#格式化輸出</pre>
](javascript:void(0); "復(fù)制代碼")
具體結(jié)果是怎樣的栋烤,同學(xué)們可以自己一個(gè)一個(gè)的去嘗試谒养,這個(gè)結(jié)果是非常有意思的,但是同時(shí)同學(xué)們也發(fā)現(xiàn)了明郭,這個(gè)數(shù)據(jù)是一個(gè)二維矩陣买窟,對(duì)于我們?nèi)プ鲎詣?dòng)化測(cè)試,并不能很順利的處理薯定,所以接下來(lái)始绍,我們就會(huì)詳細(xì)的講解,如何來(lái)讀取行號(hào)和列號(hào)以及每一行的內(nèi)容 以及制定行列的內(nèi)容话侄。
三亏推、pandas操作Excel的行列
1:讀取指定的單行学赛,數(shù)據(jù)會(huì)存在列表里面
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">#1:讀取指定行
df=pd.read_excel('lemon.xlsx')#這個(gè)會(huì)直接默認(rèn)讀取到這個(gè)Excel的第一個(gè)表單
data=df.ix[0].values#0表示第一行 這里讀取數(shù)據(jù)并不包含表頭,要注意哦吞杭!
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))</pre>
得到的結(jié)果如下所示:
2:讀取指定的多行盏浇,數(shù)據(jù)會(huì)存在嵌套的列表里面:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2]].values#讀取指定多行的話,就要在ix[]里面嵌套列表指定行數(shù)
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))</pre>
3:讀取指定的行列:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx')
data=df.ix[1,2]#讀取第一行第二列的值芽狗,這里不需要嵌套列表 print("讀取指定行的數(shù)據(jù):\n{0}".format(data))</pre>
4:讀取指定的多行多列值:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2],['title','data']].values#讀取第一行第二行的title以及data列的值缠捌,這里需要嵌套列表 print("讀取指定行的數(shù)據(jù):\n{0}".format(data))</pre>
5:獲取所有行的指定列
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx')
data=df.ix[:,['title','data']].values#讀所有行的title以及data列的值,這里需要嵌套列表 print("讀取指定行的數(shù)據(jù):\n{0}".format(data))</pre>
6:獲取行號(hào)并打印輸出
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx') print("輸出行號(hào)列表",df.index.values)
輸出結(jié)果是:
輸出行號(hào)列表 [0 1 2 3]</pre>
7:獲取列名并打印輸出
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx') print("輸出列標(biāo)題",df.columns.values)
運(yùn)行結(jié)果如下所示:
輸出列標(biāo)題 ['case_id' 'title' 'data']</pre>
8:獲取指定行數(shù)的值:
[](javascript:void(0); "復(fù)制代碼")
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx') print("輸出值",df.sample(3).values)#這個(gè)方法類(lèi)似于head()方法以及df.values方法
輸出值
[[2 '輸入錯(cuò)誤的密碼' '{"mobilephone":"18688773467","pwd":"12345678"}']
[3 '正常充值' '{"mobilephone":"18688773467","amount":"1000"}']
[1 '正常登錄' '{"mobilephone":"18688773467","pwd":"123456"}']]</pre>
](javascript:void(0); "復(fù)制代碼")
9:獲取指定列的值:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx') print("輸出值\n",df['data'].values)</pre>
四:pandas處理Excel數(shù)據(jù)成為字典
我們有這樣的數(shù)據(jù)译蒂,曼月,處理成列表嵌套字典,且字典的key為表頭名柔昼。
實(shí)現(xiàn)的代碼如下所示:
[](javascript:void(0); "復(fù)制代碼")
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">df=pd.read_excel('lemon.xlsx')
test_data=[] for i in df.index.values:#獲取行號(hào)的索引哑芹,并對(duì)其進(jìn)行遍歷:
#根據(jù)i來(lái)獲取每一行指定的數(shù)據(jù) 并利用to_dict轉(zhuǎn)成字典
row_data=df.ix[i,['case_id','module','title','http_method','url','data','expected']].to_dict()
test_data.append(row_data) print("最終獲取到的數(shù)據(jù)是:{0}".format(test_data))</pre>
](javascript:void(0); "復(fù)制代碼")
最后得到的結(jié)果是:
<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">最終獲取到的數(shù)據(jù)是:
[{'title': '正常登錄', 'case_id': 1, 'data': '{"mobilephone":"18688773467","pwd":"123456"}'},
{'title': '輸入錯(cuò)誤的密碼', 'case_id': 2, 'data': '{"mobilephone":"18688773467","pwd":"12345678"}'},
{'title': '正常充值', 'case_id': 3, 'data': '{"mobilephone":"18688773467","amount":"1000"}'},
{'title': '充值輸入負(fù)數(shù)', 'case_id': 4, 'data': '{"mobilephone":"18688773467","amount":"-100"}'}]</pre>
關(guān)于pandas的學(xué)習(xí),今天就告一段落啦捕透!趕緊打開(kāi)pycharm跑起來(lái)4献恕!乙嘀!
import pandas as pd
from sqlalchemy import create_engine
file = r"line6.xlsx"
df = pd.read_excel(file)
print(df)
engine = create_engine("mysql+pymysql://root:mysql@127.0.0.1:3306/excel?charset=utf8")
df.to_sql('testexcel',con=engine,if_exists='replace',index=False)