一恶耽、導(dǎo)入csv文件
pd.read_csv(open('E:/2020年/06學(xué)習(xí)/python學(xué)習(xí)/guomai賬號(hào)創(chuàng)建的網(wǎng)站.csv'))
細(xì)節(jié):橫杠打反品追,代碼里的橫杠和文件路徑顯示橫杠是相反的
####更改索引:
pd=pd.read_csv(open('E:/2020年/06學(xué)習(xí)/python學(xué)習(xí)/guomai賬號(hào)創(chuàng)建的網(wǎng)站.csv'),names=list('abcde'))
二抱环、注意查詢的注意點(diǎn)(斜體字部分)
query查詢:
df.query("網(wǎng)站情況 =='未嵌碼'&編號(hào)>700") 字段名
結(jié)果是一個(gè)數(shù)據(jù)框,還可以對(duì)這個(gè)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)查詢:
df.query("網(wǎng)站情況 =='未嵌碼'&編號(hào)>700")[["主域名","名稱"]]
直接查詢:
df[(df.網(wǎng)站情況 =='未嵌碼')&(df.編號(hào)>700)]
也可以對(duì)這個(gè)數(shù)據(jù)框進(jìn)行相應(yīng)的查詢:
df[(df.網(wǎng)站情況?=='未嵌碼')&(df.編號(hào)>700)][["主域名","名稱"]]
某個(gè)字段滿足條件另伍,得出來的是布爾類型
(df.網(wǎng)站情況 =='未嵌碼')&(df.編號(hào)>700)
####數(shù)據(jù)庫再查找某一列等價(jià)形式
df[(df.網(wǎng)站情況 =='未嵌碼')&(df.編號(hào)>700)] ["主域名"]
等價(jià)于
df.query("網(wǎng)站情況 =='未嵌碼'&編號(hào)>700").主域名
####還可以繼續(xù)作過濾
df.query("網(wǎng)站情況 =='未嵌碼'&編號(hào)>700").主域名=='www.cpad.gov.cn'
其中? df[df.query("網(wǎng)站情況 =='未嵌碼'&編號(hào)>700").主域名=='www.cpad.gov.cn']外面加一個(gè)切片報(bào)錯(cuò)宪睹,因?yàn)槔锩娴臄?shù)據(jù)庫的條數(shù)少,df數(shù)據(jù)庫條數(shù)多岗照,所以必須內(nèi)部的切片與外部的數(shù)據(jù)框兩者要對(duì)應(yīng)上
三村象、iloc笆环、loc、ix的練習(xí)
ix
df.ix[0:2]
iloc
df.iloc[0:2,1:3]
loc可用于標(biāo)簽
df.loc[0:1,['編號(hào)','名稱']]