1pandas介紹及安裝
Pandas是什么芍耘?
Pandas是基于Numpy的一種工具勾怒,提供了高性能矩陣的運算,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的霉猛。也是貫穿整個Python數(shù)據(jù)分析非常核心的工具淆党。
Pandas安裝
直接在dos命令行中pip install pandas 即可酷师。
Pandas涉及內(nèi)容
基于 xlrd & xlwt 這2個庫需要預(yù)先安裝才能更好使用pandas
Pandas數(shù)據(jù)結(jié)構(gòu)介紹
1. Series
Series是一種一維的數(shù)組型對象,它包含了一個值序列(values)染乌,并且包含了數(shù)據(jù)標(biāo)簽山孔,稱為索引(index)。
Series參數(shù)
C:\Users\Ligang\Desktop>md pandas
C:\Users\Ligang\Desktop>cd pandas
C:\Users\Ligang\Desktop\pandas>jupyter notebook
進(jìn)入jupyter notebook
import pandas as pd
pd.Series??
pd.Series(data=None,index=None,dtype=None,name=None,copy=False)
? data:創(chuàng)建數(shù)組的數(shù)據(jù)荷憋,可為array-like, dict, or scalar value
? index:指定索引
? dtype:數(shù)組數(shù)據(jù)類型
? name:數(shù)組名稱
? copy:是否拷貝
data可為iterable, dict, or scalar value
一. 當(dāng)data為數(shù)組
## 當(dāng)data為數(shù)組
s1 = pd.Series([1,2,3,4,5])
s1
>>>out
0 1
1 2
2 3
3 4
4 5
dtype: int64
1.創(chuàng)建時指定索引
# 創(chuàng)建時指定索引
s2 = pd.Series([1,2,3,4,5], index=list('abcde'))
s2
>>>out
a 1
b 2
c 3
d 4
e 5
dtype: int64
2.索引可重復(fù)
# pandas 索引可重復(fù)
s3 = pd.Series([1,2,3,4,5], index=list('aacde'))
>>>out
a 1
a 2
c 3
d 4
e 5
dtype: int64
3.索引個數(shù)必須與值一致 否則報錯
二 data 為dict
1台颠,構(gòu)建索引列表 以index指定為主
三 當(dāng)data為scalar
數(shù)組的數(shù)據(jù)類型
指定數(shù)組數(shù)據(jù)類型
變更數(shù)組數(shù)據(jù)類型
設(shè)置數(shù)組名字:參數(shù)name
1,指定索引的名稱
2勒庄,預(yù)覽數(shù)據(jù)
# 預(yù)覽數(shù)據(jù)
s9.head() # 默認(rèn)取出前5行串前,對應(yīng)指定n
s9.tail() # 默認(rèn)取出后5行,對應(yīng)指定n
顯示全部數(shù)據(jù)
#顯示所有行
pd.set_option('display.max_columns',None)
# 顯示所有列
pd.set_option('display.max_rows',None)
#設(shè)置value的顯示長度為100实蔽,默認(rèn)為50
pd.set_option('max_colwidth',100)
總結(jié)
-pd.Series()
-data
-數(shù)組酪呻,ndarray
-列表 list
- 字典,它的key為對應(yīng)index盐须,value為對應(yīng)的value
-dtype
- 指定數(shù)據(jù)類型
-name
-數(shù)組的名字
series索引值
series的索引與值
? s.index # 查看索引
? s.values # 查看值序列
? s.reset_index(drop=False) # 重置索引
? drop # 是否刪除原索引 默認(rèn)為否
注意
? 索引對象是不可變的,所以不能單個修改索引
Series索引與切片
? s['標(biāo)簽'] # 通過標(biāo)簽
? s['索引'] # 通過索引
? s.loc(標(biāo)簽) # 通過標(biāo)簽
? s.iloc(索引) # 通過索引
Series的索引及切片
1漆腌,創(chuàng)建s3
2贼邓,查看數(shù)據(jù)2的幾種方式
3,將數(shù)據(jù)4更改為10
4闷尿,查看數(shù)據(jù)1和10的神器索引
5塑径,產(chǎn)看連續(xù)數(shù)據(jù)1~3
6,布爾索引
7填具,標(biāo)量運算
8统舀,in判斷的運用只能判斷標(biāo)簽不能判斷值
9,pandas會根據(jù)數(shù)據(jù)類型自動處理缺失數(shù)據(jù)
Series 運算
當(dāng)s1與s2有共同索引時劳景,共同索引位置對應(yīng)位置運算 不對應(yīng)位置填充NAN誉简。