Pandas-14.統(tǒng)計(jì)函數(shù)

Pandas-14.統(tǒng)計(jì)函數(shù)

pct_change()

  • Series,DataFrame和Panel都有pct_change()函數(shù)
  • 將每個(gè)元素和前一個(gè)元素進(jìn)行比較,計(jì)算變化百分比
  • 默認(rèn)列操作,通過(guò)axis = 1參數(shù)換成行
s = pd.Series([1,2,3,4,5,6,7])
print(s.pct_change())
'''
0         NaN
1    1.000000
2    0.500000
3    0.333333
4    0.250000
5    0.200000
6    0.166667
dtype: float64
'''
df = pd.DataFrame(np.random.randn(5,2))
print(df.pct_change())
'''
           0          1
0        NaN        NaN
1  -0.079922  -0.967315
2   5.439245 -16.543627
3  -0.982768   1.365857
4 -16.309964  -0.422582

協(xié)方差

  • 適用于Series數(shù)據(jù)
  • cov()方法來(lái)計(jì)算Series之間的協(xié)方差
  • NAN自動(dòng)被排除
  • 用于DataFrame時(shí)滑潘,計(jì)算所有列之間的協(xié)方差(cov)值
s1 = pd.Series(np.random.randn(10))
s2 = pd.Series(np.random.randn(10))
s1.cov(s2)
'''
-0.2903289442568039
'''

df = pd.DataFrame(np.random.randn(10,5), columns=["a","b","c","d","e"])
df.cov()

'''
a   b   c   d   e
a   0.490571    -0.226859   0.195764    0.105226    -0.054498
b   -0.226859   1.675397    -0.720394   -0.437154   0.035249
c   0.195764    -0.720394   1.277242    0.422822    -0.073178
d   0.105226    -0.437154   0.422822    0.316138    0.021553
e   -0.054498   0.035249    -0.073178   0.021553    0.957176
'''

相關(guān)性

  • 相關(guān)性顯示了任何兩個(gè)Series之間的線性關(guān)系
  • 有多種方法計(jì)算:pearson(默認(rèn))胰挑、spearman,和Kendall
  • 自動(dòng)排除DataFrame中的非數(shù)字列
df.a.corr(df.b)
# -0.25023454111623283
df.corr()
'''
a   b   c   d   e
a   1.000000    -0.250235   0.247312    0.267199    -0.079530
b   -0.250235   1.000000    -0.492464   -0.600671   0.027835
c   0.247312    -0.492464   1.000000    0.665399    -0.066183
d   0.267199    -0.600671   0.665399    1.000000    0.039181
e   -0.079530   0.027835    -0.066183   0.039181    1.000000
'''

數(shù)據(jù)排名

  • 數(shù)據(jù)排名為元素?cái)?shù)組中的每個(gè)元素生成排名
  • 在相同的情況下竿奏,分配平均等級(jí)。
  • 可選的使用一個(gè)默認(rèn)為true的升序參數(shù)腥放,設(shè)定為false則逆序
  • 有不同的tie-breaking方法泛啸,用方法指定:
    • average - 并列組平均排序等級(jí)(默認(rèn))
    • min - 組中最低的排序等級(jí)
    • max - 組中最高的排序等級(jí)
    • first - 按照在數(shù)組中出現(xiàn)的順序分配等級(jí)
s = pd.Series(np.random.np.random.randn(5), index=list('abcde'))
s.d=s.b
s.rank()
'''
a    4.0
b    2.5
c    1.0
d    2.5
e    5.0
dtype: float64
'''
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市秃症,隨后出現(xiàn)的幾起案子候址,更是在濱河造成了極大的恐慌吕粹,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岗仑,死亡現(xiàn)場(chǎng)離奇詭異匹耕,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)荠雕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門稳其,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人炸卑,你說(shuō)我怎么就攤上這事欢际。” “怎么了矾兜?”我有些...
    開封第一講書人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵损趋,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我椅寺,道長(zhǎng)浑槽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任返帕,我火速辦了婚禮桐玻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘荆萤。我一直安慰自己镊靴,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開白布链韭。 她就那樣靜靜地躺著偏竟,像睡著了一般。 火紅的嫁衣襯著肌膚如雪敞峭。 梳的紋絲不亂的頭發(fā)上踊谋,一...
    開封第一講書人閱讀 49,185評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音旋讹,去河邊找鬼殖蚕。 笑死,一個(gè)胖子當(dāng)著我的面吹牛沉迹,可吹牛的內(nèi)容都是我干的睦疫。 我是一名探鬼主播,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼鞭呕,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蛤育!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤缨伊,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后进宝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體刻坊,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年党晋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了谭胚。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡未玻,死狀恐怖灾而,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情扳剿,我是刑警寧澤旁趟,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站庇绽,受9級(jí)特大地震影響锡搜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瞧掺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一耕餐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辟狈,春花似錦肠缔、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至壹蔓,卻和暖如春亚隅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背庶溶。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工煮纵, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人偏螺。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓行疏,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親套像。 傳聞我的和親對(duì)象是個(gè)殘疾皇子酿联,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344

推薦閱讀更多精彩內(nèi)容

  • 在python中,眾所周知,數(shù)據(jù)預(yù)處理最好用的包就是pandas了贞让,以下是pandas里的dataframe數(shù)據(jù)結(jié)...
    天涯海角醉云游閱讀 31,278評(píng)論 1 12
  • 1.DataFrame對(duì)象 按照一定順序排列多列數(shù)據(jù)周崭,各列數(shù)據(jù)類型可以有所不同 DataFrame對(duì)象有兩個(gè)索引數(shù)...
    楊大菲閱讀 1,619評(píng)論 0 3
  • pyspark.sql module Module context Spark SQL和DataFrames中的重...
    盜夢(mèng)者_(dá)56f2閱讀 5,409評(píng)論 0 19
  • 功能包括但不限于: 1.按軸自動(dòng)或顯式數(shù)據(jù)對(duì)齊功能的數(shù)據(jù)結(jié)構(gòu)2.集成時(shí)間序列功能3.數(shù)學(xué)運(yùn)算和約簡(jiǎn)4.靈活處理缺失...
    Shinichi新一君閱讀 676評(píng)論 0 1
  • pandas 入門 pandas 的數(shù)據(jù)結(jié)構(gòu)介紹 pandas 有兩個(gè)重要的數(shù)據(jù)結(jié)構(gòu):Series和DataFra...
    昱灬巖閱讀 5,828評(píng)論 0 16