python數(shù)據(jù)分析之Pandas

介紹

Python Data Analysis Library 或 pandas 是基于NumPy 的一種工具沟娱,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的拣宰。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具隔披。pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。你很快就會發(fā)現(xiàn),它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一澄耍。

Pandas是python的一個數(shù)據(jù)分析包,最初由AQR Capital Management于2008年4月開發(fā)晌缘,并于2009年底開源出來齐莲,目前由專注于Python數(shù)據(jù)包開發(fā)的PyData開發(fā)team繼續(xù)開發(fā)和維護(hù),屬于PyData項目的一部分枚钓。Pandas最初被作為金融數(shù)據(jù)分析工具而開發(fā)出來铅搓,因此,pandas為時間序列分析提供了很好的支持搀捷。 Pandas的名稱來自于面板數(shù)據(jù)(panel data)和python數(shù)據(jù)分析(data analysis)星掰。panel data是經(jīng)濟(jì)學(xué)中關(guān)于多維數(shù)據(jù)集的一個術(shù)語多望,在Pandas中也提供了panel的數(shù)據(jù)類型。


數(shù)據(jù)類型

Series:一維數(shù)組氢烘,與Numpy中的一維array類似怀偷。二者與Python基本的數(shù)據(jù)結(jié)構(gòu)List也很相近,其區(qū)別是:List中的元素可以是不同的數(shù)據(jù)類型播玖,而Array和Series中則只允許存儲相同的數(shù)據(jù)類型椎工,這樣可以更有效的使用內(nèi)存,提高運算效率蜀踏。

Time- Series:以時間為索引的Series维蒙。

DataFrame:二維的表格型數(shù)據(jù)結(jié)構(gòu)。很多功能與R中的data.frame類似果覆÷可以將DataFrame理解為Series的容器。以下的內(nèi)容主要以DataFrame為主局待。

Panel :三維的數(shù)組斑响,可以理解為DataFrame的容器。


放一下Series的事例代碼

# -*- coding: utf-8 -*-

frompandasimportSeries

print'用數(shù)組生成Series'

obj = Series([4,7, -5,3])

printobj

printobj.values

printobj.index

print

print'指定Series的index'

obj2 = Series([4,7, -5,3],index= ['d','b','a','c'])

printobj2

printobj2.index

printobj2['a']

obj2['d'] =6

printobj2[['c','a','d']]

printobj2[obj2 >0]# 找出大于0的元素

print'b'inobj2# 判斷索引是否存在

print'e'inobj2

print

print'使用字典生成Series'

sdata = {'Ohio':45000,'Texas':71000,'Oregon':16000,'Utah':5000}

obj3 = Series(sdata)

printobj3

print

print'使用字典生成Series钳榨,并額外指定index舰罚,不匹配部分為NaN。'

states = ['California','Ohio','Oregon','Texas']

obj4 = Series(sdata,index= states)

printobj4

print

print'Series相加薛耻,相同索引部分相加营罢。'

printobj3 + obj4

print

print'指定Series及其索引的名字'

obj4.name ='population'

obj4.index.name ='state'

printobj4

print

print'替換index'

obj.index = ['Bob','Steve','Jeff','Ryan']

printobj

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市昭卓,隨后出現(xiàn)的幾起案子愤钾,更是在濱河造成了極大的恐慌,老刑警劉巖候醒,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件能颁,死亡現(xiàn)場離奇詭異,居然都是意外死亡倒淫,警方通過查閱死者的電腦和手機(jī)伙菊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來敌土,“玉大人镜硕,你說我怎么就攤上這事》蹈桑” “怎么了兴枯?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長矩欠。 經(jīng)常有香客問我财剖,道長悠夯,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任躺坟,我火速辦了婚禮沦补,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘咪橙。我一直安慰自己夕膀,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布美侦。 她就那樣靜靜地躺著产舞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪音榜。 梳的紋絲不亂的頭發(fā)上庞瘸,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天捧弃,我揣著相機(jī)與錄音赠叼,去河邊找鬼。 笑死违霞,一個胖子當(dāng)著我的面吹牛嘴办,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播买鸽,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼涧郊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了眼五?” 一聲冷哼從身側(cè)響起妆艘,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎看幼,沒想到半個月后批旺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡诵姜,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年汽煮,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片棚唆。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡暇赤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出宵凌,到底是詐尸還是另有隱情鞋囊,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布瞎惫,位于F島的核電站溜腐,受9級特大地震影響坯门,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜逗扒,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一古戴、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧矩肩,春花似錦现恼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至刽酱,卻和暖如春喳逛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背棵里。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工润文, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人殿怜。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓典蝌,卻偏偏與公主長得像,于是被迫代替她去往敵國和親头谜。 傳聞我的和親對象是個殘疾皇子骏掀,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容