Pandas中的一些操作_03(2019-1-19)

1、通過(guò)apply進(jìn)行數(shù)據(jù)預(yù)處理
其最重要的參數(shù)是傳入的函數(shù)柳譬,傳入的函數(shù)會(huì)對(duì)DataFrame的每一行(index)或每一列(column)進(jìn)行操作蛛勉,然后返回每一個(gè)index或column對(duì)應(yīng)的值缚去,再將這些行(或者列)以及其對(duì)應(yīng)的返回值重新組合成一個(gè)DataFrame的對(duì)象残腌,然后作為整個(gè)apply方法的返回值返回。

至于傳入的函數(shù)具體是對(duì)每一行還是每一列進(jìn)行操作缠黍,取決于apply傳入的axis參數(shù)净响,默認(rèn)axis=0,表示對(duì)每一列進(jìn)行操作白翻,axis=1乍炉,表示對(duì)每一行進(jìn)行操作。因此apply方法最重要兩個(gè)參數(shù)是傳入的函數(shù)func和axis滤馍。
applymap: 用于dataframe上岛琼,是元素級(jí)別的操作;

map:(其實(shí)是python自帶的)用于series上巢株,是元素級(jí)別的操作槐瑞。
通過(guò)apply可以進(jìn)行的數(shù)據(jù)預(yù)處理包括:
(1)添加行列數(shù)據(jù)
添加列數(shù)據(jù),可以直接指定列數(shù)據(jù)和列名
(2)修改某一行的數(shù)據(jù)大小寫
(3)去掉數(shù)據(jù)兩邊的空格
(4)把原來(lái)的一個(gè)數(shù)據(jù)變成多個(gè)
(5)給列重新命名
(6)刪除某一列
(7)把數(shù)據(jù)保存成csv

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
df = pd.read_csv('apply_demo.csv')
#添加一列
s1 = Series(['a']*28)
df['A'] = s1
#修改列元素
df['A'] = df['A'].apply(str.upper)
#把一列分成多列
def foo(line):
   items = line.strip().split(' ')
   return Series([items[1],items[3],items[5]])
dt_temp = df['data'].apply(foo)
dt_temp=dt_temp.rename(columns={0:'Symbol',1:'Seqno',2:'Price'})
df_new  = df.combine_first(dt_temp)
#刪除一列
del df_new['data']
#保存
df_new.to_csv('demo_duolicate.csv')

2阁苞、去重操作
(1)查看元素是否唯一值unique()
(2)查看每個(gè)元素出現(xiàn)的次數(shù)
計(jì)數(shù)值value_counts()
(3)判斷與前后數(shù)據(jù)是否重復(fù)
(4)刪除重復(fù)數(shù)據(jù)困檩,保留最前面的一個(gè),保留最后一個(gè)

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
df= pd.read_csv('demo_duplicate.csv')
df.head()
del df['Unnamed: 0']
df['Seqno'].unique()
df['Seqno'].duplicated() #判斷是否和前面重復(fù)
df['Seqno'].drop_duplicates(keep='first')
df['Seqno'].duplicated(keep='last') #判斷是否和hou面重復(fù)
df['Seqno'].drop_duplicates(keep='last')

3那槽、時(shí)間序列操作
(1)格式化時(shí)間
(2)把時(shí)間當(dāng)成索引
(3)具體內(nèi)容參考文檔

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
from datetime import datetime
t1 = datetime(2009,10,20)
date_list=[
   datetime(2016,9,1),
   datetime(2016,9,10),
   datetime(2017,9,1),
   datetime(2017,9,20),
   datetime(2017,10,1)
]
s1 = Series(np.random.rand(5),index=date_list)
s1['2016-09-10']
s1['20160910']
s1['2016-9']
s1['2016']
# pd內(nèi)部提供函數(shù)
pd.date_range(start='2016-01-01',periods=100)
pd.date_range(start='2016-01-01',periods=100,freq='W')
pd.date_range(start='2016-01-01',periods=100,freq='W-MON')
pd.date_range(start='2016-01-01',periods=100,freq='H')


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末悼沿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子骚灸,更是在濱河造成了極大的恐慌糟趾,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件甚牲,死亡現(xiàn)場(chǎng)離奇詭異义郑,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)鳖藕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門魔慷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人著恩,你說(shuō)我怎么就攤上這事院尔。” “怎么了喉誊?”我有些...
    開封第一講書人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵邀摆,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我伍茄,道長(zhǎng)栋盹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任敷矫,我火速辦了婚禮例获,結(jié)果婚禮上汉额,老公的妹妹穿的比我還像新娘。我一直安慰自己榨汤,他們只是感情好蠕搜,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著收壕,像睡著了一般妓灌。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蜜宪,一...
    開封第一講書人閱讀 51,521評(píng)論 1 304
  • 那天虫埂,我揣著相機(jī)與錄音,去河邊找鬼圃验。 笑死掉伏,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的损谦。 我是一名探鬼主播岖免,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼照捡!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起话侧,我...
    開封第一講書人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤栗精,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后瞻鹏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悲立,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年新博,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了薪夕。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡赫悄,死狀恐怖原献,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情埂淮,我是刑警寧澤姑隅,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站倔撞,受9級(jí)特大地震影響讲仰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜痪蝇,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一鄙陡、第九天 我趴在偏房一處隱蔽的房頂上張望冕房。 院中可真熱鬧,春花似錦趁矾、人聲如沸耙册。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)觅玻。三九已至,卻和暖如春培漏,著一層夾襖步出監(jiān)牢的瞬間溪厘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工牌柄, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留畸悬,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓珊佣,卻偏偏與公主長(zhǎng)得像蹋宦,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子咒锻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容