數(shù)據(jù)分析學(xué)習(xí)篇

使用anaconda

python 導(dǎo)入csv文件

from pandas import read_csv;

df =read_csv('E://1.csv',encoding ='UTF-8')

encoding 指定編碼utf-8

python 導(dǎo)入文本文件

from pandas import read_table;

df =read_table('E://2.txt',encoding ='UTF-8',names=['age','name'],sep=',')

加入列明

導(dǎo)入 excel

from pandas import read_excel;

df = read_excel('E://3.xls')

python 導(dǎo)出文本文件

from pandas import DataFrame;

df =DataFrame({

'age':[21,22,23],

'name':['ken','john','zhangsa']

});

df.to_csv('E://df.csv');

df.to_csv('E://df.csv'店印,index=Fales); 導(dǎo)出時(shí)候不帶序號(hào)

處理重復(fù)值 == 數(shù)據(jù)清洗

drop_duplicates()

from pandas import read_csv;

df =read_csv('E://shuju/data.csv',encoding='utf-8')

netOF = df.drop_duplicates();

缺失值的處理

處理方式

數(shù)據(jù)補(bǔ)齊? 刪除對(duì)應(yīng)缺失行

去除數(shù)據(jù)結(jié)構(gòu)中值為空的數(shù)據(jù)

使用 dropna()

from pandas import read_csv;

df =read_csv('E://shuju/1.csv',encoding='utf-8')

newdf= df.dropna();

空格值數(shù)據(jù)的處理

strip()使用

from pandas import read_csv;

df =read_csv('E://shuju/data.csv',encoding='utf-8')

nameName = df['name'].str.strip();

df['name'] =nameName

字段的抽取

使用slice(start,stop)

from pandas import read_csv;

df =read_csv('E://shuju/data.csv',encoding='utf-8')

df['tel'] =df['tel'].astype(str);? astype 轉(zhuǎn)換成字符串

bands =df['tel'].str.slice(0,3)

字段拆分split(sep,n忠荞,expand=false)

sep 用于分割的字符串

n 分割為多少列

expand 是否展開(kāi)為數(shù)據(jù)庫(kù)

expand 為true 返回DataFrame false 返回series

from pandas import read_csv;

df =read_csv('E://shuju/data.csv',encoding='utf-8');

newDF =df['name'].str.split(' ',1,True);

newDF.columns=['band','name'];

記錄抽取

對(duì)指根據(jù)一定的條件對(duì)數(shù)據(jù)進(jìn)行抽取

dataframe[condition]

condition 過(guò)濾的條件 返回值是dataframe

記錄抽取 常用的條件類(lèi)型

>< >=<=? 如 df[df.comments>1000];

范圍運(yùn)算

between(left,right)

df[df.commebts.between(1000,1000)]

空值匹配

pandas.isnull(column)

df[pandas.isnull(df.title)]

字符串匹配

str.contains(patten,na =False)

df[df.title.str.contains('臺(tái)電',na=Fale)]

邏輯運(yùn)算

與& 或| 取反not

import pandas;

from pandas imoprt read_csv

df[df.comments>10000];

隨機(jī)抽取函數(shù)

numpy.random.randint(start,end,number)

start 開(kāi)始 end 結(jié)束? number 從哪里開(kāi)始

import numpy;

from pandas import read_csv;

df =read_csv('E://shuju/data.csv',encoding='utf-8');

r= numpy.random.randint(0,10,3);

df.loc[r,:];

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市洞拨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件亮元,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡唠摹,警方通過(guò)查閱死者的電腦和手機(jī)爆捞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)勾拉,“玉大人煮甥,你說(shuō)我怎么就攤上這事∨涸蓿” “怎么了成肘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,875評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)斧蜕。 經(jīng)常有香客問(wèn)我双霍,道長(zhǎng),這世上最難降的妖魔是什么批销? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,441評(píng)論 1 293
  • 正文 為了忘掉前任洒闸,我火速辦了婚禮,結(jié)果婚禮上风钻,老公的妹妹穿的比我還像新娘。我一直安慰自己酒请,他們只是感情好骡技,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著羞反,像睡著了一般布朦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昼窗,一...
    開(kāi)封第一講書(shū)人閱讀 51,365評(píng)論 1 302
  • 那天是趴,我揣著相機(jī)與錄音,去河邊找鬼澄惊。 笑死唆途,一個(gè)胖子當(dāng)著我的面吹牛富雅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播肛搬,決...
    沈念sama閱讀 40,190評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼没佑,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了温赔?” 一聲冷哼從身側(cè)響起蛤奢,我...
    開(kāi)封第一講書(shū)人閱讀 39,062評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎陶贼,沒(méi)想到半個(gè)月后啤贩,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拜秧,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評(píng)論 3 335
  • 正文 我和宋清朗相戀三年痹屹,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腹纳。...
    茶點(diǎn)故事閱讀 39,834評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡痢掠,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出嘲恍,到底是詐尸還是另有隱情足画,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評(píng)論 5 345
  • 正文 年R本政府宣布佃牛,位于F島的核電站淹辞,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏俘侠。R本人自食惡果不足惜象缀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望爷速。 院中可真熱鬧央星,春花似錦、人聲如沸惫东。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,779評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)廉沮。三九已至颓遏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間滞时,已是汗流浹背叁幢。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,912評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坪稽,地道東北人曼玩。 一個(gè)月前我還...
    沈念sama閱讀 47,958評(píng)論 2 370
  • 正文 我出身青樓鳞骤,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親演训。 傳聞我的和親對(duì)象是個(gè)殘疾皇子弟孟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容