《利用Python進行數(shù)據(jù)分析學習筆記》學習筆記(三)

1.工具和環(huán)境
語言: python3.6
系統(tǒng):win7 64位
數(shù)據(jù)庫:MongoDB
IDE:IPython notebook

2.數(shù)據(jù)加載厨内、存儲與文件格式
pandas 提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對象的函數(shù)。

首先看一個以逗號分隔的CSV文本文件:

!type user_info.csv  #如果是UNIX系統(tǒng)识窿,要把'!type'改成'!cat'
,用戶,粉絲,答題,專欄文章,個人簡介
0,張佳瑋,1429532,3060,730,公眾號:張佳瑋寫字的地方
1,李開復,1015013,107,2,
2,黃繼新,810619,782,95,和知乎在一起
3,周源,777991,339,8,知乎 001 號員工
4,yolfilm,768913,1619,0,發(fā),然后禁效扫,則捍格而不勝康吵。
5,丁香醫(yī)生,759397,243,56,身體上的問題,來問丁香醫(yī)生
6,張亮,721254,1437,110,birth of cool
7,張小北,667155,1337,66,電影愛好者
8,李淼,662989,1172,191,我拉黑的 都是智力發(fā)展有問題的
9,朱炫,653648,205,52,悶騷而近妖 微博:大師兄_朱炫
import pandas as pd
df = pd.read_csv('user_info.csv', encoding = 'gb18030') #這里出現(xiàn)了一點中文編碼的問題浙炼,所以我指定了解碼方式。
df
image.png

再試一下用read_table唯袄,需要指定分隔符

df = pd.read_table('user_info.CSV', sep = ',', encoding = 'gb18030')
df
image.png

效果看起來跟read_csv完全一樣弯屈。

注意到這里出現(xiàn)了一欄Unnamed: 0,應該是CSV文本文件開頭的逗號引起的恋拷,我們可以用del 把這多余的一列刪除资厉。

del df['Unnamed']
df
image.png

成功的刪除了不要的‘Unnamed’。

將數(shù)據(jù)寫出到文本格式

df.to_csv('data.csv')
!type data.csv
,用戶,粉絲,答題,專欄文章,個人簡介
0,張佳瑋,1429532,3060,730,公眾號:張佳瑋寫字的地方
1,李開復,1015013,107,2,
2,黃繼新,810619,782,95,和知乎在一起
3,周源,777991,339,8,知乎 001 號員工
4,yolfilm,768913,1619,0,發(fā)蔬顾,然后禁宴偿,則捍格而不勝。
5,丁香醫(yī)生,759397,243,56,身體上的問題诀豁,來問丁香醫(yī)生
6,張亮,721254,1437,110,birth of cool
7,張小北,667155,1337,66,電影愛好者
8,李淼,662989,1172,191,我拉黑的 都是智力發(fā)展有問題的
9,朱炫,653648,205,52,悶騷而近妖 微博:大師兄_朱炫

重新將DataFrame寫出到文本文件中窄刘。
此外,還有Json數(shù)據(jù)舷胜。
通過json.loads()將JSON數(shù)據(jù)轉(zhuǎn)化為python形式都哭,json.dumps()則將python形式轉(zhuǎn)化為JSON數(shù)據(jù)。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市欺矫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌展氓,老刑警劉巖穆趴,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異遇汞,居然都是意外死亡未妹,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門空入,熙熙樓的掌柜王于貴愁眉苦臉地迎上來络它,“玉大人,你說我怎么就攤上這事歪赢』粒” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵埋凯,是天一觀的道長点楼。 經(jīng)常有香客問我,道長白对,這世上最難降的妖魔是什么掠廓? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮甩恼,結(jié)果婚禮上蟀瞧,老公的妹妹穿的比我還像新娘。我一直安慰自己条摸,他們只是感情好悦污,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著屈溉,像睡著了一般塞关。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上子巾,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天帆赢,我揣著相機與錄音,去河邊找鬼线梗。 笑死椰于,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的仪搔。 我是一名探鬼主播瘾婿,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了偏陪?” 一聲冷哼從身側(cè)響起抢呆,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎笛谦,沒想到半個月后抱虐,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡饥脑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年恳邀,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片灶轰。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡谣沸,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出笋颤,到底是詐尸還是另有隱情乳附,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布椰弊,位于F島的核電站许溅,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏秉版。R本人自食惡果不足惜贤重,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望清焕。 院中可真熱鬧并蝗,春花似錦、人聲如沸秸妥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽粥惧。三九已至键畴,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間突雪,已是汗流浹背起惕。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留咏删,地道東北人惹想。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像督函,于是被迫代替她去往敵國和親嘀粱。 傳聞我的和親對象是個殘疾皇子激挪,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容