pandas學(xué)習(xí)(一)——數(shù)據(jù)的導(dǎo)入和導(dǎo)出

要學(xué)數(shù)據(jù)挖掘與分析第一步當(dāng)然是要導(dǎo)入數(shù)據(jù)到程序當(dāng)中或者從程序中導(dǎo)出數(shù)據(jù)到本地文件當(dāng)中探橱,這里我使用pandas庫提供的函數(shù)來舉例導(dǎo)入和導(dǎo)出數(shù)據(jù)。本文所用的環(huán)境:python :3.5 pandas:0.19.2 numpy:1.12.1熔吗,sqlalchemy 1.1.9 如果你的環(huán)境和這樣不一樣可能會有 細(xì)微差別每币。

pandas支持的數(shù)據(jù)格式

pandas作為一個強(qiáng)大的數(shù)據(jù)處理包先壕,支持比較多的數(shù)據(jù)處理格式翔脱,下面是一些常見格式數(shù)據(jù)的讀取方法,更多請參考:鏈接

函數(shù) 描述
read_table(filepath_or_buffer[, sep, ...]) 讀取普通分隔的數(shù)據(jù)
read_csv(filepath_or_buffer[, sep, ...]) 讀取csv格式的數(shù)據(jù)
read_excel(io[, sheetname, header, ...]) 讀取excel格式的數(shù)據(jù)
read_json([path_or_buf, orient, typ, dtype, ...]) 讀取json格式的數(shù)據(jù)
read_html(io[, match, flavor, header, ...]) 讀取html格式的 數(shù)據(jù)
read_sql(sql, con[, index_col, ...]) 讀取數(shù)據(jù)庫中的數(shù)據(jù)

前面兩個一般用的比較多媒鼓。

常見格式讀取示例

read_table舉例

example.csv是一個用逗號隔開的數(shù)據(jù)格式届吁。所以可以用read_table讀取,需要指定間隔符為逗號绿鸣。

import pandas as pd
data_csv = pd.read_table('example.csv',sep=',')
print("data_csv:")
print(data_csv)

   a   b   c   d message
0  1   2   3   4   hello
1  5   6   7   8   world
2  9  10  11  12     foo

但是有時隔符是不定個數(shù)的空格疚沐,這時可以用正則表達(dá)式。

import pandas as pd
data_txt = pd.read_table('example.txt',sep='\s+')
print("data_txt:")
print(data_txt)

此處由于數(shù)據(jù)中列名比數(shù)據(jù)列少1潮模,read_table會推斷第一行為列名亮蛔。

 A         B         C
aaa -0.264438 -1.026059 -0.619500
bbb  0.927272  0.302904 -0.032399
ccc -0.264273 -0.386314 -0.217601
ddd -0.871858 -0.348382  1.100491

read_csv舉例

import pandas as pd
data_csv2 = pd.read_csv('example.csv')
print("data_csv2:")
print(data_csv2)
   a   b   c   d message
0  1   2   3   4   hello
1  5   6   7   8   world
2  9  10  11  12     foo

read_exel示例

import pandas as pd
data_xlsx = pd.read_excel('example.xlsx')
print("data_xlsx:")
print(data_xlsx)

默認(rèn)是讀取第一個 sheet表格的,如果要制定讀取sheet表格則需要指定 sheetname參數(shù)

data_xlsx2 = pd.read_excel('example.xlsx',sheetname="Sheet2")
print("data_xlsx2:")
print(data_xlsx2)
    a   b   c   d message
0  11  12  13   4   hello
1  15  16  17  18   world
2  19  20  21  12     foo

更多參數(shù)可以參考官方手冊

read_json示例

data_json = pd.read_json('example.json')
print(data_json)

直接打開json文件的內(nèi)容如下:

[{"a": 1, "b": 2, "c": 3},
 {"a": 4, "b": 5, "c": 6},
 {"a": 7, "b": 8, "c": 9}]

讀取后 輸出的格式如下

   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

read_sql擎厢、read_sql_table和read_sql_query示例

import pymysql
import pandas as pd

con = pymysql.connect(host="127.0.0.1",user="root",password="password",db="world")
data_sql=pd.read_sql("select * from city limit 10",con)
print(data_sql)

數(shù)據(jù)庫用的是mysql究流,數(shù)據(jù)是里面自帶的測試數(shù)據(jù)辣吃。

   ID            Name CountryCode       District  Population
0   1           Kabul         AFG          Kabol     1780000
1   2        Qandahar         AFG       Qandahar      237500
2   3           Herat         AFG          Herat      186800
3   4  Mazar-e-Sharif         AFG          Balkh      127800
4   5       Amsterdam         NLD  Noord-Holland      731200

在使用read_sql_table和read_sql_query時需要使用sqlalchemy對數(shù)據(jù)庫進(jìn)行連接。這里仍然使用mysql為例芬探,其他數(shù)據(jù)庫的鏈接方式有細(xì)微差別神得。

import pandas as pd
import pymysql
from sqlalchemy import create_engine

con = create_engine('mysql+pymysql://root:password@localhost:3306/world')
data_sql2 = pd.read_sql_table("city", con)
print(data_sql2)

data_sql3 = pd.read_sql_query("select * from city limit 5", con)
print(data_sql3)

本文示例代碼和文件下載地址:鏈接
提取密碼:4koh

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市偷仿,隨后出現(xiàn)的幾起案子哩簿,更是在濱河造成了極大的恐慌,老刑警劉巖酝静,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件节榜,死亡現(xiàn)場離奇詭異,居然都是意外死亡别智,警方通過查閱死者的電腦和手機(jī)宗苍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來亿遂,“玉大人浓若,你說我怎么就攤上這事∩呤” “怎么了挪钓?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長耳舅。 經(jīng)常有香客問我碌上,道長,這世上最難降的妖魔是什么浦徊? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任馏予,我火速辦了婚禮,結(jié)果婚禮上盔性,老公的妹妹穿的比我還像新娘霞丧。我一直安慰自己,他們只是感情好冕香,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布蛹尝。 她就那樣靜靜地躺著,像睡著了一般悉尾。 火紅的嫁衣襯著肌膚如雪突那。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天构眯,我揣著相機(jī)與錄音愕难,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛猫缭,可吹牛的內(nèi)容都是我干的葱弟。 我是一名探鬼主播,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼饵骨,長吁一口氣:“原來是場噩夢啊……” “哼翘悉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起居触,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤妖混,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后轮洋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體制市,經(jīng)...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年弊予,在試婚紗的時候發(fā)現(xiàn)自己被綠了祥楣。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,505評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡汉柒,死狀恐怖误褪,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碾褂,我是刑警寧澤兽间,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站正塌,受9級特大地震影響嘀略,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜乓诽,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一帜羊、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧鸠天,春花似錦讼育、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至巍杈,卻和暖如春忧饭,著一層夾襖步出監(jiān)牢的瞬間扛伍,已是汗流浹背筷畦。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人鳖宾。 一個月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓吼砂,卻偏偏與公主長得像,于是被迫代替她去往敵國和親鼎文。 傳聞我的和親對象是個殘疾皇子渔肩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內(nèi)容