pandas 數(shù)據(jù)加載

讀取數(shù)據(jù)

  • read_csv 默認(rèn)分隔符為逗號
  • read_table 默認(rèn)分隔符為制表符(\t)
  • read_fwf 沒有分隔符
  • read_clipboard 讀取剪切板中的數(shù)據(jù)
read_table 讀取csv文件時(shí),指定分隔符 sep=','

沒有列名時(shí)

  • 方法一:
    默認(rèn)分配列名 參數(shù) header=None
  • 方法二:
    變量names=['a', 'b', 'c', 'd', 'message']
    自定義列名 參數(shù) names=names
    將message列名作為索引 pd.read_csv('xx.csv', names=names, index_col='message')
    層次化索引 pd.read_csv('xx.csv', names=names, index_col=['b', 'message'])

其他分隔符,可以用正則表達(dá)式作為read_table的分隔符

pd.read_table('xxx.txt', sep='\s+') 如果是數(shù)量不等的空白符分割
參數(shù)skiprows跳過文件的第一行糖埋、第三行和第四行。 skiprows=[0, 2, 3]

read_csv和read_table參數(shù)

參數(shù) 描述
path 文件位置胞谭、url、文件型對象的字符串
sep或delimiter 對行中各字段進(jìn)行拆分的字符序列或正則表達(dá)式
header 用作列名的行號。默認(rèn)為0(第一行)。如果沒有header行就應(yīng)該設(shè)置為None
index_col 用作行索引的列編號或列名盐股。可以是單個(gè)名稱/數(shù)字或由多個(gè)名稱/數(shù)字組成的列表(層次化索引)
names 用于結(jié)果的列名列表耻卡,當(dāng)header=None時(shí)
skiprows 需要忽略的行數(shù)疯汁,或需要跳過的行號列表
na_values 一組用于替換NA的值,可以是列表或字典
nrows 需要讀取的行數(shù)(從文件開始處算起)
skip_footer 需要忽略的行數(shù)(從文件末尾處算起)
squeeze 如果數(shù)據(jù)經(jīng)解析后僅含一列劲赠,則返回Series
thousands 千位分隔符
chunksize 如設(shè)置=1000則讀取1000行,返回TextParser秸谢,可以進(jìn)行迭代

TextParser還有一個(gè)get_chunk方法凛澎,可以讀取任意大小的塊

將數(shù)據(jù)寫到文本格式

data = pd.read_csv('xxx.csv')
data.to_csv('xxx2.csv')
還可以用其他分割符 data.to_csv(sys.stdout, sep='|')
缺失值在輸出結(jié)果中會(huì)被表示為空字符串,用其他值來標(biāo)記 data.to_csv(sys.stdout, na_rep='NULL')
不寫入行和列的標(biāo)簽data.to_csv(sys.stdout, index=False, header=False)
以指定順序估蹄,寫出一部分的列 data.to_csv(sts.stdout, index=False, cols=['a', 'b', 'c'])

從csv中讀取Series塑煎,用from_csv比read_csv更方便,因?yàn)闊oheader行臭蚁,且第一列作索引

從Excel中讀取

獲取Excel對象 xls_file = pd.ExcelFile('xxx.xls')
讀取某個(gè)表 table = xls_file.parse('Sheet1')

從數(shù)據(jù)庫中存取

import pandas.io.sql as sql
sql.read_frame('select * from tablename', conn)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末最铁,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子垮兑,更是在濱河造成了極大的恐慌冷尉,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件系枪,死亡現(xiàn)場離奇詭異雀哨,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進(jìn)店門雾棺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來膊夹,“玉大人,你說我怎么就攤上這事捌浩》排伲” “怎么了?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵尸饺,是天一觀的道長进统。 經(jīng)常有香客問我,道長侵佃,這世上最難降的妖魔是什么麻昼? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮馋辈,結(jié)果婚禮上抚芦,老公的妹妹穿的比我還像新娘。我一直安慰自己迈螟,他們只是感情好叉抡,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著答毫,像睡著了一般褥民。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上洗搂,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天消返,我揣著相機(jī)與錄音,去河邊找鬼耘拇。 笑死撵颊,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的惫叛。 我是一名探鬼主播倡勇,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼嘉涌!你這毒婦竟也來了妻熊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤仑最,失蹤者是張志新(化名)和其女友劉穎扔役,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體警医,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡厅目,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片损敷。...
    茶點(diǎn)故事閱讀 38,605評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡葫笼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拗馒,到底是詐尸還是另有隱情路星,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布诱桂,位于F島的核電站洋丐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏挥等。R本人自食惡果不足惜友绝,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肝劲。 院中可真熱鬧迁客,春花似錦、人聲如沸辞槐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽榄檬。三九已至卜范,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鹿榜,已是汗流浹背海雪。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留舱殿,地道東北人奥裸。 一個(gè)月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像怀薛,于是被迫代替她去往敵國和親刺彩。 傳聞我的和親對象是個(gè)殘疾皇子迷郑,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評論 2 348