Task01:數(shù)據(jù)加載及探索性數(shù)據(jù)分析(第一章第1,2,3節(jié))(2天)

1 第一章:數(shù)據(jù)加載:

任務(wù)一:導(dǎo)入python庫

import numpy as np

import pandas as pd

import os

from matplotlib import pyplot as plt

*注:import numpy和from numpy import 的區(qū)別

兩種方式都是引入numpy庫中的所有函數(shù)罚拟、函數(shù)、對象臼氨、變量等状您,兩者的區(qū)別在于調(diào)用其中內(nèi)容時不同碗旅。

import numpy砚尽,則后續(xù)使用該庫下的屬性都需要在前面加上numpy

from numpy import *拆撼,則不需要加入容劳。以調(diào)用numpy中的random模塊為例,第一種方式要用numpy.random闸度,第二種方式只用random即可竭贩,一般推薦使用第一種方式

任務(wù)三:逐塊讀取數(shù)據(jù)

每1000行為一個數(shù)據(jù)模塊,逐塊讀取

df = pd.read_csv('train.csv',chunksize = 1000)

1

這時我們想要查看表格的前幾行莺禁,可以看到使用chunksize賦值之后 df的數(shù)據(jù)類型變成textfilereader之后head方法不再適用留量,需要用到命令df.get_chunk()

————————————————

df.shape ——行數(shù) 列數(shù)

df.dtypes——列數(shù)據(jù)類型

df.ndim ——數(shù)據(jù)維度

df.index——行索引

df.columns——列索引

df.values——對象值,二維ndarray數(shù)組

df.info() #查看數(shù)據(jù)類型結(jié)構(gòu)

df.describe()

df.head(10)——顯示前10行哟冬,默認(rèn)是5行

df.tail()——顯示末尾幾行楼熄,默認(rèn)是5

df.info()——相關(guān)系數(shù),如行數(shù)浩峡,列數(shù)可岂,列索引、列非空值個數(shù)翰灾,列類型缕粹,內(nèi)存占用

df.describe()——快速統(tǒng)計結(jié)果,計數(shù)纸淮、均值平斩、標(biāo)準(zhǔn)差、最大值咽块、四分?jǐn)?shù)绘面、最小值

df.isnull()——判斷數(shù)據(jù)是否為空,為空的地方返回True,其余地方返回False

# 注意:不同的操作系統(tǒng)保存下來可能會有亂碼揭璃,大家可以加入`encoding='GBK' 或者 ’encoding = ’utf-8`

encoding = 'utf-8'

df.to_csv('train_chinese.csv')

Series是帶標(biāo)簽的一維數(shù)組晚凿,可存儲整數(shù)、浮點數(shù)塘辅、字符串晃虫、python對象登類型的數(shù)據(jù),軸標(biāo)簽統(tǒng)稱為索引扣墩。調(diào)用pd.Series即可創(chuàng)建Series s=pd.Series(data, index=index)

Dataframe是由多種類型的列構(gòu)成的二維標(biāo)簽數(shù)據(jù)結(jié)構(gòu)哲银,類似于excel、SQL表呻惕、或series對象構(gòu)成的字典


原文鏈接:https://blog.csdn.net/weixin_45409985/article/details/119761173

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末荆责,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子亚脆,更是在濱河造成了極大的恐慌做院,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件濒持,死亡現(xiàn)場離奇詭異键耕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)柑营,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門屈雄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人官套,你說我怎么就攤上這事酒奶。” “怎么了奶赔?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵惋嚎,是天一觀的道長。 經(jīng)常有香客問我站刑,道長另伍,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任绞旅,我火速辦了婚禮质况,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘玻靡。我一直安慰自己,他們只是感情好中贝,可當(dāng)我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布囤捻。 她就那樣靜靜地躺著,像睡著了一般邻寿。 火紅的嫁衣襯著肌膚如雪蝎土。 梳的紋絲不亂的頭發(fā)上视哑,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天,我揣著相機(jī)與錄音誊涯,去河邊找鬼挡毅。 笑死,一個胖子當(dāng)著我的面吹牛暴构,可吹牛的內(nèi)容都是我干的跪呈。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼取逾,長吁一口氣:“原來是場噩夢啊……” “哼耗绿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起砾隅,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤误阻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后晴埂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體究反,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年儒洛,在試婚紗的時候發(fā)現(xiàn)自己被綠了精耐。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡晶丘,死狀恐怖黍氮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情浅浮,我是刑警寧澤沫浆,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站滚秩,受9級特大地震影響专执,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜郁油,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一本股、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧桐腌,春花似錦拄显、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春承边,著一層夾襖步出監(jiān)牢的瞬間遭殉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工博助, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留险污,地道東北人。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓富岳,卻偏偏與公主長得像蛔糯,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子城瞎,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容