Python學(xué)習(xí)筆記-3群18組-杜杜狼-2017.7.17

完成相關(guān)視頻章節(jié)學(xué)習(xí):

2. 數(shù)據(jù)分析概況

是什么:用適當(dāng)?shù)姆治龇椒ㄗ迦牛瑢κ占臄?shù)據(jù)進行分析,總結(jié)規(guī)律定欧,提取有價值的信息渔呵,形成有效結(jié)論的過程

企業(yè)中的作用:現(xiàn)狀分析(過去:日報,周報砍鸠,月報)扩氢,原因分析(現(xiàn)在:現(xiàn)狀為什么會發(fā)生 專題),預(yù)測分析(未來:預(yù)測下一年的銷售量目標(biāo) ?制定季報爷辱,年報)

流程:明確目的和思路 -> 數(shù)據(jù)收集準(zhǔn)備 -> 數(shù)據(jù)處理 ->數(shù)據(jù)分析 -> 數(shù)據(jù)展現(xiàn) -> 報告撰寫

數(shù)據(jù)一般來源:企業(yè)內(nèi)部數(shù)據(jù)倉庫录豺,公開的出版物,互聯(lián)網(wǎng)托嚣,市場調(diào)查報告

基礎(chǔ)分析方法:對比分析巩检,分組分析,結(jié)構(gòu)分析示启,分布分析兢哭,交叉分析,矩陣分析

高級分析方法:回歸分析夫嗓,聚類分析迟螺,決策樹,神經(jīng)網(wǎng)絡(luò)舍咖,因子分析矩父,時間序列分析


3.Python概況

因自己非常熟悉,所以只看了視頻排霉,未做筆記

Why Python: 高效窍株,開發(fā)包齊全

數(shù)據(jù)處理:pandas

數(shù)據(jù)挖掘:sklearn

數(shù)據(jù)可視化:matplotlib


4. 安裝Anaconda


5. 使用Anaconda

6. 數(shù)據(jù)類型

變量命名規(guī)則:a-z, A-Z, digits, case sensitive,?

no _ , no digit at beginnnig

數(shù)據(jù)類型:

?1. Logical:True False 運算規(guī)則:&, |, not

?2. Numeric?

取整 //

求余 %

乘方 **

浮點數(shù)越界問題 Decimal('4,2') + Decimal('2.1') 對浮點數(shù)進行封裝

?3. Character

單引號,雙引號,或三引號把字符串包起來

轉(zhuǎn)義字符:\ or (r'xxxxxx')

表示換行: s = "abc \

efg" or 使用三引號:換行符等均會保留


7. 數(shù)據(jù)結(jié)構(gòu)

數(shù)據(jù)結(jié)構(gòu)是指相互之間存在一種或多種數(shù)據(jù)關(guān)系的數(shù)據(jù)集合

Pandas:

Series: 存儲一行或一列的數(shù)據(jù)球订,以及與之相關(guān)的index的集合

DataFrame: 用于存儲多行多列

默認索引都是從0開始的

切片:>=第一個索引后裸,<第二個索引


8. 向量化運算

特殊的并行計算方式,同一時間進行多次操作

Pandas的基本數(shù)據(jù)結(jié)構(gòu):序列和數(shù)據(jù)框

等差數(shù)列:numpy.arange(start, end, step)

numpy.power(r, 5)

lambda匿名函數(shù)

四則運算:相同位置進行函數(shù)計算冒滩,函數(shù)返回結(jié)果保留在相同位置

向量化運算原則:1. 極可能避免for循環(huán)微驶;2.過早的優(yōu)化是魔鬼


9. 數(shù)據(jù)導(dǎo)入

數(shù)據(jù)存在形式:

1. 文件:pandas

CSV: 列與列之間用逗號分隔

read_csv(file, encoding),?

TXT:沒有列名,不需要分隔符开睡,默認第一行作為表頭

read_table(file, names=[列名1因苹,列名2.。篇恒。]扶檐, sep="", encoding="utf-8")

Excel:默認文件第一行作為列名

read_excel(fileName, sheetName, names)

2.數(shù)據(jù)庫:MySQL, Access, SQL Server etc


10.數(shù)據(jù)導(dǎo)出

default:

to_csv(filePath, sep=",", index=TRUE, header=TRUE)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市胁艰,隨后出現(xiàn)的幾起案子蘸秘,更是在濱河造成了極大的恐慌,老刑警劉巖蝗茁,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異寻咒,居然都是意外死亡哮翘,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門毛秘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來饭寺,“玉大人,你說我怎么就攤上這事叫挟〖璩祝” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵抹恳,是天一觀的道長员凝。 經(jīng)常有香客問我,道長奋献,這世上最難降的妖魔是什么健霹? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮瓶蚂,結(jié)果婚禮上糖埋,老公的妹妹穿的比我還像新娘。我一直安慰自己窃这,他們只是感情好瞳别,可當(dāng)我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般祟敛。 火紅的嫁衣襯著肌膚如雪疤坝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天垒棋,我揣著相機與錄音卒煞,去河邊找鬼。 笑死叼架,一個胖子當(dāng)著我的面吹牛畔裕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播乖订,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼扮饶,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了乍构?” 一聲冷哼從身側(cè)響起甜无,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎哥遮,沒想到半個月后岂丘,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡眠饮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年奥帘,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仪召。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡寨蹋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扔茅,到底是詐尸還是另有隱情已旧,我是刑警寧澤,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布召娜,位于F島的核電站运褪,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏萤晴。R本人自食惡果不足惜吐句,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望店读。 院中可真熱鬧嗦枢,春花似錦、人聲如沸屯断。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至氧秘,卻和暖如春年鸳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背丸相。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工搔确, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人灭忠。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓膳算,卻偏偏與公主長得像,于是被迫代替她去往敵國和親弛作。 傳聞我的和親對象是個殘疾皇子涕蜂,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容