? ? ? ? ? ? ? ? ? ? ? ? 第一課解密大數(shù)據(jù)入門課
課堂內(nèi)容梳理
一蹄溉、數(shù)據(jù)科學(xué)
定義:用科學(xué)的方法從各種結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)中提取有用信息您炉、知識(shí)的一門交叉型學(xué)科柒爵。
目標(biāo):通過數(shù)據(jù)收集、清洗赚爵、分析棉胀、可視化等過程,用數(shù)據(jù)來回答特定領(lǐng)域的問題冀膝,以及洞察特定領(lǐng)域的知識(shí)唁奢。
二、大數(shù)據(jù)相關(guān)職業(yè)分類
數(shù)據(jù)科學(xué)家(統(tǒng)計(jì)窝剖、以及編程)數(shù)學(xué)建模麻掸、數(shù)值分析。
數(shù)據(jù)分析師(編程赐纱、統(tǒng)計(jì)论笔、業(yè)務(wù)理解能力)采郎。
數(shù)據(jù)開發(fā)工程師(軟件開發(fā)工程師的一個(gè)分支千所,也叫碼農(nóng))大數(shù)據(jù)底層基礎(chǔ)設(shè)施搭建狂魔,數(shù)據(jù)倉庫的搭建、安全維護(hù)以及服務(wù)器日常運(yùn)維和管理淫痰。
數(shù)據(jù)產(chǎn)品經(jīng)理把數(shù)據(jù)變值為商業(yè)化的產(chǎn)品最楷。
互聯(lián)網(wǎng)廣告(都是數(shù)據(jù)產(chǎn)品)
精準(zhǔn)化的推薦和推送.......
數(shù)據(jù)運(yùn)營(yíng)(數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,在互聯(lián)網(wǎng)公司尤其如此~~~~)
數(shù)據(jù)科學(xué)技能包括:數(shù)學(xué)和統(tǒng)計(jì)學(xué)待错、計(jì)算機(jī)籽孙、特定領(lǐng)域的業(yè)務(wù)知識(shí),是一門特別綜合的學(xué)科火俄。
三犯建、數(shù)據(jù)分析師
數(shù)據(jù)分析師(DA)— — 數(shù)據(jù)科學(xué)職業(yè)的一個(gè)分支
你是怎么理解數(shù)據(jù)分析的,你覺得在數(shù)據(jù)分析中最關(guān)鍵的點(diǎn)是什么瓜客?
總結(jié):簡(jiǎn)單通俗易懂地說适瓦,數(shù)據(jù)分析就是從一堆數(shù)據(jù)中洞察知識(shí)和規(guī)律,用來支持和指導(dǎo)商業(yè)決策谱仪。
定義:數(shù)據(jù)分析是通過對(duì)足夠體量的數(shù)據(jù)集合進(jìn)行分析玻熙,以發(fā)現(xiàn)新穎的、有價(jià)值的且可以探索的模式疯攒。
目標(biāo):通過數(shù)據(jù)“發(fā)現(xiàn)”有意義的判斷和知識(shí)嗦随。
模型化:將上面的發(fā)現(xiàn)表達(dá)為模型
反應(yīng)知識(shí)的本質(zhì)
能進(jìn)一步預(yù)知世界
有預(yù)測(cè)能力
統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的核心。數(shù)據(jù)分析來于統(tǒng)計(jì)學(xué)敬尺,高于統(tǒng)計(jì)學(xué)枚尼。
四、數(shù)據(jù)分析方法論
地:了解前因后果
度:定義問題和決定的【數(shù)據(jù)指標(biāo)】數(shù)據(jù)分析最關(guān)鍵的一步I巴獭J鸹小!
就是說呜舒,從數(shù)據(jù)的角度思考這個(gè)問題锭汛,能反應(yīng)或者體現(xiàn)這個(gè)問題的關(guān)鍵指標(biāo)(特征值)是什么?
量:確定采集數(shù)據(jù)的方法
數(shù):采集數(shù)據(jù)和尋找數(shù)據(jù)特征
稱:數(shù)據(jù)分析和表達(dá)
勝:解釋分析結(jié)果和決策
本課程中計(jì)劃要講的統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn):
五袭蝗、統(tǒng)計(jì)分析和數(shù)據(jù)挖掘的區(qū)別
廣義的數(shù)據(jù)分析包括數(shù)據(jù)挖掘唤殴,狹義的數(shù)據(jù)分析是指統(tǒng)計(jì)分析。
統(tǒng)計(jì)分析需要人為的去做一個(gè)判斷到腥,是假設(shè)檢驗(yàn)朵逝。統(tǒng)計(jì)分析多用歸納法。
數(shù)據(jù)挖掘是通過算法去做深度的挖掘乡范,看算法模型跑出來是什么樣子的配名。數(shù)據(jù)挖掘多用演繹法啤咽。
演繹法:結(jié)論可從叫做前提的已知事實(shí)中必然地得出的推理。如果前提為真渠脉,則結(jié)果必然為真宇整。
歸納法:基于對(duì)特定代表的有限觀察,把性質(zhì)或關(guān)系歸結(jié)到類型芋膘×矍啵或基于對(duì)反復(fù)再現(xiàn)的現(xiàn)象的模式的有限觀察,來推導(dǎo)規(guī)律为朋。
六臂拓、Python數(shù)據(jù)分析進(jìn)階過程
學(xué)以致用,想學(xué)數(shù)據(jù)分析习寸,先把Python數(shù)據(jù)分析必備的三個(gè)包NumPy胶惰、pandas、matplotlab用起來O枷7踔汀!M埂剃斧!
用Python去寫爬蟲(80%的爬蟲)。
七忽你、商業(yè)數(shù)據(jù)分析范式(高頻小套路)
個(gè)人思考:就是把商業(yè)問題轉(zhuǎn)化為一個(gè)能用數(shù)據(jù)去衡量和表示的數(shù)據(jù)問題幼东。然后從數(shù)據(jù)的角度去思考和分析這個(gè)商業(yè)問題。(ps科雳,力學(xué)問題根蟹,通過各種力學(xué)分析,數(shù)學(xué)推導(dǎo)糟秘,最后都轉(zhuǎn)化為數(shù)學(xué)問題简逮,力學(xué)問題,本質(zhì)上就是數(shù)學(xué)問題尿赚。商業(yè)問題散庶,可以從數(shù)據(jù)、統(tǒng)計(jì)分析的角度去思考和衡量凌净,力學(xué)分析和商業(yè)數(shù)據(jù)分析悲龟,這兩者在思想上有異曲同工之處。)
八冰寻、商業(yè)DA的標(biāo)準(zhǔn)流程
個(gè)人思考:你怎么看這個(gè)圖的须教?這個(gè)圖可以結(jié)合下面的商業(yè)DA的底層核心元素的圖來一起思考。
九斩芭、商業(yè)DA的底層核心元素(商業(yè)DA的三駕馬車)
數(shù)據(jù)指標(biāo):比如網(wǎng)站的數(shù)據(jù)指標(biāo)轻腺、APP的數(shù)據(jù)指標(biāo)乐疆、銷售業(yè)務(wù)的數(shù)據(jù)指標(biāo)......數(shù)據(jù)指標(biāo),就是對(duì)人性揣摩的具體數(shù)據(jù)量化贬养。
數(shù)據(jù)字典:
數(shù)據(jù)指標(biāo)挤土,數(shù)據(jù)字典,數(shù)據(jù)標(biāo)簽煤蚌,這三個(gè)概念容易混啊~~~
十耕挨、數(shù)據(jù)分析常用模型
漏斗分析(逐層深入分析和分解)(轉(zhuǎn)化指標(biāo)、轉(zhuǎn)化率)尉桩。
十一、DA各行業(yè)的應(yīng)用(案例研究和分組實(shí)戰(zhàn))
電商數(shù)據(jù)分析
O2O數(shù)據(jù)分析
SNS(社交)數(shù)據(jù)分析
房地產(chǎn)價(jià)格波動(dòng)變化數(shù)據(jù)分析
十二贪庙、數(shù)據(jù)分析的局限(天花板)
數(shù)據(jù)分析和數(shù)據(jù)挖掘都是有邊界的蜘犁。任何事物都是有邊界的(類比,大學(xué)又不是沒學(xué)過數(shù)學(xué)和力學(xué)止邮,天花板就是指適用范圍这橙,邊界就是指成立的約束條件)。
任何事件或者結(jié)論的成立也是有前提約束條件的导披。
黑天鵝事件屈扎,未來不可預(yù)測(cè)。
阿里巴巴撩匕,已經(jīng)把數(shù)據(jù)做到上帝視角鹰晨,無所不能了。
課程時(shí)間安排止毕,12次課左右D@!1饬荨H碳病!2個(gè)月左右~~~~~