數(shù)據(jù)分析師業(yè)務模型基礎篇

一翰绊、數(shù)據(jù)分析的定義:

數(shù)據(jù)分析的目就是把隱藏在一大批看似雜亂無章的數(shù)據(jù)背后的信息集中和提煉出來佩谷,總結(jié)出所研究對象的內(nèi)在規(guī)律旁壮。


二、數(shù)據(jù)分析過程:

第一步谐檀、以事實為基礎提出假設抡谐,界定問題

第二步、將問題細分桐猬,形成互不重疊的子問題

第三步麦撵、進行數(shù)據(jù)收集與分析,證實或者證偽假設的問題

第四步溃肪、提出方案厦坛,推進問題的解決

第五步、執(zhí)行方案乍惊,驗證數(shù)據(jù)分析。


三放仗、數(shù)據(jù)的種類:


統(tǒng)計學上把數(shù)據(jù)分為三類润绎,分類數(shù)據(jù),順序數(shù)據(jù)诞挨,數(shù)值數(shù)據(jù)

分類型數(shù)據(jù):主要是對事物的類別進行描述莉撇,比如電商網(wǎng)站中的品類,社交系統(tǒng)中用戶的等級

順序型數(shù)據(jù):顧名思義惶傻,就是按照順序排列的數(shù)據(jù)棍郎,這種數(shù)據(jù)也是文字的,如時間順序银室,空間順序涂佃,優(yōu)先等級

數(shù)值型數(shù)據(jù):最常見的數(shù)據(jù)類型,用數(shù)字或文字描述事物蜈敢,是 數(shù)據(jù)分析的主要來源


四辜荠、數(shù)據(jù)分析的種類有三種:


1,描述性數(shù)據(jù)分析:常用對比分析法抓狭,平均分析法伯病,交叉分析法。

算數(shù)平均數(shù):算數(shù)平均法和加權(quán)算術(shù)平均法簡單方便否过,容易受異常值影響午笛。

幾何平均數(shù):主要用于 對比率,指數(shù)進行平均苗桂,用來計算平均發(fā)展速度药磺,用來計算復利下的平均年利率,在變量可能為負數(shù)和零的時候誉察,不能使用与涡,當數(shù)據(jù)呈倍數(shù)關(guān)系或者不對稱分布時適用性強。

調(diào)和平均數(shù):也叫倒數(shù)平均數(shù),主要是用來解決無法掌握總體單位數(shù)的情況下驼卖,只有每組的變量值和相應的標志總量氨肌,而需要得到平均數(shù)的問題,通常在遇到需要計算平均速度酌畜,平均利潤怎囚,平均成本指標時使用,尤其是觀測值是階段性變異的資料桥胞。

2恳守,探索性數(shù)據(jù)分析:相關(guān)分析法,因子分析法贩虾,回歸分析法

3催烘,驗證性數(shù)據(jù)分析:同上


五、數(shù)據(jù)分析的作用


主要三作用:現(xiàn)狀分析缎罢,原因分析伊群,預測分析


六、數(shù)據(jù)分析操作過程:


1.明確目標:搜集和明確數(shù)據(jù)分析上下游需求策精,資源舰始,能力和表達形式,時間節(jié)點等咽袜。

2.數(shù)據(jù)獲韧杈怼:從數(shù)據(jù)庫,公開出版物询刹,互聯(lián)網(wǎng)谜嫉,市場調(diào)查等方面搜集數(shù)據(jù)。

3.數(shù)據(jù)清洗:數(shù)據(jù)清洗范抓,數(shù)據(jù)轉(zhuǎn)化骄恶,數(shù)據(jù)提取,數(shù)據(jù)計算匕垫,具體包括數(shù)據(jù)整理入庫僧鲁,去除無效? 數(shù)據(jù),填充缺失信息象泵,選擇變量

? 第一階段:預處理寞秃,數(shù)據(jù)導入,元數(shù)據(jù)分析偶惠,觀察數(shù)據(jù)春寿,一般來說100萬條以下用excel,單機大量? 100萬條以上MYSQL+Navicat忽孽,單機海量1000萬條以上绑改,文本文件+python

? 第二階段:去除補齊有缺失的數(shù)據(jù)

? 第三階段:去除修改格式和內(nèi)容錯誤的數(shù)據(jù)

? 第四階段:去除不需要的數(shù)據(jù)

? 第五階段:去除不需要的數(shù)據(jù)

? 第六階段:關(guān)聯(lián)性驗證

4.數(shù)據(jù)整理:數(shù)據(jù)離散化谢床,數(shù)據(jù)標準化,對數(shù)據(jù)進行重新編碼厘线,對數(shù)據(jù)表進行統(tǒng)計計算识腿,生成各級指標,主要的目的是將清洗后的數(shù)據(jù)進行統(tǒng)一格式造壮,集中存儲渡讼。

5.數(shù)據(jù)分析:數(shù)據(jù)分析是將處理后的數(shù)據(jù)進行建模分析,描述分析耳璧,模型測試成箫,價值提取,高層次的分析方法也叫數(shù)據(jù)挖掘旨枯,數(shù)據(jù)挖掘側(cè)重解決四類問題蹬昌,分類,聚類攀隔,關(guān)聯(lián)凳厢,預測

6.數(shù)據(jù)展現(xiàn):餅圖,柱狀圖竞慢,條形圖,折線圖治泥,雷達圖等等

7.報告撰寫:將模型加載筹煮,對數(shù)據(jù)分析過程總結(jié)和呈現(xiàn)‘


七、數(shù)據(jù)分析報告邏輯


結(jié)論先行居夹,數(shù)據(jù)跟上败潦,邏輯自恰,描述觀點准脂,一般以總分總模式為主劫扒;


八、數(shù)據(jù)分析模型:


事實上是使用常見的企業(yè)分析方法論狸膏,設計數(shù)據(jù)分析的維度和范圍沟饥,常用的方法包括

1、思考模型

5W+2H:為什么湾戳,什么目的贤旷,誰,那個領域砾脑,什么時候幼驶,怎么做

金字塔模型

魚骨圖模型

事實--解釋--行為

水平思考,事實韧衣,感情盅藻,批判购桑,樂觀,創(chuàng)造氏淑,宏觀

2勃蜘、戰(zhàn)略分析工具

戰(zhàn)略-3C 公司,對手夸政,顧客

戰(zhàn)略規(guī)劃元旬,橫軸表示競爭要素,縱軸表示競爭水平

對業(yè)務進行優(yōu)先排序守问,縱軸表示公司優(yōu)勢匀归,橫軸表示市場價值

SWOT矩陣,優(yōu)勢耗帕,弱點穆端,機會,危機

影響要素仿便,五個力分析体啰,供應鏈的變化,需求鏈變化嗽仪,技術(shù)沖擊荒勇,新進入者,有無替代者

組織7S闻坚,保持戰(zhàn)略沽翔,共同價值,結(jié)構(gòu)窿凤,體制仅偎,員工,技能雳殊,組織文化


3.市場營銷分析模型


市場4P,產(chǎn)品橘沥,價格,渠道夯秃,廣告

銷售漏斗模型

根據(jù)收入分類的家庭數(shù)量的相對度分布座咆,

人口分布曲線,

意愿能力矩陣

用戶發(fā)布仓洼,技術(shù)革新者箫措,有號召力的人,早期用戶衬潦,后期跟風斤蔓,滯后采用的

服務營銷三角形,服務營銷的滲透的過程中镀岛,最初關(guān)注功能弦牡,然后轉(zhuǎn)移到渠道友驮,最后由品牌影響力

PPM分析,縱軸表示成長率驾锰,市場占有率卸留,分為,兒童業(yè)務椭豫,明星業(yè)務耻瑟,瘦狗業(yè)務,現(xiàn)金牛

VRIO分析赏酥,價值喳整,稀缺性,跟進難度裸扶,組織能力

4.常見管理模型


六西格瑪

PDCA循環(huán)框都,計劃,實施呵晨,改善魏保,驗證,

價值鏈摸屠,橫軸表示研究获询,開發(fā)您访,采購些阅,生產(chǎn)塘慕,流通,銷售戒傻,售后,縱軸表示競爭對手

緊迫性和重要性的矩陣蜂筹,重要性和緊迫性


九需纳、數(shù)據(jù)挖掘模型


聚類:kmeans、系統(tǒng)層次聚類

分類:相似度計算艺挪、決策樹

回歸:邏輯回歸不翩,線性回歸

降維:主成分分析、因子分析麻裳,對應分析/mds

文本挖掘:Word2vec口蝠、DOC2ver/LDA、文本相似度計算

時間序列等等

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末津坑,一起剝皮案震驚了整個濱河市妙蔗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌疆瑰,老刑警劉巖眉反,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件昙啄,死亡現(xiàn)場離奇詭異,居然都是意外死亡寸五,警方通過查閱死者的電腦和手機梳凛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來梳杏,“玉大人韧拒,你說我怎么就攤上這事∈裕” “怎么了叛溢?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長烁试。 經(jīng)常有香客問我雇初,道長,這世上最難降的妖魔是什么减响? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任靖诗,我火速辦了婚禮,結(jié)果婚禮上支示,老公的妹妹穿的比我還像新娘刊橘。我一直安慰自己,他們只是感情好颂鸿,可當我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布促绵。 她就那樣靜靜地躺著,像睡著了一般嘴纺。 火紅的嫁衣襯著肌膚如雪败晴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天栽渴,我揣著相機與錄音尖坤,去河邊找鬼。 笑死闲擦,一個胖子當著我的面吹牛慢味,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播墅冷,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼纯路,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了寞忿?” 一聲冷哼從身側(cè)響起驰唬,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后定嗓,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蜕琴,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年宵溅,在試婚紗的時候發(fā)現(xiàn)自己被綠了凌简。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡恃逻,死狀恐怖雏搂,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情寇损,我是刑警寧澤凸郑,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站矛市,受9級特大地震影響芙沥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜浊吏,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一而昨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧找田,春花似錦歌憨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至漆改,卻和暖如春心铃,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背挫剑。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工去扣, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人暮顺。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像秀存,于是被迫代替她去往敵國和親捶码。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容