一直在說大數據眯分、數據分析、數據挖掘等。開始系統的學習下谱净,學習筆記如下:
1窑邦、數據分析:用適當的統計分析方法將收集來的大量數據進行分析,將他們加以匯總和理解并消化壕探,以求最大化地開發(fā)數據的功能冈钦,發(fā)揮數據的作用。為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程李请。
2瞧筛、數據分析的類別:描述性數據分析、探索性數據分析导盅、驗證性數據分型
描述性數據分析:初級數據分析较幌,常見的方法有對比分析法、平均分析法和交叉分析法白翻。
探索性數據分析:側重于在數據分析中發(fā)現新的特征乍炉,常見的方法有相關分析、因子分析和回歸分析等滤馍。
驗證性數據分析:側重于檢驗已有假設的真?zhèn)巫C明岛琼,常見的方法有相關分析、因子分子和回歸分析等巢株。
3槐瑞、數據分析的作用:現狀分析、原因分析和預測分析
現狀分析:告訴你過去發(fā)生了什么纯续。通過日常周報來完成随珠,如日報、周報和月報等形式猬错。
原因分析:告訴你某一現狀為什么發(fā)生窗看。通過專題分析來完成,根據企業(yè)運營情況選擇針對某一現狀進行原因分析倦炒。
預測分析:告訴你將來會發(fā)生什么显沈。通過專題分析來完成,通常在制定企業(yè)制度逢唤、年度等計劃時進行拉讯,其開展的頻度沒有現狀分析和原因分析高。
所以鳖藕,什么時候開展什么樣的數據分析魔慷,需要根據你的需求和目的來制定。
4著恩、數據分析六部曲:明確分析目的和思路---數據收集---數據處理---數據分析---數據展現---報告撰寫院尔。
明確分析目的和確定思路:明確分析目的之前先問問自己為什么要開展數據分析蜻展?通過這次數據分析我要解決什么問題?分析目的確定之后梳理分析思路邀摆,搭建分析框架纵顾。把分析目的分解成若干個不同的分析要點,即如何具體開展數據分析栋盹、需要從哪幾個角度進行分析施逾,采用哪些分析指標。
數據收集:按照確定的數據分析框架例获,收集相關數據的過程汉额。這兒的數據分為第一手數據為可直接獲取的數據,第二手數據為加工整理后得到的數據躏敢。數據來源包括數據庫闷愤、公開出版物,互聯網和市場調查件余。
數據處理:對收集到的數據進行加工處理讥脐,形成適合數據分析的樣式√淦鳎基本目的是從大量的旬渠,雜亂無章,難以理解的數據中端壳,提取并推導出對解決問題有價值告丢、有意義的數據。包括數據清洗损谦,數據轉換岖免、數據提取和數據計算。
數據分析:使用適當的數據分析方法和工具照捡,對處理過的數據進行分析颅湘,提取有價值的信息,形成有效結論的過程栗精。數據分析與數據處理的區(qū)別:數據處理與數據分析的基礎闯参,如果數據本身存在錯誤,那么即使采用最先進的數據分析方法悲立,得到的結果也是錯誤的鹿寨,不具備任何參考價值,甚至還會誤導決策薪夕。數據分析與數據挖掘的關系:數據挖掘是一種高級的數據分析方法脚草。數據挖掘側重解決四類數據分析問題:分類、聚類原献、關聯和預測玩讳,重點在尋找模式和規(guī)律涩蜘。
數據展現:數據通過表格和圖形的方式來呈現嚼贡。常見的數據圖表包括餅圖熏纯、柱形圖、條形圖粤策、折線圖樟澜、散點圖和雷達圖等,也可對這些圖表進一步加工整理叮盘,變?yōu)槲覀冃枰膱D形秩贰,金字塔圖,矩陣圖柔吼、漏斗圖毒费,帕累托圖等。
報告撰寫:數據分析報告是對整個數據分析過程的一個總結和呈現愈魏。通過報告把數據分析的起因觅玻、經過、結果和建議完整的表現出來培漏,供決策者參考溪厘。
5、數據分析的三大誤區(qū)
分析目的不明確牌柄,為分析而分析
缺乏業(yè)務知識畸悬,分析結果偏離實際
一味追求使用高級分析方法,熱衷研究模型
6珊佣、數據分析常用指標和術語
平均數
絕對數和相對數
百分比與百分點
頻數與頻率
比例與比率
倍數與番數
同比與環(huán)比
7蹋宦、數據分析師的職業(yè)發(fā)展
前景廣闊!V涠汀冷冗!
8、數據分析師的職業(yè)要求
懂業(yè)務
懂管理
懂分析
懂工具
懂設計
9虫碉、數據分析師的基本素質
態(tài)度嚴謹負責
好奇心強烈
邏輯思維清洗
擅長模仿學習
勇于創(chuàng)新