Excel
表格按照原始數(shù)據(jù)(sheet1)、加工數(shù)據(jù)(sheet2)微服,圖表(sheet3)的類型管理
vlookup和數(shù)據(jù)透視表是極具性價比的兩個技巧
數(shù)據(jù)可視化
數(shù)據(jù)分析界有一句經(jīng)典名言以蕴,字不如表辛孵,表不如圖宝与。
Excel可以100%完成上面的圖表习劫,但這知識基礎(chǔ)谤狡。后期的進階可視化卧檐,勢必會用到編程繪制,比如Python一行代碼就可以完成常見的多元分析逻澳。
還有BI(商業(yè)智能,實際上就是省去了報表的工作库物,數(shù)據(jù)多了都會用BI的),BI和圖表的區(qū)別在于BI擅長交互和報表潜必,更擅長解釋已經(jīng)發(fā)生和正在發(fā)生的數(shù)據(jù)。將要發(fā)生的數(shù)據(jù)屬于數(shù)據(jù)挖掘的方向谆沃。
數(shù)據(jù)可視化的學習就是三個過程:了解數(shù)據(jù)(圖表)、整合數(shù)據(jù)(BI)掂名、展示數(shù)據(jù)(信息化)
思維锌介、框架孔祸、方法論
SMART夹界、5W2H侣集、SWOT世分、4P理論踪央、六頂思考帽等框架。這些框架都是大巧不工的經(jīng)典
數(shù)據(jù)思維是不斷練習的結(jié)果
數(shù)據(jù)庫/Python/R
Excel對十萬條以內(nèi)的數(shù)據(jù)處理起來沒有問題瓢阴,但是互聯(lián)網(wǎng)行業(yè)就是不缺數(shù)據(jù)畅蹂,但凡產(chǎn)品有一點規(guī)模,數(shù)據(jù)量都是百萬起荣恐,這時候就需要學習數(shù)據(jù)庫液斜。從Excel到數(shù)據(jù)庫是數(shù)據(jù)處理效率的一大進步
主要圍繞著查詢(Select展開學習)
雖然SQL+Excel足夠應付入門級數(shù)據(jù)分析累贤,但是涉及到循環(huán)迭代、多元圖表的分析部分少漆,復雜度就呈幾何上升臼膏。更遑論數(shù)據(jù)挖掘這種高階玩法,我相信未來了解數(shù)據(jù)挖掘的產(chǎn)品和運營會有極強的競爭力
統(tǒng)計知識
很多產(chǎn)品和運營相關(guān)的數(shù)據(jù)分析文章检疫,沒有多少提及統(tǒng)計知識讶请。這是不嚴謹?shù)牡凰弧1热绠a(chǎn)品的AB測試屎媳,如果產(chǎn)品經(jīng)理并不清楚置信度的含義和概念,那么好的效果并不意味著真正的好论巍。尤其是5%這種非顯著的提高烛谊。比如運營一次活動,運營若不了解檢驗相關(guān)的概念嘉汰,那么如何去判別活動在數(shù)據(jù)上是有效果還是沒有效果丹禀?
這里推薦一本書《統(tǒng)計數(shù)字會撒謊》,很多的數(shù)據(jù)分析決策并不牢靠鞋怀。這本書講的都是統(tǒng)計學最基本的常識双泪,可是卻往往被人忽視,值得所有的產(chǎn)品經(jīng)理以及統(tǒng)計人員一讀
業(yè)務知識(用戶行為密似、產(chǎn)品焙矛、運營)
舉一個數(shù)據(jù)沙龍上的例子,一家O2O配送公司發(fā)現(xiàn)在重慶地區(qū)残腌,外賣員的送貨效率低于其他城市村斟,導致用戶的好評率降低∨酌ǎ總部的數(shù)據(jù)分析師建立了各個指標去分析原因蟆盹,都沒有找出來問題。后來在訪談中發(fā)覺闺金,因為重慶是山城逾滥,路面高低落差比較夸張,很多外賣人員的小電瓶上不了坡…所以導致送貨效率慢败匹。
這個案例中寨昙,我們只知道送貨員的送貨水平距離,即POI數(shù)據(jù)哎壳,根本不可能知道垂直距離的數(shù)據(jù)毅待。這就是數(shù)據(jù)的局限,也是只會看數(shù)據(jù)的分析師和接地氣分析師的最大差異归榕。
最后尸红,和數(shù)據(jù)相關(guān)的崗位
數(shù)據(jù)產(chǎn)品經(jīng)理(偏策劃)
機器學習(偏統(tǒng)計)
市場分析師(偏商業(yè))
大數(shù)據(jù)工程師(偏工程)