《大數(shù)據(jù)思維》的讀書筆記
作 ? ?者:馬繼華
出版社:電子工業(yè)出版社
版 ? ?次:2016年7月第1版
作者簡介:
DATAREAL創(chuàng)始人中跌,電信與互聯(lián)網(wǎng)分析師慢逾,大數(shù)據(jù)專家晋渺。長期關(guān)注通信窄驹、互聯(lián)網(wǎng)违柏、金融和新媒體博烂。百度百家作者,微博簽約自媒體漱竖,騰訊科技年度最具影響力自媒體禽篱,移動互聯(lián)網(wǎng)影響力人物,知名培訓師馍惹,堅持每日一文超過十年躺率。
本書的重點內(nèi)容及感悟:
第1章、大數(shù)據(jù)與人腦的較量
1万矾、QQ與微信的區(qū)別:“在嗎”悼吱?對用戶的使用行為研究最充分的,無疑是阿里巴巴良狈。很多人都發(fā)現(xiàn)后添,只要你打開“淘寶”,首頁上的推薦就讓你欲罷不能薪丁,特別是網(wǎng)頁中間那張?zhí)鴦拥拇髨D遇西,怎么看都是自己想要的商品。是的严嗜,淘寶說要實現(xiàn)千人千面努溃,每個人看到的網(wǎng)頁都是不一樣的。因為那個頁面就是根據(jù)你最近的搜索阻问、下單等歷史行為結(jié)合你的各種資料進行“定制”的梧税。
太有同感,個性化的網(wǎng)頁。每次打開淘寶的網(wǎng)頁呈現(xiàn)的都是讓自己想購買的東西第队。
2哮塞、其實,每個人生活的痕跡就是大數(shù)據(jù)凳谦。如果有一種技術(shù)可以輕易地記下你的腳印忆畅,那么你的愛好、習慣尸执、職業(yè)家凯、經(jīng)濟狀況、婚姻狀況都可以通過你去的地方精確展現(xiàn)出來如失。只不過問題在于绊诲,腳印這種數(shù)據(jù)非常難以記錄。
3褪贵、貓眼電影整合了2015年上半年的售票數(shù)據(jù)掂之,報告根據(jù)用戶購買電影票的習慣,結(jié)合用戶在美團上的相關(guān)消費行為脆丁,發(fā)現(xiàn)了有意思的現(xiàn)象世舰。數(shù)據(jù)顯示,用戶在購買電影的同時槽卫,有79%會進行餐飲消費跟压,10%會選擇唱K、桌游歼培、足療等悠閑活動裆馒,還是11%會選擇酒店消費,其中有81%選擇的是經(jīng)濟型酒店丐怯。
4喷好、大數(shù)據(jù)預測世界杯真的很準嗎?百度預測世界杯的主要數(shù)據(jù)來源包括:百度搜索數(shù)據(jù)读跷、球隊基礎(chǔ)數(shù)據(jù)梗搅、球員基礎(chǔ)數(shù)據(jù)、賠率市場數(shù)據(jù)效览。百度大數(shù)據(jù)通過分析過去5年987支球隊的3.7萬場比賽數(shù)據(jù)无切,共涉及29610名球員,112丐枉,285哆键,543條相關(guān)數(shù)據(jù),構(gòu)建了足球賽事預測模型瘦锹。準確率為75%籍嘹。評:百度用的是傳統(tǒng)統(tǒng)計分析闪盔,注重近期球隊和球員表現(xiàn),這種預測是至今為止在技術(shù)上最穩(wěn)定的方法辱士。
5泪掀、數(shù)據(jù)分析的基礎(chǔ):一般的分析,主要可以分為描述性分析颂碘、探測性分析和因果性分析三種异赫,三種分析有時候是獨立的,有時候是密切結(jié)合在一起头岔,但大多數(shù)企業(yè)的分析都會是逐步展開的塔拳。我們一般要先進行描述性的分析,然后根據(jù)描述的結(jié)果進行探測性分析峡竣,探測完成以后開展因果分析靠抑,三家共同構(gòu)成了完整的經(jīng)營分析。第一澎胡、描述性分析比喻為考古。要把古墓中的一切說清楚娩鹉,到底挖掘出了多少寶貝攻谁,是否有盜油等。第二弯予、探測性分析戚宦。接下來我們需要明白的就是這個墓到底是什么年代的,墓主人是誰等等锈嫩。探測性分析往往是建立在描述性分析之上的受楼,沒有清晰的描述,就很難去探測呼寸。探測就是要發(fā)現(xiàn)問題艳汽。比如通過對公司情況的描述,我們進行對比及評估对雪,可以發(fā)現(xiàn)公司在經(jīng)營中存在哪些問題河狐,主要問題是什么,公司用戶數(shù)增長或下降是否嚴重等瑟捣〔鲆眨總之,探測性分析是用來發(fā)現(xiàn)問題和指向問題的迈套,而尋找問題和癥結(jié)所在正是企業(yè)經(jīng)營管理中非常重要的工作內(nèi)容捐祠。第三、因果分析:發(fā)現(xiàn)問題之后就需要明白問題是怎么產(chǎn)生的桑李,到底因何而來踱蛀,目的是解決問題窿给。因果分析是要找到問題的成因,并經(jīng)過嚴密的推理和實證確定星岗,以后就是針對原因想出解決方案填大,把影響經(jīng)營的因素解決掉,讓企業(yè)的經(jīng)營回歸正常軌道俏橘,或者更上一層樓允华。
數(shù)據(jù)分析三步曲:描述性分析->探測性分析->因果分析。
1)帶著思維去分析寥掐。
2)先把研究對象的方方面面吃透靴寂。作為數(shù)據(jù)分析人士,我們首要做的并非是掌握太多高級分析方法百炬,而是要對分析的對象充分了解剖踊,十分關(guān)注。對于任何毫不知曉的領(lǐng)域衫贬,發(fā)表任何看法都是草率的德澈,即使是博士院士,在其無知的領(lǐng)域也只能是無知固惯,其能力不會比普通人多哪怕一點點梆造。做企業(yè)分析的人镇辉,就必須花力氣最大限度地了解企業(yè)的過去和現(xiàn)在、業(yè)務(wù)和產(chǎn)品贴捡,銷售與服務(wù)忽肛,人員和管理,當你爛熟悉于心的時候源祈,就可能具備了”第六感“煎源,也許拍拍腦門都可以做出恰當?shù)臎Q策。反之香缺,對企業(yè)的了解一知半解手销,即便掌握再高超的分析方法,也不會有用武之地图张,強行使用锋拖,可能得到南轅北轍的結(jié)論诈悍。
3)快,才能解決現(xiàn)實問題兽埃。數(shù)據(jù)分析也一樣侥钳,如果分析的過程太過緩慢,不管你分析的結(jié)果有多正確柄错,都可能因為時效性的問題而變得一文不值舷夺。企業(yè)的經(jīng)營分析等不了。一個企業(yè)承包遇到了經(jīng)營困難售貌,或者客戶在流失给猾,或者產(chǎn)品銷售不暢,或者客戶服務(wù)評價在降低颂跨,我們要找到原因敢伸,就必須嚴格遵守時間限制,用最快的速度將分析完成恒削,拖延幾個月甚至幾天都可能變得毫無價值池颈。
4)理解管理者的意圖:企業(yè)都是有經(jīng)營目標的,企業(yè)的管理者也有自己的想法钓丰,任何的企業(yè)分析都需要充分結(jié)合這樣的必然前提躯砰。理解管理者的意圖,為特定的目標服務(wù)斑粱,每位分析人員都會面臨這樣的境況弃揽,只有理論聯(lián)系實際做出合情合理的分析料仗,才會讓分析變得有價值绽慈。
6粱坤、結(jié)構(gòu)化思維與分析的類別
一般來說,要做好數(shù)據(jù)分析尚揣,需要從思維、方法掖举、模型和解讀四個方面來行動快骗。思維是最高階,也是做好數(shù)據(jù)分析的基礎(chǔ)塔次。和很多人想法并不一致方篮,做好數(shù)據(jù)分析并不是首先要強化自己的EXCEL或者SPSS操作能力,甚至也不是什么統(tǒng)計學知識励负,而是在于鍛煉自己的思維能力藕溅。
方法比思維低一個層次。所謂的方法继榆,主要是將我們已經(jīng)具備的思維能力轉(zhuǎn)化為具體的行為巾表,通過適當?shù)姆绞椒椒▉斫鉀Q具體的問題汁掠。思維是解決問題的靈魂,而方法是解決問題的肉身集币,是執(zhí)行者考阱,是行動派。
結(jié)構(gòu)化的思維----思維導圖鞠苟。哈哈哈哈乞榨,我的思維導圖基礎(chǔ)也可以助我的數(shù)據(jù)分析之路。
7偶妖、人腦在大數(shù)據(jù)時代并沒有過時
對于圍棋來說姜凄,現(xiàn)在的計算機下棋也是基于對圍棋棋譜的學習,人類曾經(jīng)達到的高度就是圍棋所能達到的最高高度趾访,因為計算機自己還不會創(chuàng)造态秧,也沒有自我意識,數(shù)據(jù)所能表達出來的東西最多只能和數(shù)據(jù)質(zhì)量一樣好扼鞋,不可能超越申鱼。如果哪一天,計算機可以去創(chuàng)造性地下棋云头,完全不顧及以往的棋譜捐友,那才是真正的智能。
從分析的角度來看溃槐,在方法分類上匣砖,一般會分成定性分析和定量分析。簡單地說昏滴,定性研究主要是回答“為什么”的問題猴鲫,我們應(yīng)用定性研究進行“認識、發(fā)現(xiàn)谣殊、判斷拂共、了解”,而不能使用它進行“測量姻几、監(jiān)控宜狐、估計、預測”蛇捌,這方面的問題應(yīng)當用定量研究的方法去解決抚恒。定笥分析就是研究對象進行“質(zhì)”的方面的分析,運用歸納和演繹络拌、分析與綜合及抽象與概括等方法俭驮,對獲得的各種材料進行思維加工,從而能去粗取精盒音,去偽存真表鳍,由表及里馅而,達到認識事物本質(zhì),揭示內(nèi)在規(guī)律的作用譬圣。定量分析是對社會現(xiàn)象的數(shù)量特征瓮恭、數(shù)量分析與數(shù)量變化的分析,功能在于揭示和描述社會現(xiàn)象的相互作用和發(fā)展趨勢厘熟。
從分析的內(nèi)容看屯蹦,定性分析與定量分析應(yīng)該是統(tǒng)一的,相互補充的绳姨;定性分析是定量分析的基本前提登澜,沒有定性的定量是一種盲目的、毫無價值的定量飘庄;定量分析使定量分析更加科學脑蠕、準確。它可以促使定性分析得出廣泛而深入的結(jié)論跪削。
在大數(shù)據(jù)時代谴仙,很多人覺得定性分析已經(jīng)無用,我們依靠強大的計算機技術(shù)可以通過數(shù)量解決一切問題碾盐,但計算機至今還不是人腦晃跺,大數(shù)據(jù)信息再全面也很難有足夠的智慧,更無法參透各國文字之間的玄妙毫玖。
第2章掀虎、大數(shù)據(jù)看起來是無所不能
1、根據(jù)一般的理解付枫,大數(shù)據(jù)應(yīng)該是圍繞特定的主題而將看來毫不相干的數(shù)據(jù)集成在一起構(gòu)成統(tǒng)一視力烹玉,然后尋找到期間合理的關(guān)聯(lián)因素,從而超越簡單的統(tǒng)計分析而得到意想不到的結(jié)論励背。
2春霍、賭場:進賭場辦一張電子磁卡砸西,相關(guān)的信息已經(jīng)被賭場獲取了叶眉。比如說第幾次來,大概年齡芹枷、種族衅疙、職業(yè)等。賭場有一個龐大的數(shù)據(jù)庫鸳慈,拿到數(shù)據(jù)后就做預測饱溢。每個人都有一個痛苦點。當在這個賭場里輸?shù)腻X超過了痛苦點后走芋,這個人會從此再也不踏進這家賭場一步绩郎。從賭場的角度潘鲫,最好的選擇是當賭客快要達到痛苦點時,讓賭客住手肋杖。.....當你輸?shù)?800美元的時候溉仑,奇跡發(fā)生了,你旁邊會突然出現(xiàn)一個年輕貌美的公關(guān)經(jīng)理状植,說:“先生玩累了吧浊竟,我們的賭場剛請了一個法國名廚,會作世界一流的法國大餐津畸。恭喜你振定,你被選為幸運顧客。要不帶著家人去享受法國大餐肉拓。休息一下吧后频。”為什么服務(wù)這么好暖途。因為你的最后一分錢已經(jīng)被它榨完了徘郭。為什么賭場能夠精準預測你的行為?因為你的行為和別人的行為不一樣丧肴。
活在當下残揉,是互聯(lián)網(wǎng)的正常思維,我們更關(guān)注發(fā)生了什么芋浮,而不再用心思于為何發(fā)生抱环。大數(shù)據(jù)之于商家,就是通過采集的大量用戶行為數(shù)據(jù)尋找“眾數(shù)”纸巷,發(fā)現(xiàn)共同的興趣點或痛點镇草,然后投其所好地進行產(chǎn)品設(shè)計和營銷。
3瘤旨、《紙牌屋》火了梯啤,如是你不看,那就會被人覺得過時了存哲。因為因宇,這部劇是站在大數(shù)據(jù)的基礎(chǔ)上,根據(jù)你的喜好進行設(shè)計的祟偷,你愛看什么就演什么察滑,你愛怎么看就給你怎么演。央視的元宵晚會修肠,把網(wǎng)絡(luò)上北京臺春晚評價很高的相聲安排進來贺辰,這也是大數(shù)據(jù)的一種體現(xiàn)。
4、大數(shù)據(jù)是商業(yè)創(chuàng)新的利器饲化,也是改變?nèi)祟愇幕碾p刃劍莽鸭,是個別人的大財富工具,也是讓偉大更加落寞的厚壁吃靠。那些超越時代的人和作品會更孤獨蒋川。大數(shù)據(jù),很好用撩笆,關(guān)鍵看誰來用捺球,怎么用。
5夕冲、實事求是地說氮兵,大數(shù)據(jù)確實可以提升道路管理水平,但大數(shù)據(jù)卻無法解決信息溝通中的群體錯位決策歹鱼,也無法解決超出負荷的剛性需求到來的道路絕對擁堵泣栈,更沒有辦法應(yīng)對隨時可能出現(xiàn)的隨機性事故影響。大數(shù)據(jù)對于節(jié)假日期間的交通擁堵問題弥姻,絕對是有心無力南片。
6、不僅是低價庭敦,金融去帶來的大數(shù)據(jù)處理能力疼进,還能夠讓金融機構(gòu)利用大數(shù)據(jù),低成本地實現(xiàn)信貸業(yè)務(wù)秧廉。金融機構(gòu)可以在線判斷用戶信用水平伞广,無需用戶再當面提交各種證明材料,或是擔保抵押疼电,就能讓那些小微企業(yè)嚼锄,草根用戶非常方便地通過網(wǎng)絡(luò)貸款,而且貸款成本成會更低蔽豺。
7区丑、用大數(shù)據(jù)方法保護大數(shù)據(jù)的安全。既然是大數(shù)據(jù)修陡,那就有可能也用大數(shù)據(jù)的方法來進行數(shù)據(jù)保護沧侥,很多公司都在進行這方面的科技攻關(guān),包括網(wǎng)絡(luò)層面的安全解決方案濒析,也包括應(yīng)用層面的用戶信息保護機制正什。........網(wǎng)絡(luò)安全要依賴網(wǎng)絡(luò)管理上的大數(shù)據(jù)應(yīng)用啥纸;用戶在應(yīng)用端的安全更需要大數(shù)據(jù)理念号杏。(我們每個人在使用PC或手機等登錄賬號、輸入密碼、點擊鏈接等也會形成自己的習慣動作盾致,這些動作形成的大數(shù)據(jù)信息也會被記錄和分析主经,如果哪一天哪一次系統(tǒng)突然發(fā)現(xiàn)這些動作等出現(xiàn)了異常,就會采取攔截措施庭惜。通過一系列的新增信息核對步驟來保證交易的安全罩驻,特殊條件下會中止交易與資金所有人進行直接溝通核實)
8、通信運營商多年來都在全面采集用戶各方面的通信使用信息护赊,包括用戶的個有背景資料惠遏,實時的移動位置信息,如今還可以獲得更多的移動互聯(lián)網(wǎng)應(yīng)用情況骏啰,只要是加以合理利用节吮,完全可以準確清晰地分析出行走路線,旅游偏好等判耕,成為大數(shù)據(jù)應(yīng)用的樣板透绩。
第3章、七種必備的大數(shù)據(jù)思維
1壁熄、1-0≠8-7帚豪。我們在分析問題的時候草丧,不僅要看最終的結(jié)果仙蚜,也要看其中的過程,即使結(jié)果一樣,如果過程不一樣,也不能得到一樣的結(jié)論角寸。有些時候亿柑,即使結(jié)果有差異,但過程卻非常類似或一樣,那么兩者可能差異并不大故慈。做分析,就是要從量變看到未來的質(zhì)變闸度,或者于量變不顯著的時候就看到內(nèi)在的質(zhì)變。
2浩峡、統(tǒng)計,一門與賭博密不可分的技術(shù):要做分析萎馅,自然離不開統(tǒng)計學塘辅,而統(tǒng)計學是建立在概率論基礎(chǔ)之上的學科扛吞,與大數(shù)據(jù)實際上“格格不入”。我們現(xiàn)在談的大數(shù)據(jù)村视,如果非要找一個相對的詞匯,應(yīng)該叫做抽樣數(shù)據(jù)蓖议,也就是說虏杰,大數(shù)據(jù)并不是強調(diào)大,而是強調(diào)全勒虾。
3纺阔、雖然統(tǒng)計學與大數(shù)據(jù)有一定的差異,甚至在基礎(chǔ)理論上風馬牛不相及修然,可統(tǒng)計學的一些方法還是可以在大數(shù)據(jù)分析中使用的笛钝。記住质况,不是全部〔C遥基礎(chǔ)的統(tǒng)計分析结榄,包括匯總、排序囤捻、集中趨勢臼朗、離散程度、分布形狀蝎土,也包括相關(guān)分析视哑、回歸分析、聚類分析誊涯、因子分析等挡毅,也都有用武之地。大數(shù)據(jù)分析并不一定比統(tǒng)計分析更準確暴构,因為大數(shù)據(jù)分析經(jīng)常會遇到異彻虺剩或特異情況的干擾,即所謂的一顆老鼠屎壞一鍋粥取逾。
4耗绿、串聯(lián),一種簡單實用的日常分析法菌赖。在大數(shù)據(jù)分析的時候缭乘,我們借助某條線索,可以是時間軸琉用,也可以是人物堕绩、地點或者其他關(guān)聯(lián)性的事物,把很多相關(guān)的事項連接起來邑时,從而讓人有一目了然的結(jié)論奴紧。串聯(lián)的分析方法往往需要長期的資料積累,更需要專業(yè)性的知識儲備晶丘,看似簡單的邏輯使用起來卻很難黍氮。
5、對比浅浮,最常用也最實用的分析方法:我們?nèi)粘_M行的比較分析沫浆,可以從與計劃對比、與上期對比滚秩、與去年同期专执、與歷史最好水平對比、與總體平均水平對比郁油、與國際國內(nèi)最好水平對比這些角度進行本股,也還要考慮數(shù)據(jù)絕對數(shù)與相對數(shù)的比較攀痊。
6、統(tǒng)計學依據(jù)數(shù)據(jù)的計量尺度將數(shù)據(jù)劃分為四大類:即定距型數(shù)據(jù)拄显、定序型數(shù)據(jù)苟径、定類型數(shù)據(jù)和定比型數(shù)據(jù)。第一躬审、定距型數(shù)據(jù)棘街,可以求加減平均值等,但不存在基準0值盒件,即當變量值為0時不是表示沒有蹬碧。第二舱禽、定序型數(shù)據(jù)炒刁。具有內(nèi)在固有大小或高低順序,但它不同于定距型數(shù)據(jù)誊稚,一般可以用數(shù)值或字符表示翔始。如職稱變量可以有低級、中級和高級三個取值里伯。第三城瞎、定類型數(shù)據(jù)是指沒有內(nèi)在固定大小或高低順序,一般以數(shù)值疾瓮、字符脖镀、文字表示的分類數(shù)據(jù),比如性別男和女狼电。第四蜒灰、定比型變量就是常說的數(shù)值變量,擁有零值及數(shù)據(jù)間的距離是相等被定義的肩碟,通常指諸如身高强窖、體重、血壓等連續(xù)性數(shù)據(jù)削祈。從這四類數(shù)據(jù)出發(fā)翅溺,我們可以簡單地理解,最好用的分析數(shù)據(jù)是定比數(shù)據(jù)髓抑,也就那些連續(xù)性的數(shù)據(jù)變量咙崎,如收入、利潤吨拍、用戶數(shù)等褪猛,而定類數(shù)據(jù)分析能力最差,一般只能進行類別之內(nèi)的匯總密末,如果要跨類別進行統(tǒng)計握爷,往往需要將不同的類別先綜合成高一級別的大類跛璧。
7、一般來說新啼,分析問題可以堅持從大到小追城、從全局到局部的原則。分析問題燥撞,不管多牛的分析師座柱,都只能以做到手頭的數(shù)據(jù)為最好,不可能超越其中去胡思亂想物舒,但在很多情況下色洞,需要補充外圍的數(shù)據(jù)冠胯,這樣分析出的結(jié)果才更有價值火诸。
例子:掙錢的故事:
引:“張三”以7.5%年收益將10000元通過“招財當鋪”借給“白家藥鋪”,“張三”因用錢又以6.0%的年利息通過“招財當鋪”向“眾家”借了10000元荠察。一年到期置蜀,“眾家”通過“招財當鋪”領(lǐng)回了“白家藥鋪”的6%的利息∠づ瑁“張三”額外向“招財當鋪”支付了0.1%的手續(xù)費盯荤。整個過程中,“張三”只用了幾天的時間焕盟,就賺到了1.5%左右的收益秋秤,要知道,在銀行這可是要一年的時間成本脚翘。從此灼卢,張三將拿回的錢再次投入,十天后再一個輪回堰怨,愉快地玩了起來痢法。一年后奥溺,他一共玩了30回匿值,回報是(1+1.5%)的30次方蹦肴,高達60%的收益啊。
很多人說揽涮,為啥眾鄉(xiāng)鄰不直接投資給白家獲取那7.5%抠藕,非要讓張三賺了一次差價呢?因為對于白家藥鋪蒋困,向哪么多人去直接借錢盾似,太麻煩,也沒有那么快捷,誰讓張三錢多呢零院。
最近一段時間溉跃,螞蟻金融服務(wù)推出的招財寶平臺受到了“小確幸們”的歡迎,因為其賺錢的方法就是讓無數(shù)個“張三”實現(xiàn)了資金的高收益和流動性的兼得告抄。特別是招財寶平臺推出的萬能險撰茎。
萬能險的投資風險并不高,比P2P(網(wǎng)貸)風險要低得多打洼。招財寶的萬能產(chǎn)品風險比直接在保險公司購買萬能險的風險還要低得多龄糊。
變現(xiàn)并沒有增加風險,風險的高低與變現(xiàn)次數(shù)無關(guān)募疮。招財寶的“變現(xiàn)”是一種具有劃時代的創(chuàng)新炫惩,這種變現(xiàn)與金融領(lǐng)域的套利不同,在風險并不增加的情況下阿浓,實現(xiàn)了資金的快速流動他嚷,同時以市場化的方式實現(xiàn)了借貸雙方的利率自由博弈。
簡單地說搔扁,變現(xiàn)就是購買了理財產(chǎn)品的人通過招財寶平臺拿回了自己已經(jīng)投資出去的錢爸舒。投資到招財寶平臺產(chǎn)品的人蟋字,購買了半年稿蹲、一年或者兩年期的理財產(chǎn)品之后,不用持有的到期鹊奖,如果需要把錢取回苛聘,可以使用“變現(xiàn)”的方式,向另外的投資人(在招財寶里預約或購買個人貸的人)借貸忠聚,等于是將貸來的錢轉(zhuǎn)交給了自己要來投入資金的那家機構(gòu)设哗,換回自己的錢。
實際上两蟀,在招財寶平臺上网梢,很多人買了萬能險之后進行變現(xiàn),而變現(xiàn)出來的個人貸被人購買之后可能再次選擇利率低的時候進行變更赂毯,從而出現(xiàn)了下一個接盤者战虏,以此類推。不管多少次的變現(xiàn)党涕,萬能險的產(chǎn)品收益是7.5%烦感,這是所有人收益總和。多次多人變現(xiàn)只是將這個總收益進行更強的拆分而已膛堤。
招財寶實現(xiàn)了多方共贏手趣,真正的輸家只有銀行。在招財寶的平臺上肥荔,賣萬能險的公司绿渣、購買萬能險的人朝群、變現(xiàn)接盤的人、再變現(xiàn)的人中符、再接盤的人潜圃、招財寶平臺、財產(chǎn)保險公司這些參與者都是獲益者舟茶。建設(shè)銀行的行長和總理總“銀行是弱勢群體”谭期,并不一定是玩笑話,因為這樣的互聯(lián)網(wǎng)金融的創(chuàng)新確確實實是已經(jīng)將銀行變成了弱勢群體吧凉。
問題:為什么不是所有人都去買那個高收益的7.5%產(chǎn)品卻去接別人的盤呢隧出?
一是、更多的人不知道還可以買到7.5%的產(chǎn)品阀捅,因為這些所謂的高收益產(chǎn)品并不是放在所有渠道的胀瞪,最初的時候,這些7.5%的高收益產(chǎn)品只會放到支付寶的PC頁面饲鄙。你想想自己有多久沒打開過支付寶PC頁面了凄诞,這就叫信息不對稱。
二是忍级、一些人風險意識很強帆谍,在招財寶里,那些收益相對低一些的個人貸轴咱,平臺是通過第三方的擔保機構(gòu)進行“保本保息”的汛蝙,而收益相對高的萬能險、債券等標明的是“保證本金”朴肺,簡單的差別就讓很多人望而卻步窖剑。
三是、一些人的錢實在是不多戈稿,即便是投資以1000元起步西土,也有人達不到,或者放在余額寶里的錢不是很多鞍盗,買不了更高利息的理財產(chǎn)品需了。
綜合起來,大概也就是有這三種原因橡疼。還是金融賺錢的三件法寶援所,有信息賺沒信息,風險高掙風險低欣除,有錢的比沒錢的賺得多住拭。
8、大數(shù)據(jù)分析的關(guān)鍵在于有用。大數(shù)據(jù)分析的成功不僅僅在于應(yīng)用滔岳,更在于能夠有價值的應(yīng)用杠娱,粗制濫造地去應(yīng)用很可能導致徹底的失敗。做大數(shù)據(jù)分析谱煤,至少要做到以下幾點:
1)雖然你關(guān)注相關(guān)性摊求,但這種相關(guān)性也應(yīng)該在一定程度上被驗證因果,毫無因果可言的相關(guān)也許是暗含與宇宙黑洞的秘密刘离,至少現(xiàn)在對人類用處不大室叉;
2)先進的分析技術(shù)和高級的程序員都只是數(shù)據(jù)分析中的工具和操作手,都只能是作為決策的輔助硫惕,參謀不能帶長茧痕,只會寫報表的參謀永遠不能當參謀長,更不能去當指揮戰(zhàn)爭的參謀總長恼除。
3)讓那些分析網(wǎng)絡(luò)訪問量踪旷、用戶來自哪里,喜歡看什么網(wǎng)頁等的傳統(tǒng)互聯(lián)網(wǎng)分析理念遠離消費推薦領(lǐng)域豁辉,用那些為了網(wǎng)站運營而分析的套路去看待消費者行為是刻舟求劍令野。
4)忘掉那些高深的術(shù)語,被用專業(yè)門檻將公司里面的需求者阻擋以豪門之外徽级,數(shù)據(jù)分析沒那么神奇气破,即使多了一個大。
5)數(shù)據(jù)也會說假話灰追,片面相信數(shù)據(jù)的結(jié)果是徹底的教條主義堵幽,任何看似非常科學的結(jié)論都有可能是你自己的分析方法導致的弹澎。
6)大數(shù)據(jù)當然有用,但要掌握在有用的人手里努咐,更要掌握在會用的手里苦蒿,更需要掌握在不亂用的人手里。
7)讓機器替代人腦渗稍,認為機器可以替代人腦佩迟,只有傻子才這樣想,至少在人類文明的現(xiàn)階段是傻子竿屹。
8)做好大數(shù)據(jù)报强,先從小數(shù)據(jù)開始吧,雖然你可以說大數(shù)據(jù)可以僅僅是個大拱燃,但任何的大都是從小來的秉溉。
第4章、分析方法的全聚合
1、匯總與排序召嘶,你離不開的:匯總和排序只是說明全局父晶,要想了解得更深刻,接下來一般就會進行結(jié)構(gòu)分析弄跌,首先就是要算清楚其中的比例關(guān)系
2甲喝、誰說比例與頻次不是分析
如:商品數(shù)據(jù)分析:日本、韓國铛只、德國商品占據(jù)半壁江山埠胖;80后、90后仍是消費主力淳玩,天秤押袍、天蝎、處女座成剁手黨三甲凯肋;上海人最愛吃谊惭,江蘇人最愛豐胸,北京人愛減肥侮东;2015年成聚劃算跨境爆發(fā)年圈盔;
以上的比例分析基本上都是簡單的比例比較,在進行比例分析的時候還需要考慮比例之間的協(xié)調(diào)關(guān)系悄雅。比如驱敲,有一個分析認為:“30%的車禍是持駕照三年以下者所為,所以新駕駛員容易闖禍”宽闲,你覺得分析正確嗎众眨?這是有前提的,如果"持駕照三年以下者占總駕駛員的比例不到30%卻闖了30%的車禍容诬,那么這些新駕駛員容易闖禍"娩梨,否則"持駕照三年以下者占總駕駛員的比例超過30%,可車禍只占到30%览徒,那么這些新駕駛員不容易闖禍"狈定。比例分析就是哪此,看起來多习蓬,并不是一定就多纽什,還要看隔壁家是多還是少,或者在總體中的比例躲叼。在這里芦缰,真的是要患寡而患不均。
所以枫慷,分析比例让蕾,一定要站在動態(tài)的角度上浪规,而不是靜止地看待事物。
3涕俗、平均數(shù)里隱藏的大秘密
一般來說罗丰,平均數(shù)可以分為簡單平均數(shù)、加權(quán)平均數(shù)再姑、調(diào)和平均數(shù)萌抵、幾何平均數(shù)等,當然還有一種叫作“截尾平均數(shù)”元镀∩芴睿“截尾平均數(shù)”是指在一個數(shù)列中,去掉兩端的極端值后所計算的算術(shù)平均數(shù)栖疑,也稱為切尾均值讨永。
當然除了平均數(shù),還有兩個指標也用來表示集中趨勢遇革,一個是眾數(shù)卿闹,一個是中位數(shù)。這兩個指標都與排序有關(guān)萝快。
我們把一組數(shù)據(jù)按從小到大的順序排列锻霎,在中間的一個數(shù)字(或兩個數(shù)字的平均值)叫做這組數(shù)據(jù)的中位數(shù),而在一組數(shù)據(jù)中揪漩,出現(xiàn)次數(shù)最多的數(shù)就叫這組數(shù)據(jù)的眾數(shù)旋恼。
按統(tǒng)計學原理,只有在數(shù)據(jù)分布偏態(tài)(不對稱)的情況下奄容,才會出現(xiàn)均值冰更、中位數(shù)和眾數(shù)的明顯區(qū)別。所以說昂勒,如果是正態(tài)的話蜀细,用哪個統(tǒng)計量都行。如果偏態(tài)的情況特別嚴重叁怪,可以用中位數(shù)审葬。
4、方差奕谭,也許你不用關(guān)注,但還是要理解更好痴荐。
方差是各個數(shù)據(jù)與平均數(shù)之間的平方的平均數(shù)血柳。在概率論和數(shù)據(jù)統(tǒng)計中,方差用來度量隨機變量和其數(shù)學期望之間人偏離程度生兆。
用統(tǒng)計學的說法难捌,當數(shù)據(jù)分布比較分散時膝宁,各個數(shù)據(jù)與平均數(shù)的的差的平方和較大,方差就較大根吁;當數(shù)據(jù)分布比較集中時员淫,各個數(shù)據(jù)與平均數(shù)的差的平方和較小。因此击敌,方差越大介返,數(shù)據(jù)的波動越大;方差越小沃斤,數(shù)據(jù)的波動就越小圣蝎。
5、大數(shù)據(jù)時代的相關(guān)關(guān)系和因果關(guān)系
大數(shù)據(jù)時代是一個注重相關(guān)關(guān)系的時代衡瓶,人們變得不再對事物之間的因果進行深入細致的研究徘公。有時候,原因和結(jié)果之間真的很難找到答案哮针。
6关面、回歸分析,你必須學會的分析方法十厢〉忍回歸分析是應(yīng)用最方的一種分析方法,也是統(tǒng)計學教學時的最重要內(nèi)容寿烟〕和眨回歸分析是根據(jù)已知的一個或一個以上變量(自變量)的值來估計另一個變量(因變量)的值,并且算出估計的誤差筛武,所建立的數(shù)據(jù)模型及所進行的統(tǒng)計分析缝其。
有一元線性回歸和多元線性回歸。
7徘六、回歸分析與相關(guān)分析關(guān)系密切内边,但差異也很明顯。相關(guān)分析是用來度量變量與變量之間關(guān)系的緊密程度的一種方法待锈,在本質(zhì)上只是對客觀存在的關(guān)系的測度漠其。回歸分析是根據(jù)所擬合的回歸議程研究自變量與因變量一般關(guān)系值的方法竿音,可由已給定的自變量數(shù)值來推斷因變量的數(shù)值和屎,它具有推理的性質(zhì)。在進行相關(guān)分析時春瞬,不需要確定哪個是自變量柴信,哪個是因變量,但回歸分析的首要問題就是確定哪個是自變量宽气,哪個是因變量∷娉#現(xiàn)象之間的相關(guān)分析只能計算一個相關(guān)系統(tǒng)潜沦;而回歸分析時回歸系統(tǒng)可能有兩個,也就是兩現(xiàn)象互為因果關(guān)系時绪氛,可以確定兩個獨立回歸方程唆鸡,從而就有兩種不同的回歸系數(shù)。
在實際工作中枣察,要特別注意線性回歸的應(yīng)用有4個前提條件:線性争占、獨立性、正態(tài)性询件、等方差性燃乍。
8、聚類分析:是根據(jù)事物之間的相似性或同質(zhì)性宛琅,將它們歸類分組的方法刻蟹。聚類分析的結(jié)果尋求的是組內(nèi)差異最小,組間差異最大嘿辟。聚類分析也是數(shù)據(jù)分析中最經(jīng)常使用的多元分析方法之一舆瘪,它在有關(guān)市場細分研究中幾乎是必不可少的分析工具。
9红伦、判別分析又稱為分辨法英古。當?shù)玫揭粋€新的樣品數(shù)據(jù)時,要確定該樣品屬于已知類型中的哪一類昙读,這類問題屬于差別分析問題召调。
10、因子分析:可在許多變量中找出隱藏的具有代表性的因子蛮浑,將相同本質(zhì)的變量歸入一個因子唠叛,可減少變量的數(shù)目,還可檢驗變量間關(guān)系的假設(shè)沮稚。
第5章艺沼、大數(shù)據(jù),有時候很奇葩
1蕴掏、為什么互聯(lián)網(wǎng)專車會造成城市擁堵障般?
大數(shù)據(jù)分析從原來統(tǒng)計分看重的因果分析轉(zhuǎn)為相關(guān)分析,只探究知道是什么盛杰,而不重點探索為什么挽荡。其實,在大數(shù)據(jù)的背景下即供,分析原因?qū)⒆兊酶鼮橹匾旆ィ哺枰ㄐ院椭庇X。因為大數(shù)據(jù)經(jīng)常會給風馬牛不相及的結(jié)論募狂,只有后續(xù)進行深入細致的因果分析办素,才會更有價值。
可以肯定的是祸穷,不做任何清洗的大數(shù)據(jù)分析絕對不會有進行抽樣統(tǒng)計得到的結(jié)果更好性穿。大數(shù)據(jù)分析需要連續(xù)的、真實的雷滚、少雜質(zhì)的數(shù)據(jù)需曾,而這些數(shù)據(jù)對于大多數(shù)中國企業(yè)而言簡直是天方夜譚。
在數(shù)據(jù)分析面前祈远,智慧永遠比算法和數(shù)量更重要呆万,數(shù)據(jù)的多寡和技術(shù)的高低并不是決定結(jié)果是否有價值的核心標準。
第6章车份、善用數(shù)據(jù)谋减,但別自作聰明
1、數(shù)據(jù)是分析的基礎(chǔ)扫沼,分析也是收集數(shù)據(jù)的一種方式和能力出爹。有時候變化的是你的關(guān)注點。有些時候缎除,我們無法接近要分析的事物严就。
2、無論是獲取情報還是分析情報器罐,無論是球隊比賽還是市場競爭梢为,都有一個很重要的要素,就是要快轰坊,要領(lǐng)先對手一步铸董。哪怕僅僅領(lǐng)先對手半步,可能歷史的進程就會完全不同衰倦。
3袒炉、網(wǎng)絡(luò)上的信息造假有三個特點:門檻低、傳播快樊零、影響大我磁。最后牢記一點:所有嚇唬你的文章,默認都是謠言驻襟。結(jié)論越是絕對夺艰,越嚇人,越可能是謠言沉衣。這個世界上很難突然從石頭里面跳出來一條爆炸性的嚇人新聞郁副。
4、在大數(shù)據(jù)的應(yīng)用上豌习,商家與消費者是在同步提高的存谎,自作聰明的商家肯定會聰明反被聰明誤拔疚,誠實守信尊重顧客在任何時代都不會過時。
第7章既荚、換個角度稚失,讓結(jié)論海闊天空
1、對于數(shù)據(jù)分析工作者來說恰聘,冰冷的數(shù)據(jù)結(jié)果也許并不是真正的理性句各,數(shù)據(jù)也會說假話。片面相信數(shù)據(jù)的結(jié)果是徹底的教條主義晴叨,任何看似非吃浔觯科學的結(jié)論都有可能不能符合常識。
2兼蕊、阿里巴巴面試題:
1)第一步是描述初厚。也就是觀察和分析數(shù)據(jù),把數(shù)據(jù)展示出來的內(nèi)容列舉出來遍略,也許不需要發(fā)現(xiàn)任何問題惧所,但描述卻是非常必要的,如果描述不清晰绪杏,以后的分析就會成為無源之水下愈。
2)第二步是探測,對于描述出來的數(shù)據(jù)進行掃描蕾久,利用一些分析方法势似,找到數(shù)據(jù)中的價值所以,或者是找到數(shù)據(jù)中透露出來的關(guān)鍵信息僧著。如果是做企業(yè)的經(jīng)營分析履因,則主要是找到公司運營過程中存在的不足和出現(xiàn)問題的部分。
3)第三步是提出對策盹愚。要通過認真地核對和詳細地探討找到出現(xiàn)問題的原因栅迄,找到原因之后才可能對癥下藥,研究和提出應(yīng)對方案皆怕。
3毅舆、模型都靠不住,挑戰(zhàn)短板理論愈腾。水桶容積大小是由短木板的長度決定的憋活。短木板可以分為絕對的短木板和相對的短木板。也可以分為可提升的短木板和不可提升的短木板。可以分為容易提升的短木板和不容易提升的短木板涝滴。還可以分為值得提升的和不值得提升的悼凑。
是充分發(fā)揮優(yōu)勢還是努力彌補劣勢。是把自己的長木板加得更長還是把自己的短木板加長凭峡,應(yīng)該根據(jù)客觀形勢來分析判斷搂漠。特別是在激烈競爭中的賽場或者市場中艺晴,有時候我們沒辦法化腐朽為神奇冗美,如果一味地追求整體的均衡魔种,把有限的資源耗費在無用或者少用的地方,即使短木板加長了粉洼,競爭的結(jié)果也不一定是勝利。
4叶摄、大數(shù)據(jù)不是IT技術(shù)属韧。一個好的數(shù)據(jù)分析體系,首先得有一個良好的理論模型蛤吓,用它去指導分析宵喂,然后通過數(shù)據(jù)不斷修正它,任何把數(shù)據(jù)分析當數(shù)學和代碼來搞的最后肯定會鬧笑話会傲。
不管怎樣锅棕,大數(shù)據(jù)時代已經(jīng)到來,我們盡情地擁抱吧淌山!
感悟:本數(shù)據(jù)的收獲裸燎,遠不止是大數(shù)據(jù),更是一種思維泼疑,一種思維的訓練德绿。我越來越發(fā)現(xiàn),思維是學習一切東西的前提退渗。包括給孩子學英語移稳,也需要我們周密的思維。希望自己在將來很長的一段時間內(nèi)会油,無論從事什么个粱,都要努力訓練自己的思維。周密的考慮問題翻翩。值得自己思考......