導(dǎo)讀:《大數(shù)據(jù)》這本書的作者是涂子沛文留,信息管理專家昼浦、科技作家馍资。作者題記:一個真正的信息社會,首先是一個公民社會关噪。這給了我---需求分析人員鸟蟹,一個把工作做好的更加充足的理由。作者提到的一句話讓我印象深刻“數(shù)據(jù)可以治國色洞,還可以強國”戏锹,這句話讓我感到做有意義的事就是把當(dāng)下工作做好。全書包括數(shù)據(jù)的發(fā)展火诸、數(shù)據(jù)治國锦针、商務(wù)智能的發(fā)展、數(shù)據(jù)質(zhì)量法置蜀、數(shù)據(jù)的隱私以及大數(shù)據(jù)的發(fā)展趨勢等內(nèi)容奈搜。由于本次我只關(guān)注數(shù)據(jù)的統(tǒng)計和分析,所以下面部分重點對數(shù)據(jù)分析的四個必要條件進(jìn)行總結(jié)盯荤。
信息消費了信息接受者的注意力馋吗,信息越豐富,就會導(dǎo)致注意力越匱乏秋秤。比如我們買衣服宏粤,可選擇的越多,選擇越困難灼卢。在企業(yè)中绍哎,信息并不匱乏,匱乏的是我們處理信息的能力鞋真。
我們有限的注意力是組織活動的主要瓶頸崇堰。
人類的理性是有限的,因此所有的決策都是基于有限理性
有限理性是介于完全理性和非完全理性之間的在一定限制下的理性涩咖,是為抓住問題的本質(zhì)而簡化決策變量的條件下表現(xiàn)出來的理性行為海诲。舉個在稻草中尋針的例子,有限理性就是只要找到足可以縫衣服的針就滿足了檩互,即尋求滿意特幔;完全理性是要找到最鋒利的針,尋求最優(yōu)盾似,從所有的備選方案中找到最優(yōu)者敬辣。通過計算機里的信息輔助決策雪标,人類理性的范圍將會擴(kuò)大零院,決策的質(zhì)量就能提高溉跃。
赫伯特·西蒙(科學(xué)家,曾獲圖靈獎和諾貝爾經(jīng)濟(jì)學(xué)獎)預(yù)測:在后工業(yè)時代告抄,也就是信息時代撰茎,人類社會面臨的中心問題將從如何提高生產(chǎn)率轉(zhuǎn)變?yōu)槿绾胃玫乩眯畔磔o助決策。
如何將信息轉(zhuǎn)化為有用的知識為決策者提供數(shù)據(jù)支撐打洼,可以總結(jié)為如下四點:
1龄糊、數(shù)據(jù)倉庫--商務(wù)智能的依托,海量數(shù)據(jù)進(jìn)行分析的核心物理構(gòu)架
決策支持面臨的“瓶頸式”難題募疮,是如何有機的聚集炫惩、整合多個不同運營信息系統(tǒng)產(chǎn)生的數(shù)據(jù)。
數(shù)據(jù)的處理是重點阿浓,“數(shù)據(jù)倉庫”不同于數(shù)據(jù)庫他嚷,欠著是以數(shù)據(jù)分析、決策支持為目的來組織存儲數(shù)據(jù)芭毙,而數(shù)據(jù)庫的主要目的則是為運營性系統(tǒng)保存筋蓖、查詢數(shù)據(jù)。一種格式一致的多源數(shù)據(jù)存儲中心退敦,數(shù)據(jù)源可以來自不同的系統(tǒng)粘咖,但是數(shù)據(jù)可以按統(tǒng)一定義的格式被提取出來,再通過清洗侈百、轉(zhuǎn)換瓮下、集成,最后百流歸海钝域,加載進(jìn)入數(shù)據(jù)倉庫讽坏。這個提取、轉(zhuǎn)換网梢、裝載的主要過程震缭,可以借助ETL工具。
2战虏、聯(lián)機分析--為企業(yè)開展高端的分析
將分立的數(shù)據(jù)庫“相聯(lián)”拣宰,進(jìn)行多維度的分析。重點在一個“維”烦感,指的是人們觀察事物巡社、計算數(shù)據(jù)的特定角度。如沃爾瑪超市手趣,要分析自己的銷售量晌该,可以按照時間序列分析肥荔、商品門類分析、地區(qū)國別分析朝群,也可以按照進(jìn)貨渠道分析燕耿、客戶群體分析,這些不同的角度就是維度姜胖。作為軍工企業(yè)誉帅,想了解產(chǎn)品設(shè)計和開發(fā)的質(zhì)量情況,就可以從現(xiàn)場設(shè)計更改閉環(huán)情況右莱、設(shè)計驗證完成情況蚜锨、設(shè)計確認(rèn)一次通過情況、產(chǎn)品重要試驗一次通過情況等多個維度進(jìn)行分析慢蜓。
隨著維度的增多亚再,問題可能變得復(fù)雜,一旦維度超過三個晨抡,人類思維和想象力就受到很大的限制氛悬。及時同一個維度,也可以進(jìn)行下轉(zhuǎn)細(xì)分(drill down)凄诞,如時間維度圆雁,一年的銷量,分析人員可能對半年帆谍、季度伪朽、每個月或者某一天(如雙十一)的銷量感興趣;和上轉(zhuǎn)細(xì)分對應(yīng)的是上卷(roll up)汛蝙,從某一個分店的銷量加總到一個城市的銷量烈涮。
需求分析人員就需要事先設(shè)計報表,即根據(jù)用戶指定的條件窖剑,由軟件人員事先一一定制坚洽,通過“一對一”的查詢,將結(jié)果通過報表的形式返回給用戶西土。
報表讶舰,是關(guān)系型數(shù)據(jù)庫時代將數(shù)據(jù)轉(zhuǎn)化為信息和知識最主要的手段。對于一個立足于決策的用戶來說需了,他的需要是“動態(tài)”的跳昼,他可能問出任意維度交叉和細(xì)分的問題,但軟件開發(fā)人員只能將最常見的問題定制在軟件中肋乍,那么對于沒有定制的問題鹅颊,系統(tǒng)就無法回答。所以靜態(tài)的墓造、固定的報表根本無法滿足決策分析人員的全部需要堪伍。解決方案就是用戶可以根據(jù)自己的需要隨時創(chuàng)建“萬維”動態(tài)報表锚烦,也就是說,報表的定制權(quán)由后臺的開發(fā)人員直接轉(zhuǎn)移到前端用戶帝雇。
3涮俄、數(shù)據(jù)挖掘--讓數(shù)據(jù)流動的更好、管理的更好摊求、分析的更好
其實一開始的時候禽拔,數(shù)據(jù)挖掘曾一度被稱為“基于數(shù)據(jù)庫的知識發(fā)現(xiàn)”刘离。數(shù)據(jù)挖掘最經(jīng)典的例子就是在超市中跟尿布一起搭配購買最多的商品是啤酒室叉,那么這個微妙的關(guān)系很難被發(fā)現(xiàn),但是通過數(shù)據(jù)挖掘技術(shù)就可以實現(xiàn)硫惕。數(shù)據(jù)挖掘的主要目茧痕,一是發(fā)現(xiàn)潛藏在數(shù)據(jù)表面之下的歷史規(guī)律,二是對未來進(jìn)行預(yù)測恼除,即描述性分析和預(yù)測性分析踪旷。
4、數(shù)據(jù)可視化--詮釋數(shù)據(jù)之間的關(guān)系和發(fā)展趨勢豁辉,以期更好地理解令野、使用數(shù)據(jù)分析的結(jié)果
? 數(shù)據(jù)可視化的技術(shù),可以通過圖像在邏輯思維的基礎(chǔ)上進(jìn)一步激發(fā)人的形象思維和空間想象力徽级,吸引气破、幫助用戶洞察數(shù)據(jù)之間隱藏的關(guān)系和規(guī)律。數(shù)據(jù)可視化的關(guān)鍵在于“設(shè)計”餐抢。信息過載不存在现使,問題出在糟糕的設(shè)計上,如果用來表達(dá)數(shù)據(jù)的圖形讓人感覺雜亂不解旷痕,那就需要修改設(shè)計碳锈。相對于簡單的點線圖、直方圖等欺抗,儀表盤售碳、計分板、三維圖绞呈、動態(tài)模擬贸人、動畫技術(shù)等等講更加直覺話和趣味化。
新時代企業(yè)的競爭报强,將是知識生產(chǎn)率的競爭灸姊。以發(fā)現(xiàn)新知識為使命的智能化,無疑是整個時代最為矚目的競爭利器秉溉。
推薦相關(guān)書籍:赫伯特·西蒙的《行政組織的決策過程》力惯、愛德華·塔夫特的《定量信息的視覺展示》