一、前言
?隨著大數(shù)據(jù)時代真真正正地來臨冯勉,無處不在的大數(shù)據(jù)對如今的生活產(chǎn)生了巨大的影響澈蚌。2015年大數(shù)據(jù)這個詞更是被炒的火熱,連各種講座灼狰,也因冠上了“大數(shù)據(jù)”的名號而被廣泛宣傳宛瞄。而大數(shù)據(jù)究竟是什么呢?它是怎樣存在于我們的生活交胚。讀過《大數(shù)據(jù)》這本書份汗,或許才有了一點了解。
? 大三寒假放假前在圖書館看到了這本書承绸,想到15年秋招有學(xué)長被某司面試官問到你眼中的“大數(shù)據(jù)”是怎樣的?借到了這本書挣轨,寒假時家里的環(huán)境太過溫馨军熏,所以并沒有讀這本書,收假后卷扮,又重新續(xù)借荡澎。這才正式看《大數(shù)據(jù)》,不由得為了自己的懶癌找了個大大的借口晤锹。最終利用三天課余時間看完了全書摩幔。
二、這本書講了什么
? 這本書以美國多半個世紀(jì)信息開放鞭铆、技術(shù)創(chuàng)新的歷史或衡,利用一些經(jīng)典的案例來闡述究竟什么是大數(shù)據(jù)?它在現(xiàn)實中以怎樣的形式存在车遂,起到了什么作用封断。其中包括:奧巴馬建設(shè)“前所未有的開放政府”的雄心、公開財政透明的曲折舶担、《數(shù)據(jù)質(zhì)量法》背后的隱情坡疼、全民醫(yī)改法案的波瀾、統(tǒng)一身份證的百年糾結(jié)衣陶、街頭警察的創(chuàng)新傳奇柄瑰、美國礦難的悲情歷史、商務(wù)智能的前世今生剪况、數(shù)據(jù)開放運動的全球星期教沾,以及云計算、Facebook和推特等社交媒體译断、Web3.0與下一代互聯(lián)網(wǎng)的未來圖景等详囤,數(shù)據(jù)創(chuàng)新給公民、政府、社會帶來的種種挑戰(zhàn)藏姐。
? 全書雖以美國為主體隆箩,但也反觀中國的現(xiàn)實問題。
? 大數(shù)據(jù)之所以產(chǎn)生羔杨,是因為今天無處不在的傳感器和微處理器捌臊。使用機械或電子設(shè)備都會留下數(shù)據(jù)痕跡,這些痕跡表明了他的性能兜材、位置或狀態(tài)理澎。這些設(shè)備和使用它們的人,通過互聯(lián)網(wǎng)互相交流曙寡,形成了龐大的數(shù)據(jù)源糠爬。這些數(shù)據(jù)源和其他來源的數(shù)據(jù)相結(jié)合后被使用,形成了大數(shù)據(jù)举庶。
? ?要抓住大數(shù)據(jù)的機遇执隧,必須要做到以下幾點:從技術(shù)角度來說,需要收集并且開發(fā)特定的工具户侥,來管理大規(guī)模并行服務(wù)器產(chǎn)生的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)镀琉,(這些數(shù)據(jù)可能是自己專有的,也可能來源于"云")當(dāng)然有了數(shù)據(jù)蕊唐,還得需要分析屋摔,那么分析軟件就是用來挖掘數(shù)據(jù)的意義。
三替梨、大數(shù)據(jù)起到了哪些重要的作用
1钓试、奧巴馬上任第一天簽署的總統(tǒng)備忘案《透明和開放的政府》,其中講到:
(1)政府應(yīng)該是透明的副瀑。政府將根據(jù)法律和政策亚侠,采取適當(dāng)?shù)卮胧员愎姴樵兯咨取@取的方式發(fā)布信息硝烂,各部門要利用現(xiàn)代信息技術(shù),將日常工作和決策的相關(guān)信息上網(wǎng)公示铜幽,以便公眾獲取滞谢。各行政部門和機構(gòu)還應(yīng)征求公眾的反饋,以確定哪些信息對公眾最有價值除抛。
(2)政府應(yīng)該是參與性的狮杨。政府需要從集體的智慧和信息中受益,各部門要就如何增加和改善公眾參與政府決策這個問題到忽,廣泛征求公眾的建議橄教。
(3)政府應(yīng)該是多方協(xié)作的清寇。各行政部門和機構(gòu)應(yīng)利用新的工具、方法和系統(tǒng)护蝶,在各部門华烟、各級政府之間全面協(xié)作。此外持灰,還要與非營利組織盔夜、企業(yè)和個人進行協(xié)作。各行政部門和機構(gòu)要廣泛征求公眾的反饋堤魁,以評估協(xié)作的效果喂链,確定新的協(xié)作機會。
在此妥泉,奧巴馬就巧妙的利用了大數(shù)據(jù)椭微,來提高和改善政府與民眾的關(guān)系,包括政務(wù)信息透明化以及辦公公眾參與化盲链。
在美國200多年的歷史中蝇率,作為總體開放政府的雄心,并不多見匈仗。但在開國之初瓢剿,美國的建國者就對信息的作用展開了思考和辯論逢慌∮菩《獨立宣言》(托馬斯、杰裴遜)攻泼、《管家法》火架、《信息自由法》(摩斯-信息自由法之父)等等都不同程度的提到了信息公開之類的信息,但對于公開哪部分內(nèi)容以及如何公開一直有著無法解決的矛盾忙菠。
2何鸡、數(shù)據(jù)美國
1998年,聯(lián)邦政府共擁有432所數(shù)據(jù)中心牛欢,專門負(fù)責(zé)各類數(shù)據(jù)的存儲和維護工作骡男。2010年,數(shù)據(jù)中心的總數(shù)躍升到2094所傍睹,翻了幾倍隔盛。
1996年,聯(lián)邦政府的年度IT預(yù)算是180億美元拾稳,2010年吮炕,以及高達(dá)784億美元,這些投資的一半以上都用在了購買存儲數(shù)據(jù)的硬件設(shè)備上访得。
? ?最小數(shù)據(jù)集在美國演變成一個一般性的概念,它指代國家的管理層面針對某個業(yè)務(wù)管理領(lǐng)域強制手機的數(shù)據(jù)指標(biāo)们豌,對于養(yǎng)老院的管理望忆,美國國會規(guī)定,每個養(yǎng)老院必須提交一系列關(guān)于老人健康指標(biāo)的最小數(shù)據(jù)集給州政府的醫(yī)療管理部門杜耙,該部門匯總后,再提交聯(lián)邦政府的管理部門迎膜。
? 這樣的話泥技,對于老人就能更好的被服務(wù)。
?數(shù)據(jù)的生命力磕仅,甚至比程序更持久珊豹,程序可以不斷地升級、換代甚至退出使用榕订,但保存數(shù)據(jù)的數(shù)據(jù)庫會繼續(xù)存在店茶,其價值很可能與日俱增、歷久彌新劫恒。
? ?美國建立的“交通事故死亡報告分析系統(tǒng)”贩幻,隨著數(shù)據(jù)多年的積累,根據(jù)數(shù)據(jù)分析的結(jié)果两嘴,不斷進行調(diào)整丛楚,制定新的政策,新政策實施憔辫,再進行數(shù)據(jù)收集趣些,進行新一輪評估,周而復(fù)始贰您,再根據(jù)結(jié)果坏平,進行全國推廣。使得全國車禍出事率大大降低锦亦。
其通過:
(1)數(shù)據(jù)收集:建立收集網(wǎng)絡(luò)舶替,保證數(shù)據(jù)質(zhì)量
(2)數(shù)據(jù)分析:確定存在問題、研究新的政策杠园、評估政策績效
(3)數(shù)據(jù)分布:接受社會監(jiān)督顾瞪、鼓勵民間接入、推動政策復(fù)制抛蚁、調(diào)動政策競爭
3陈醒、大數(shù)據(jù)戰(zhàn)略將爭奪世界下一個前沿
? ?之所以要稱之為戰(zhàn)略,是因為“大數(shù)據(jù)”之“大”篮绿,并不僅僅在于其“容量之大”孵延,數(shù)據(jù)的收集、保存亲配、維護以及共享等任務(wù)尘应,都將成為具有研究意義的現(xiàn)象和挑戰(zhàn)惶凝。更多的意義在于:人類可以分析和使用的數(shù)據(jù)在大量增加,通過這些數(shù)據(jù)的交換犬钢、整合和分析苍鲜,人類可以發(fā)現(xiàn)新的知識,創(chuàng)造新的價值玷犹。
提取>存儲>分析>共享>可視化
4混滔、航班延誤分析系統(tǒng)
? ?近幾年來,在中國歹颓,因為航班延誤產(chǎn)生的各種糾紛常常成為熱點話題坯屿,美國當(dāng)然也會存在航班延誤的情況,但缺很少有沖突類似的情況巍扛。Data.gov上線后领跛,美國交通部開放全美航班起飛、到達(dá)撤奸、延誤的數(shù)據(jù)吠昭,程序員利用該數(shù)據(jù)開發(fā)了一個航班延誤分析系統(tǒng),該系統(tǒng)向全社會免費開放胧瓜,任何人都可以查詢?nèi)珖鞔魏桨嗟难诱`率以及機場等候時間矢棚,因其簡單、實用取得了極好的效果府喳。
該系統(tǒng)公布這些數(shù)據(jù)起到的作用:
(1)幫消費者找到表現(xiàn)最佳、最符合自己需要的航班劫拢。
(2)最大程度上降低了旅客等待時間的不確定性
(3)有利用推動航空市場的良性競爭肉津。
四强胰、總結(jié)
? ? 大數(shù)據(jù)在美國的各種應(yīng)用起到的效果舱沧,可以看出數(shù)據(jù)在當(dāng)今社會的重要性。我國龐大的人口偶洋,也需要大數(shù)據(jù)來快速的分析熟吏、總結(jié)。為大家的生活玄窝,工作牵寺,以及政府的發(fā)展都會帶來巨大的好處。當(dāng)然恩脂,這也不是一時能夠完成的帽氓,希望能夠在此多投入資金,把大數(shù)據(jù)利用起來俩块。
一只大三產(chǎn)品狗