姓名:周君會(huì)? ? ? ? 學(xué)號(hào):17011210526
轉(zhuǎn)載自:
https://www.zhihu.com/question/23273263
【嵌牛導(dǎo)讀】:大數(shù)據(jù)時(shí)代已經(jīng)來臨雄可,涉及我們的方方面面辛馆。
【嵌牛鼻子】:深度學(xué)習(xí)泄鹏、數(shù)據(jù)挖掘士葫、神經(jīng)網(wǎng)絡(luò)狸页、人工智能或許會(huì)出現(xiàn)在我們的日常中路捧,如無人駕駛撒顿,物聯(lián)網(wǎng)丑罪,極大地便利了我們的生活。
【嵌牛提問】:那么凤壁,大數(shù)據(jù)的核心價(jià)值到底在哪里吩屹?
【嵌牛正文】:
“很多人還沒搞清楚什么是PC互聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)來了拧抖,我們還沒搞清楚移動(dòng)互聯(lián)的時(shí)候煤搜,大數(shù)據(jù)時(shí)代又來了♂阌悖”——馬云卸任演講
本文嘗試從三大產(chǎn)業(yè)的角度將大數(shù)據(jù)的核心商業(yè)價(jià)值分類討論宅楞。
首先例舉一些大數(shù)據(jù)的典型應(yīng)用针姿,然后解釋大數(shù)據(jù)的定義袱吆,最后總結(jié)大數(shù)據(jù)的價(jià)值。
我們知道:
第一次工業(yè)革命以煤炭為基礎(chǔ)距淫,蒸汽機(jī)和印刷術(shù)為標(biāo)志绞绒,
第二次工業(yè)革命以石油為基礎(chǔ),內(nèi)燃機(jī)和電信技術(shù)為標(biāo)志榕暇,
第三次工業(yè)革命以核能基礎(chǔ)蓬衡,互聯(lián)網(wǎng)技術(shù)為標(biāo)志,
第四次工業(yè)革命以可再生能源為基礎(chǔ)彤枢,_________為標(biāo)志狰晚。
空白處你會(huì)填上什么?歡迎大家討論缴啡。但是目前可以預(yù)測的是壁晒,數(shù)據(jù)和內(nèi)容作為互聯(lián)網(wǎng)的核心,不論是傳統(tǒng)行業(yè)還是新型行業(yè)业栅,誰率先與互聯(lián)網(wǎng)融合成功秒咐,能夠從大數(shù)據(jù)的金礦中發(fā)現(xiàn)暗藏的規(guī)律,就能夠搶占先機(jī)碘裕,成為技術(shù)改革的標(biāo)志携取。
一、大數(shù)據(jù)的應(yīng)用
大數(shù)據(jù)挖掘商業(yè)價(jià)值的方法主要分為四種:
客戶群體細(xì)分帮孔,然后為每個(gè)群體量定制特別的服務(wù)雷滋。
模擬現(xiàn)實(shí)環(huán)境,發(fā)掘新的需求同時(shí)提高投資的回報(bào)率。
加強(qiáng)部門聯(lián)系惊豺,提高整條管理鏈條和產(chǎn)業(yè)鏈條的效率燎孟。
降低服務(wù)成本,發(fā)現(xiàn)隱藏線索進(jìn)行產(chǎn)品和服務(wù)的創(chuàng)新尸昧。
<img src="https://pic4.zhimg.com/50/071eb45b3f347956c7cd9fb49b26f523_hd.jpg" data-rawwidth="613" data-rawheight="552" class="origin_image zh-lightbox-thumb" width="613" data-original="https://pic4.zhimg.com/071eb45b3f347956c7cd9fb49b26f523_r.jpg">
Mckinsey列出了各個(gè)行業(yè)利用大數(shù)據(jù)價(jià)值的難易度以及發(fā)展?jié)摿场!禕ig data: The next frontier for innovation, competition, and productivity》
<img src="https://pic4.zhimg.com/50/0792e758d2a766c642130ec201075de3_hd.jpg" data-rawwidth="613" data-rawheight="532" class="origin_image zh-lightbox-thumb" width="613" data-original="https://pic4.zhimg.com/0792e758d2a766c642130ec201075de3_r.jpg">
各種Data之間的關(guān)系圖烹俗,注意Open Data是完全包含了Open government data(政府開放數(shù)據(jù))
<img src="https://pic2.zhimg.com/50/82d8a3d8b702c34fced0d2c8e9921049_hd.jpg" data-rawwidth="727" data-rawheight="586" class="origin_image zh-lightbox-thumb" width="727" data-original="https://pic2.zhimg.com/82d8a3d8b702c34fced0d2c8e9921049_r.jpg">
Mckinsey也列出了Open Data時(shí)代里七大行業(yè)潛在的經(jīng)濟(jì)價(jià)值爆侣,自上而下分別是教育,運(yùn)輸幢妄,消費(fèi)品兔仰、電力、石油與天然氣蕉鸳、醫(yī)療護(hù)理乎赴、消費(fèi)金融。(感謝知友安陽提供的補(bǔ)充鏈接資料)
大數(shù)據(jù)的類型大致可分為三類:
傳統(tǒng)企業(yè)數(shù)據(jù)(Traditional enterprise data):包括 CRM systems的消費(fèi)者數(shù)據(jù)潮尝,傳統(tǒng)的ERP數(shù)據(jù)榕吼,庫存數(shù)據(jù)以及賬目數(shù)據(jù)等。
機(jī)器和傳感器數(shù)據(jù)(Machine-generated /sensor data):包括呼叫記錄(Call Detail Records)勉失,智能儀表羹蚣,工業(yè)設(shè)備傳感器,設(shè)備日志(通常是Digital exhaust)乱凿,交易數(shù)據(jù)等顽素。
社交數(shù)據(jù)(Social data):包括用戶行為記錄,反饋數(shù)據(jù)等徒蟆。如Twitter胁出,F(xiàn)acebook這樣的社交媒體平臺(tái)。
從理論上來看:所有產(chǎn)業(yè)都會(huì)從大數(shù)據(jù)的發(fā)展中受益段审。但由于數(shù)據(jù)缺乏以及從業(yè)人員本身的原因全蝶,第一、第二產(chǎn)業(yè)的發(fā)展速度相對(duì)于第三產(chǎn)業(yè)來說會(huì)遲緩一些戚哎。
1985年裸诽,我國國家統(tǒng)計(jì)局明確地把我國產(chǎn)業(yè)劃分為三大產(chǎn)業(yè):
農(nóng)業(yè)(包括林業(yè)、牧業(yè)型凳、漁業(yè)等)定為第一產(chǎn)業(yè)丈冬。
工業(yè)(包括采掘業(yè)、制造業(yè)甘畅、自來水埂蕊、電力往弓、蒸汽、煤氣)和建筑業(yè)定為第二產(chǎn)業(yè)蓄氧。
把第一函似、二產(chǎn)業(yè)以外的各行業(yè)定為第三產(chǎn)業(yè)。
第三產(chǎn)業(yè)即除第一喉童、第二產(chǎn)業(yè)以外的向全社會(huì)提供各種各樣勞務(wù)的服務(wù)性行業(yè)撇寞,主要是服務(wù)業(yè)。其中第三產(chǎn)業(yè)可具體分為兩大部門:一是流通部門堂氯;二是服務(wù)部門蔑担。再細(xì)分又可分為四個(gè)層次:
第一層次,流通部門咽白。包括交通運(yùn)輸行業(yè)啤握、郵電通訊行業(yè)、物資供銷和倉儲(chǔ)行業(yè)晶框。
第二層次排抬,為生產(chǎn)和生活服務(wù)的部門。包括金融業(yè)授段、商業(yè)飲食業(yè)蹲蒲、保險(xiǎn)業(yè)、地質(zhì)普查業(yè)畴蒲、房地產(chǎn)業(yè)悠鞍、公用事業(yè)对室、技術(shù)服務(wù)業(yè)和生活服務(wù)修理業(yè)務(wù)模燥;
第三層次,為提高科學(xué)文化水平和居民素質(zhì)服務(wù)的部門掩宜。包括教育文化蔫骂、廣播電視事業(yè)、科學(xué)研究事業(yè)牺汤、衛(wèi)生辽旋、體育和社會(huì)福利事業(yè);
第四層次檐迟,為社會(huì)公共需要服務(wù)的部門补胚。包括國家機(jī)關(guān)、黨政機(jī)關(guān)追迟、社會(huì)團(tuán)體溶其、以及軍隊(duì)和警察公安司法機(jī)關(guān)等。
我們可以看出敦间,由于某些客觀原因瓶逃,相對(duì)于第一產(chǎn)業(yè)和第二產(chǎn)業(yè)來說束铭,第三產(chǎn)業(yè)憑借自身的優(yōu)勢,大多匯聚了當(dāng)前最海量的數(shù)據(jù)以及大批的科研中堅(jiān)力量厢绝。接下來讓我們看一些典型例子契沫,當(dāng)前新形勢下與三大產(chǎn)業(yè)密切相關(guān)的大數(shù)據(jù)應(yīng)用。
(1).第一產(chǎn)業(yè)
孟山都(Monsanto | A Sustainable Agriculture Company)昔汉,農(nóng)業(yè)
孟山都是一家美國的跨國農(nóng)業(yè)生物技術(shù)公司懈万,其生產(chǎn)的旗艦產(chǎn)品抗農(nóng)達(dá),即年年春(Roundup)是全球知名的嘉磷塞除草劑靶病,長期占據(jù)市場第一個(gè)位置钞速。該公司目前也是基因改造(GE)種子的領(lǐng)先生產(chǎn)商,占據(jù)了多種農(nóng)作物種子70%–100%的市場份額嫡秕,而在美國本土渴语,更占有整個(gè)市場的90%。已經(jīng)統(tǒng)治了生物工程種子業(yè)務(wù)超過十年昆咽。
孟山都首先發(fā)起“Green Data Revolution”運(yùn)動(dòng)驾凶,建立農(nóng)業(yè)數(shù)據(jù)聯(lián)盟(Open Ag Data Alliance)來統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),讓農(nóng)民不用懂“高科技”也能享受大數(shù)據(jù)的成果掷酗。典型的應(yīng)用如農(nóng)場設(shè)備制造商John Deere與DuPont Pioneer當(dāng)前聯(lián)合提供“決策服務(wù)(Decision Services)”调违,農(nóng)民只需在駕駛室里拿出平板電腦,收集種子監(jiān)視器傳來的數(shù)據(jù)泻轰,然后將其上傳給服務(wù)器技肩,最終服務(wù)器返回化肥的配方到農(nóng)場拖拉機(jī)上。
天氣意外保險(xiǎn)公司(The Climate Corporation)浮声,農(nóng)業(yè)
The Climate Corporation為農(nóng)民提供Total Weather Insurance (TWI)——涵蓋全年各季節(jié)的天氣保險(xiǎn)項(xiàng)目虚婿。利用公司特有的數(shù)據(jù)采集與分析平臺(tái),每天從250萬個(gè)采集點(diǎn)獲取天氣數(shù)據(jù)泳挥,并結(jié)合大量的天氣模擬然痊、海量的植物根部構(gòu)造和土質(zhì)分析等信息對(duì)意外天氣風(fēng)險(xiǎn)做出綜合判斷,然后向農(nóng)民提供農(nóng)作物保險(xiǎn)屉符。前不久從Google Ventures剧浸、Founders Fund等多家公司獲得超過5000萬美元的風(fēng)險(xiǎn)投資。 2013年被孟山都收購矗钟。
土壤抽樣分析服務(wù)商(Solum, Inc)唆香,農(nóng)業(yè)
Solum目標(biāo)是實(shí)現(xiàn)高效、精準(zhǔn)的土壤抽樣分析吨艇,以幫助種植者在正確的時(shí)間躬它、正確的地點(diǎn)進(jìn)行精確施肥。農(nóng)戶既可以通過公司開發(fā)的No Wait Nitrate系統(tǒng)在田間進(jìn)行分析即時(shí)獲取數(shù)據(jù)秸应;也可以把土壤樣本寄給該公司的實(shí)驗(yàn)室進(jìn)行分析虑凛。2012年獲得Andreessen Horowitz 領(lǐng)投的1700萬美元投資后碑宴,已累計(jì)融資近2000萬美元。
了解更多:
(2).第二產(chǎn)業(yè)
2013年9月延柠,工業(yè)和信息化部發(fā)布了《關(guān)于印發(fā)信息化和工業(yè)化深度融合專項(xiàng)行動(dòng)計(jì)劃(2013-2018年)》的通知。明確提出推動(dòng)物聯(lián)網(wǎng)在工業(yè)領(lǐng)域的集成創(chuàng)新和應(yīng)用:
實(shí)施物聯(lián)網(wǎng)發(fā)展專項(xiàng)锣披,在重點(diǎn)行業(yè)組織開展試點(diǎn)示范贞间,以傳感器和傳感器網(wǎng)絡(luò)、RFID雹仿、工業(yè)大數(shù)據(jù)的應(yīng)用為切入點(diǎn)增热,重點(diǎn)支持生產(chǎn)過程控制、生產(chǎn)環(huán)境檢測胧辽、制造供應(yīng)鏈跟蹤峻仇、遠(yuǎn)程診斷管理等物聯(lián)網(wǎng)應(yīng)用,促進(jìn)經(jīng)濟(jì)效益提升邑商、安全生產(chǎn)和節(jié)能減排摄咆。
大數(shù)據(jù)的業(yè)務(wù)多是數(shù)據(jù)驅(qū)動(dòng)型,具有數(shù)據(jù)量大人断、種類多吭从、實(shí)時(shí)性高的特點(diǎn)。工業(yè)企業(yè)對(duì)數(shù)據(jù)的記錄以往看來主要分為兩種方法:傳統(tǒng)的紙筆和Excel電子表格記錄恶迈。這些操作起來看似簡單的數(shù)據(jù)管理方式為企業(yè)生產(chǎn)及質(zhì)量監(jiān)控埋下了巨大的隱患涩金,也讓數(shù)據(jù)挖掘無從談起。
隨著信息化與工業(yè)化的融合發(fā)展暇仲,信息技術(shù)滲透到了工業(yè)企業(yè)產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié)步做。例如Sensor、RFID熔吗、Barcode辆床、物聯(lián)網(wǎng)等技術(shù)已經(jīng)在企業(yè)中得到初步應(yīng)用佳晶,工業(yè)大數(shù)據(jù)也開始逐漸得到積累桅狠。企業(yè)中生產(chǎn)線高速運(yùn)轉(zhuǎn)時(shí)機(jī)器所產(chǎn)生的數(shù)據(jù)量不亞于計(jì)算機(jī)數(shù)據(jù),而且數(shù)據(jù)類型多是非結(jié)構(gòu)化數(shù)據(jù)轿秧,對(duì)數(shù)據(jù)的實(shí)時(shí)性要求也更高中跌。因此工業(yè)大數(shù)據(jù)所面臨的問題和挑戰(zhàn)很多,所以通用電氣公司(General Electric)的副總裁兼全球技術(shù)總監(jiān)William Ruh認(rèn)為相對(duì)于工業(yè)大數(shù)據(jù)來說菇篡,工業(yè)互聯(lián)網(wǎng)(Industrial Internet)才是當(dāng)前急需的漩符,因?yàn)榇髷?shù)據(jù)本身并沒有讓信息的提取更加智能,業(yè)務(wù)比數(shù)據(jù)本身更加重要驱还。他舉了一個(gè)核磁共振成像掃描的例子:
Here’s an example. An MRI scan is the best way to see inside the human body. While effective in helping to diagnose multiple sclerosis, brain tumors, torn ligaments and strokes, the data produced by an MRI machine is disconnected from the person that needs it the most.
At a very simplistic level, there are many individuals working as a team to make the scan happen. A nurse administers medications or contrast agents that may be needed for the exam; an MRI technologist operates the scanner; and a radiologist identifies the imaging sequences to be used and interprets the images. This information is then given to the nurse, who then passes it to the primary doctor to review and take action accordingly. This is Big Data, but it is not making information more intelligent.
又如在工業(yè)中嗜暴,壓力凸克、溫度等數(shù)據(jù)的特點(diǎn)是需要語境才能理解的。燃?xì)廨啓C(jī)排氣裝置上的溫度讀數(shù)與一臺(tái)機(jī)車的內(nèi)部溫度是完全不同的闷沥。燃?xì)廨啓C(jī)改善熱敷需要使用非常復(fù)雜的算法運(yùn)行模型萎战。在筆記本電腦上,一個(gè)典型的查詢要獲得答案一般需要三個(gè)星期舆逃。在基于大數(shù)據(jù)的分布式系統(tǒng)上發(fā)布同樣的查詢執(zhí)行一種計(jì)算只需要不到一秒鐘蚂维。
第三方認(rèn)證機(jī)構(gòu)(TüV NORD GROUP),工業(yè)
德國漢德技術(shù)監(jiān)督服務(wù)有限公司的前身是德國鍋爐檢驗(yàn)協(xié)會(huì)(簡稱TüV)早在1869年路狮,德國鍋爐檢驗(yàn)協(xié)會(huì)就承擔(dān)了德國國內(nèi)所有鍋爐運(yùn)行安全的檢驗(yàn)工作虫啥,保證了鍋爐生產(chǎn)的安全。漸漸的奄妨,德國鍋爐檢驗(yàn)協(xié)會(huì)取得了德國政府的授權(quán)涂籽,開展對(duì)其他產(chǎn)品的檢驗(yàn)工作,從采礦砸抛,電力系統(tǒng)開始又活,到壓力容器,機(jī)動(dòng)車輛锰悼,醫(yī)療設(shè)備柳骄,環(huán)境保護(hù),宇航工業(yè)箕般,醫(yī)療產(chǎn)品等等耐薯,現(xiàn)在的德國漢德技術(shù)監(jiān)督服務(wù)有限公司已經(jīng)成為了許許多多產(chǎn)品的安全代號(hào)。主要體系認(rèn)證包括企業(yè)質(zhì)量管理體系丝里,生產(chǎn)環(huán)境體系曲初,生產(chǎn)碳排放方案等。TüV當(dāng)前從建筑綠色標(biāo)準(zhǔn)體系方面提出了對(duì)于大數(shù)據(jù)能源管理的探索杯聚,以微軟新總部臼婆,蒂森克虜伯電梯總部為例,在整個(gè)項(xiàng)目實(shí)施中引入大數(shù)據(jù)能源管理幌绍,在建筑的設(shè)計(jì)規(guī)劃階段颁褂、施工階段、運(yùn)營階段等多個(gè)階段通過數(shù)據(jù)化的能源管理系統(tǒng)傀广,實(shí)現(xiàn)建筑的低碳颁独、綠色、智能伪冰。
工業(yè)自動(dòng)化軟件商(Wonderware)誓酒,工業(yè)
Wonderware作為系統(tǒng)軟件涉及的專業(yè)企業(yè),對(duì)于大數(shù)據(jù)的計(jì)算和運(yùn)用是從比較“IT”的角度出發(fā)的贮聂。Wonderware 的實(shí)時(shí)數(shù)據(jù)管理軟件能夠提供一個(gè)工廠所需要的從建立到報(bào)廢的所有實(shí)時(shí)數(shù)據(jù)靠柑。目前已經(jīng)退出移動(dòng)版本寨辩,工程總監(jiān)在手機(jī)上就能夠隨時(shí)隨地監(jiān)控設(shè)備的運(yùn)行狀況。目前全球超過三分之一的工廠應(yīng)用Wonderware公司的軟件解決方案歼冰。
了解更多:
大數(shù)據(jù)在電力行業(yè)的應(yīng)用前景有哪些捣染?
(3).第三產(chǎn)業(yè)
這一個(gè)部分的內(nèi)容比較多。這里只提出一些典型的應(yīng)用例子停巷,歡迎補(bǔ)充耍攘。
健康與醫(yī)療:Fitbit? Official Site: Flex, One and Zip Wireless Activity and Sleep Trackers的健身腕帶可以收集有關(guān)我們走路或者慢跑的數(shù)據(jù),例如行走步數(shù)畔勤、卡路里消耗蕾各、睡眠時(shí)長等數(shù)據(jù)與健康記錄來改善我們的健康狀況;Early Detection of Patient Deterioration等公司正在開發(fā)床墊監(jiān)測傳感器庆揪,自動(dòng)監(jiān)測和記錄心臟速率式曲、呼吸速率、運(yùn)動(dòng)和睡眠活動(dòng)缸榛。該傳感器收集的數(shù)據(jù)以無線方式被發(fā)送到智能手機(jī)和平板電腦進(jìn)行進(jìn)一步分析吝羞;美國公共衛(wèi)生協(xié)會(huì)(APHA: American Public Health Association)開發(fā)Flu Near You用來的癥狀,通過大數(shù)據(jù)分析生成報(bào)告顯示用戶所在地區(qū)的流感活動(dòng)内颗。
視頻:互聯(lián)網(wǎng)電視能夠追蹤你正在看的內(nèi)容钧排,看了多長時(shí)間,甚至能夠識(shí)別多少人坐在電視機(jī)前均澳,來確定這個(gè)頻道的流行度恨溜。Netflix美國國內(nèi)規(guī)模最大的商業(yè)視頻流供應(yīng)商,收集的數(shù)據(jù)包括用戶在看什么找前、喜歡在什么時(shí)段觀看糟袁、在哪里觀看以及使用哪些設(shè)備觀看等。甚至記錄用戶在哪視頻的哪個(gè)時(shí)間點(diǎn)后退躺盛、快進(jìn)或者暫停项戴,乃至看到哪里直接將視頻關(guān)掉等信息。典型的應(yīng)用是Netflix公司利用數(shù)據(jù)說服BBC重新翻拍了電視連結(jié)劇《紙牌屋》槽惫,而且成功的挖掘出演員Kevin Spacey和導(dǎo)演David Fincher的支持者與原劇集粉絲的關(guān)聯(lián)性周叮,確定新劇拍攝的最佳人選。
When the program, a remake of a BBC miniseries, was up for purchase in 2011 with David Fincher and Kevin Spacey attached, the folks at Netflix simply looked at their massive stash of data. Subscribers who watched the original series, they found, were also likely to watch movies directed by David Fincher and enjoy ones that starred Kevin Spacey. Considering the material and the players involved, the company was sure that an audience was out there.
交通:《車來了》通過分析公交車上GPS定位系統(tǒng)每天的位置和時(shí)間數(shù)據(jù)躯枢,結(jié)合時(shí)刻表預(yù)測出每一輛公交車的到站時(shí)間则吟;WNYC開發(fā)的Transit Time NYC通過開源行程平臺(tái)(Github:OpenTripPlanner和MTA)獲取的數(shù)據(jù)將紐約市劃分成2930個(gè)六邊形,模擬出從每一個(gè)六邊形中點(diǎn)到邊緣的時(shí)間(地鐵和步行锄蹂,時(shí)間是上午九點(diǎn)),最終建模出4290985條虛擬線路水慨。用戶只需點(diǎn)擊地圖或者輸入地址就能知道地鐵到達(dá)每個(gè)位置的時(shí)間得糜;實(shí)時(shí)交通數(shù)據(jù)采集商INRIX-Traffic的口號(hào)是(永不遲到敬扛!^^),通過記錄每位用戶在行駛過程中的實(shí)時(shí)數(shù)據(jù)例如行駛車速朝抖,所在位置等信息并進(jìn)行數(shù)據(jù)匯總分析啥箭,而后計(jì)算出最佳線路,讓用戶能夠避開擁堵治宣。
<img src="https://pic4.zhimg.com/50/6adbebaa31642be94c70fdcf3668abb7_hd.jpg" data-rawwidth="841" data-rawheight="529" class="origin_image zh-lightbox-thumb" width="841" data-original="https://pic4.zhimg.com/6adbebaa31642be94c70fdcf3668abb7_r.jpg">
電子商務(wù):Decide是一家預(yù)測商品價(jià)格并為消費(fèi)者提出購買時(shí)間建議的創(chuàng)業(yè)公司急侥,通過抓取亞馬遜、百思買侮邀、新蛋及全球各大網(wǎng)站上數(shù)以十億計(jì)的數(shù)據(jù)進(jìn)行分析坏怪,最終整合在一個(gè)頁面中方便消費(fèi)者對(duì)比查看,并且能夠預(yù)測產(chǎn)品的價(jià)格趨勢绊茧,幫助用戶確定商品的最好購買時(shí)機(jī)铝宵。已經(jīng)于2013年被 eBay收購。
政治:奧巴馬在總統(tǒng)競選中使用大數(shù)據(jù)分析來收集選民的數(shù)據(jù)华畏,讓他可以專注于對(duì)他最感興趣的選民鹏秋,谷歌執(zhí)行董事長Eric Schmidt當(dāng)時(shí)向奧巴馬的大數(shù)據(jù)分析團(tuán)隊(duì)投資數(shù)百萬美元并聚攏核心成員成立了Civis Analytics咨詢公司,該公司將會(huì)將在奧巴馬連任競選中所獲得的經(jīng)驗(yàn)應(yīng)用到商業(yè)和非營利行業(yè)中亡笑。(了解更多可以看看MIT technology的文章The Definitive Story of How President Obama Mined Voter Data to Win A Second Term)
金融:ZestFinance | Big Data Underwriting是由是Google的前任 CIO侣夷,Douglas Merrill創(chuàng)立金融數(shù)據(jù)分析服務(wù)提供商,使用機(jī)器學(xué)習(xí)算法和大數(shù)據(jù)為放款者提供承保模式仑乌,旨在為那些個(gè)人信用不良或者不滿足傳統(tǒng)銀行貸款資格的個(gè)人提供服務(wù)惜纸。公司使用分析模型對(duì)每位信貸申請(qǐng)人的上萬條原始信息數(shù)據(jù)進(jìn)行分析,只需幾秒時(shí)間便可以得出超過十萬個(gè)行為指標(biāo)绝骚。目前違約率比行業(yè)平均水平低 60%左右耐版。另外一個(gè)不得不提到的是風(fēng)險(xiǎn)管理先驅(qū)者FICO | Predictive Analytics, Big Data Analytics and FICO Credit Scores,通過大數(shù)據(jù)分析為銀行和信用卡發(fā)卡機(jī)構(gòu)压汪、保險(xiǎn)粪牲、醫(yī)療保健、政府和零售行業(yè)提供服務(wù)止剖。FICO 信用分計(jì)算的基本思想是:把借款人過去的信用歷史資料與數(shù)據(jù)庫中的全體借款人的信用習(xí)慣相比較腺阳,檢查借款人的發(fā)展趨勢跟經(jīng)常違約、隨意透支穿香、甚至申請(qǐng)破產(chǎn)等各種陷入財(cái)務(wù)困境的借款人的發(fā)展趨勢是否相似亭引。FICO 已經(jīng)為三分之二的世界 100 強(qiáng)銀行提供服務(wù),提高了客戶忠誠度和盈利率皮获、減少欺詐損失焙蚓、管理信貸風(fēng)險(xiǎn)、滿足監(jiān)管與競爭要求并快速獲取市場份額。想了解更多的企業(yè)可以看看附錄中《經(jīng)濟(jì)學(xué)人》的文章《Big data: Crunching the numbers》购公。
電信:美國T-mobiles采用Informatica - The Data Integration Company平臺(tái)開展大數(shù)據(jù)工作萌京,通過集成數(shù)據(jù)綜合分析客戶流失的原因,根據(jù)分析結(jié)果優(yōu)化網(wǎng)絡(luò)布局為客戶提供了更好的體驗(yàn)宏浩,在一個(gè)季度內(nèi)將流失率減半知残;韓國SK telecom新成立一家公司SK Planet,通過大數(shù)據(jù)分析用戶的使用行為比庄,在用戶做出決定之前推出符合用戶興趣的業(yè)務(wù)防止用戶流失求妹。美國AT&T公司將記錄用戶在Wifi網(wǎng)絡(luò)中的地理位置、網(wǎng)絡(luò)瀏覽歷史記錄以及使用的應(yīng)用等數(shù)據(jù)銷售給廣告客戶佳窑。比如當(dāng)用戶距離商家很近時(shí)制恍,就有可能收到該商家提供的折扣很大的電子優(yōu)惠券。英國BT - Broadband公司發(fā)布了新的安全數(shù)據(jù)分析服務(wù)Assure Analytics—BT news releases华嘹,幫助企業(yè)收集吧趣、管理和評(píng)估大數(shù)據(jù)集,將這些數(shù)據(jù)通過可視化的方式呈現(xiàn)給企業(yè)耙厚,幫助企業(yè)改進(jìn)決策强挫。
一般來說盈利性質(zhì)的商業(yè)公司和企業(yè)都不會(huì)輕易泄露自己的數(shù)據(jù)、建模方法和分析過程薛躬,所以還有很多大家不知道的神秘應(yīng)用潛伏在黑暗里俯渤,如同《三體》中的”黑暗森林法則“。
宇宙就是一座黑暗森林型宝,每個(gè)文明都是帶槍的獵人八匠,像幽靈般潛行于林間,輕輕撥開擋路的樹枝趴酣,竭力不讓腳步發(fā)出一點(diǎn)兒聲音梨树,連呼吸都必須小心翼翼:他必須小心,因?yàn)榱种械教幎加信c他一樣潛行的獵人岖寞,如果他發(fā)現(xiàn)了別的生命抡四,能做的只有一件事:開槍消滅之给猾。在這片森林中脱货,他人就是地獄,就是永恒的威脅火鼻,任何暴露自己存在的生命都將很快被消滅隶垮,這就是宇宙文明的圖景藻雪,這就是對(duì)費(fèi)米悖論的解釋。
二狸吞、大數(shù)據(jù)的定義
大數(shù)據(jù)(Big Data)是指“無法用現(xiàn)有的軟件工具提取勉耀、存儲(chǔ)指煎、搜索、共享瑰排、分析和處理的海量的贯要、復(fù)雜的數(shù)據(jù)集合暖侨⊥肿。”業(yè)界通常用4個(gè)V(即Volume、Variety字逗、Value京郑、Velocity)來概括大數(shù)據(jù)的特征。
數(shù)據(jù)體量巨大(Volume)葫掉。截至目前些举,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,而歷史上全人類說過的所有的話的數(shù)據(jù)量大約是5EB(1EB=210PB)俭厚。
數(shù)據(jù)類型繁多(Variety)户魏。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多挪挤,包括網(wǎng)絡(luò)日志叼丑、音頻、視頻扛门、圖片鸠信、地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求论寨。
價(jià)值密度低(Value)星立。價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。如何通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題葬凳。
處理速度快(Velocity)绰垂。大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”的報(bào)告火焰,預(yù)計(jì)到2020年劲装,全球數(shù)據(jù)使用量將達(dá)到35.2ZB。
看看專家們怎么說荐健。
舍恩伯格酱畅,大數(shù)據(jù)時(shí)代 (豆瓣)
不是隨機(jī)樣本,而是全體數(shù)據(jù)江场;不是精確性纺酸,而是混雜性;不是因果關(guān)系址否,而是相關(guān)關(guān)系餐蔬。
埃里克·西格爾碎紊,大數(shù)據(jù)預(yù)測 (豆瓣)
大數(shù)據(jù)時(shí)代下的核心,預(yù)測分析已在商業(yè)和社會(huì)中得到廣泛應(yīng)用樊诺。隨著越來越多的數(shù)據(jù)被記錄和整理仗考,未來預(yù)測分析必定會(huì)成為所有領(lǐng)域的關(guān)鍵技術(shù)。
城田真琴词爬,大數(shù)據(jù)的沖擊 (豆瓣)
從數(shù)據(jù)的類別上看秃嗜,“大數(shù)據(jù)”指的是無法使用傳統(tǒng)流程或工具處理或分析的信息。 它定義了那些超出正常處理范圍和大小顿膨、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集锅锨。
三、大數(shù)據(jù)的價(jià)值
了解了大數(shù)據(jù)的典型應(yīng)用恋沃,理解了大數(shù)據(jù)的定義必搞。這時(shí)相信在每個(gè)人的心中,關(guān)于大數(shù)據(jù)的價(jià)值都有了自己的答案囊咏。
2010年《Science》上刊登了一篇文章指出恕洲,雖然人們的出行的模式有很大不同,但我們大多數(shù)人同樣是可以預(yù)測的梅割。這意味著我們能夠根據(jù)個(gè)體之前的行為軌跡預(yù)測他或者她未來行蹤的可能性霜第,即93%的人類行為可預(yù)測。
Limits of Predictability in Human Mobility
A range of applications, from predicting the spread of human and electronic viruses to city planning and resource management in mobile communications, depend on our ability to foresee the whereabouts and mobility of individuals, raising a fundamental question: To what degree is human behavior predictable? Here we explore the limits of predictability in human dynamics by studying the mobility patterns of anonymized mobile phone users. By measuring the entropy of each individual’s trajectory, we find a 93% potential predictability in user mobility across the whole user base. Despite the significant differences in the travel patterns, we find a remarkable lack of variability in predictability, which is largely independent of the distance users cover on a regular basis.
而大數(shù)定理告訴我們炮捧,在試驗(yàn)不變的條件下庶诡,重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它概率咆课∧┦模“有規(guī)律的隨機(jī)事件”在大量重復(fù)出現(xiàn)的條件下,往往呈現(xiàn)幾乎必然的統(tǒng)計(jì)特性书蚪。
舉個(gè)例子喇澡,我們向上拋一枚硬幣,硬幣落下后哪一面朝上本來是偶然的殊校,但當(dāng)我們上拋硬幣的次數(shù)足夠多后晴玖,達(dá)到上萬次甚至幾十萬幾百萬次以后,我們就會(huì)發(fā)現(xiàn)为流,硬幣每一面向上的次數(shù)約占總次數(shù)的二分之一呕屎。偶然中包含著某種必然。
隨著計(jì)算機(jī)的處理能力的日益強(qiáng)大敬察,你能獲得的數(shù)據(jù)量越大秀睛,你能挖掘到的價(jià)值就越多。
實(shí)驗(yàn)的不斷反復(fù)莲祸、大數(shù)據(jù)的日漸積累讓人類發(fā)現(xiàn)規(guī)律蹂安,預(yù)測未來不再是科幻電影里的讀心術(shù)椭迎。
如果銀行能及時(shí)地了解風(fēng)險(xiǎn),我們的經(jīng)濟(jì)將更加強(qiáng)大田盈。
如果政府能夠降低欺詐開支畜号,我們的稅收將更加合理。
如果醫(yī)院能夠更早發(fā)現(xiàn)疾病允瞧,我們的身體將更加健康简软。
如果電信公司能夠降低成本,我們的話費(fèi)將更加便宜瓷式。
如果交通動(dòng)態(tài)天氣能夠掌握替饿,我們的出行將更加方便语泽。
如果商場能夠動(dòng)態(tài)調(diào)整庫存贸典,我們的商品將更加實(shí)惠。
最終踱卵,我們都將從大數(shù)據(jù)分析中獲益廊驼。
四、結(jié)束語惋砂。
Here's the thing about the future.關(guān)于未來有一個(gè)重要的特征
Every time you look at it,每一次你看到了未來
it changes because you looked at it.它會(huì)跟著發(fā)生改變 因?yàn)槟憧吹搅怂?/p>
And that changes everything else.然后其它事也跟著一起改變了
數(shù)據(jù)本身不產(chǎn)生價(jià)值妒挎,如何分析和利用大數(shù)據(jù)對(duì)業(yè)務(wù)產(chǎn)生幫助才是關(guān)鍵。
祝每一個(gè)DMer都挖掘到金礦和快樂:)
參考文獻(xiàn):
[1].什么是大數(shù)據(jù)時(shí)代的思維西饵?《大數(shù)據(jù)時(shí)代》作者維克托邁爾舍恩伯格的演講
[2].New movie damns Monsanto's deadly sins
[3].American farmers confront 'big data' revolution
[4].The Industrial Internet: Even Bigger Than Big Data
[5].《信息化和工業(yè)化深度融合專項(xiàng)行動(dòng)計(jì)劃(2013-2018年)》印發(fā)
[6].Big data: The next frontier for innovation, competition, and productivity
[7].Big data: Crunching the numbers
[8].audit.gov.cn
[9].中國金融行業(yè)大數(shù)據(jù)應(yīng)用市場研究白皮書
[10].The Secret Sauce Behind Netflix's Hit, "House Of Cards": Big Data
[11].Open data: Unlocking innovation and performance with liquid information
-
-----------2017年1月更新-----
歡迎關(guān)注我存儲(chǔ)知識(shí)的地方:預(yù)見未來——Han Hsiao的知乎專欄Foresee
-
4.7K?152 條評(píng)論
?分享
?收藏?感謝收起
產(chǎn)品經(jīng)理話題的優(yōu)秀回答者
890 人贊同了該回答
從龐雜的數(shù)據(jù)背后挖掘酝掩、分析用戶的行為習(xí)慣和喜好,找出更符合用戶「口味」的產(chǎn)品和服務(wù)眷柔,并結(jié)合用戶需求有針對(duì)性地調(diào)整和優(yōu)化自身期虾,就是大數(shù)據(jù)的價(jià)值。
對(duì)于大數(shù)據(jù)在商業(yè)上的用途驯嘱,這句話說得很清楚镶苞。前半句是重點(diǎn),了解用戶的行為習(xí)慣和愛好鞠评,這就是大數(shù)據(jù)的核心價(jià)值茂蚓。
1. 元數(shù)據(jù)(Metadata)的概念
簡單說,元數(shù)據(jù)是對(duì)數(shù)據(jù)本身進(jìn)行描述的數(shù)據(jù)剃幌,或者說聋涨,它不是對(duì)象本身,它只描述對(duì)象的屬性负乡。
比如牍白,一幅畫本身,是數(shù)據(jù)敬鬓。而這幅畫的作者淹朋、完成時(shí)間笙各、尺寸、價(jià)格础芍、類型等等杈抢,就是它的元數(shù)據(jù)。
再比如仑性,你媽逼你結(jié)婚惶楼,找了個(gè)男的讓你相親。你并不認(rèn)識(shí)他诊杆,但你媽告訴你他的年齡歼捐、身高、體重晨汹、體貌特征豹储、家庭背景、收入淘这、愛好特長剥扣,你心里也就對(duì)他有了印象。即便你還不認(rèn)識(shí)他铝穷。
元數(shù)據(jù)的價(jià)值钠怯,第一是能夠從側(cè)面描述對(duì)象,第二點(diǎn)就是可以結(jié)構(gòu)化曙聂、信息化晦炊。
什么意思呢?
比如宁脊,我們要判斷一幅畫的價(jià)值断国,除了專家直接通過畫的藝術(shù)性來評(píng)價(jià),還可以通過元數(shù)據(jù)來判斷朦佩。
這幅畫是名家的還是二流畫家的并思?這幅畫是作者在他創(chuàng)作鼎盛時(shí)期的作品,還是在年輕時(shí)的作品语稠?這幅畫是作者擅長的類型還是他不熟悉的宋彼?
用這些描述的信息,我們居然就能把這幅畫的價(jià)值算得八九不離十仙畦。雖然肯定會(huì)存在誤差输涕,但同樣是科學(xué)合理的方法。
那用元數(shù)據(jù)而非數(shù)據(jù)本身描述對(duì)象的意義何在慨畸?
這就是在大數(shù)據(jù)上產(chǎn)生的價(jià)值了:對(duì)于非結(jié)構(gòu)化的莱坎、非量化的對(duì)象本身,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計(jì)算和判斷寸士。
比如檐什,你媽拿了 100 個(gè)單身男的資料碴卧,你要是一個(gè)一個(gè)去仔細(xì)翻閱,那幾天都翻不完乃正。但你告訴你媽住册,高學(xué)歷的可能意味著素質(zhì)很高,高收入的可能意味著能力很強(qiáng)瓮具,所以先把低學(xué)歷低收入的篩掉荧飞,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了名党。
注意叹阔,這樣的方法仍然會(huì)有失誤的,說不定真愛就在被篩掉的人里传睹。但這樣的概率微乎其微耳幢。
相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中蒋歌,產(chǎn)生的效果就天翻地覆了帅掘。
2. 大數(shù)據(jù)應(yīng)用的第一階段:輔助產(chǎn)品。
最初的應(yīng)用比較簡單堂油,就是用以輔助產(chǎn)品人員和市場人員做判斷。
過去的實(shí)體產(chǎn)品做一次調(diào)研很麻煩碧绞。比如飲料公司府框,調(diào)研人員要用各種方式觀看他們喝飲料的場景和步驟。
問卷是最常見的讥邻,但不準(zhǔn)迫靖。所以會(huì)組織各種各樣專業(yè)的現(xiàn)場試驗(yàn),要搭建環(huán)境(一般是有單面玻璃或攝像頭的)兴使、邀請(qǐng)志愿者系宜,然后引導(dǎo)他們按照日常的習(xí)慣去完成一些操作。
比如這樣的通過攝像頭監(jiān)視觀察室发魄。
<img src="https://pic4.zhimg.com/50/5d5e8c4c2852ec6b547387d908380b9f_hd.jpg" data-rawwidth="2048" data-rawheight="1536" class="origin_image zh-lightbox-thumb" width="2048" data-original="https://pic4.zhimg.com/5d5e8c4c2852ec6b547387d908380b9f_r.jpg">(圖片摘自:
(圖片摘自:http://210.38.160.80/jkx/newsdetail.asp?id=1038)
顯然這種辦法非常笨重盹牧。
而現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品則根本無須這么麻煩。用戶所有的使用數(shù)據(jù)励幼、行為汰寓,都是記錄在案的,想知道什么苹粟,瞬間就能分析出來有滑。
過去想知道用戶有沒有做一件事,比如有沒有用過這個(gè)功能嵌削?太難了毛好。
現(xiàn)在呢望艺,就問點(diǎn)擊這個(gè)行為,點(diǎn)擊了幾下肌访、點(diǎn)擊在哪里荣茫,什么時(shí)候點(diǎn)的,甚至這是在什么地方點(diǎn)的场靴、點(diǎn)擊之后又做了什么啡莉,一清二楚。
用戶平時(shí)用不用這個(gè)功能旨剥、怎么用這個(gè)功能咧欣,也就一目了然。
對(duì)于產(chǎn)品設(shè)計(jì)者來說轨帜,這是至關(guān)重要的數(shù)據(jù)魄咕。而且,這是完整的數(shù)據(jù)蚌父!如果是互聯(lián)網(wǎng)產(chǎn)品哮兰,那么我知道的是所有用戶的數(shù)據(jù),不是過去傳統(tǒng)行業(yè)產(chǎn)品的樣本數(shù)據(jù)苟弛。
騰訊知道所有微信用戶有多少用朋友圈喝滞、知道這些用戶每天都發(fā)幾條朋友圈、知道這些用戶每天都發(fā)了什么膏秫。每一個(gè)數(shù)據(jù)都是真實(shí)可用的右遭。
<img src="https://pic2.zhimg.com/50/926e7b3097b35d088e3d5d279d8e6605_hd.jpg" data-rawwidth="947" data-rawheight="548" class="origin_image zh-lightbox-thumb" width="947" data-original="https://pic2.zhimg.com/926e7b3097b35d088e3d5d279d8e6605_r.jpg">
(過去發(fā)行量再大的報(bào)紙也很難知道讀者性別,然而現(xiàn)在再小的微信公眾號(hào)也可以實(shí)時(shí)獲取缤削。)
在實(shí)體產(chǎn)品的行業(yè)窘哈,隨著未來整個(gè)產(chǎn)品從生產(chǎn)到銷售到使用的信息化,大數(shù)據(jù)也會(huì)漸漸起到更大的作用亭敢。過去我賣的一瓶水滚婉,可能到某個(gè)超市就斷掉了,我不知道這瓶水被誰買走了帅刀。但現(xiàn)在我在天貓賣的一瓶水让腹,我知道對(duì)方這個(gè)用戶是每個(gè)月買十箱水的,他的地址是某個(gè)高檔餐廳劝篷,那我就知道這瓶水的目標(biāo)受眾是誰了哨鸭。
這是元數(shù)據(jù)的價(jià)值所在。
所以說娇妓,大數(shù)據(jù)的第一階段是:輔助產(chǎn)品設(shè)計(jì)者做判斷像鸡、讓產(chǎn)品制造者更好地滿足用戶。
<img src="https://pic3.zhimg.com/50/4eaf9f5da965eb642ec4dabf9ca5060a_hd.png" data-rawwidth="877" data-rawheight="293" class="origin_image zh-lightbox-thumb" width="877" data-original="https://pic3.zhimg.com/4eaf9f5da965eb642ec4dabf9ca5060a_r.png">這時(shí)候的大數(shù)據(jù)主要是來為產(chǎn)品提供支持,產(chǎn)品再應(yīng)用于用戶只估。
這時(shí)候的大數(shù)據(jù)主要是來為產(chǎn)品提供支持志群,產(chǎn)品再應(yīng)用于用戶。
3. 大數(shù)據(jù)應(yīng)用的第二階段:創(chuàng)造價(jià)值蛔钙。
在數(shù)據(jù)的數(shù)量和質(zhì)量達(dá)到一定程度后锌云,事情開始變化了。元數(shù)據(jù)將不僅作為產(chǎn)品的輔助吁脱,而是變成了最有價(jià)值的產(chǎn)生本身桑涎。
很簡單的,全中國最熟悉老百姓消費(fèi)習(xí)慣的是工商局嗎兼贡?是哪個(gè)協(xié)會(huì)嗎攻冷?是哪個(gè)科研機(jī)構(gòu)嗎?都不是遍希,是淘寶等曼。
擁有最全面的個(gè)人信用信息的,是人事局嗎凿蒜?是銀行嗎禁谦?是咨詢公司嗎?都不是废封,是支付寶州泊。
道理也簡單得很,所有行為(消費(fèi)虱饿、交易)發(fā)生在了這個(gè)平臺(tái)上拥诡,而這個(gè)平臺(tái)又有所有數(shù)據(jù)的記錄,那這些數(shù)據(jù)就能產(chǎn)生巨大的價(jià)值氮发。
你以為做醫(yī)療健康這方面的產(chǎn)品僅僅是關(guān)注你的健康嗎?并不是冗懦,他們同時(shí)還能夠記錄你所有的體征爽冕,這是第一線的臨床數(shù)據(jù)。
此時(shí)披蕉,大數(shù)據(jù)本身已經(jīng)成為了產(chǎn)品颈畸,可以輸出有價(jià)值的內(nèi)容。
消費(fèi)行為數(shù)據(jù)没讲,賣給廣告商眯娱,廣告商就可以定向給你投送廣告;信用數(shù)據(jù)爬凑,賣給銀行徙缴,銀行就可以判斷出你的信用程度;健康數(shù)據(jù)嘁信,賣給保險(xiǎn)公司...你懂的于样。
近幾年疏叨,互聯(lián)網(wǎng)公司已經(jīng)能夠?qū)θ珖黝I(lǐng)域的市場,給出最有說服力的統(tǒng)計(jì)報(bào)告了穿剖,這些之前可都是政府做的:
淘寶網(wǎng)發(fā)布中國互聯(lián)網(wǎng)消費(fèi)趨勢報(bào)告
攜程旅行網(wǎng)發(fā)布《2014年旅游者調(diào)查報(bào)告》
滴滴攜兩大機(jī)構(gòu)發(fā)布首份智能出行年度報(bào)告
不僅僅是將數(shù)據(jù)出售蚤蔓,數(shù)據(jù)提供的內(nèi)容完全可以創(chuàng)造出新的產(chǎn)品。尤其像 O2O 這樣的產(chǎn)品/服務(wù)糊余,上游是服務(wù)提供者和資源秀又,下游是用戶,都能夠有價(jià)值可以發(fā)掘贬芥。
以前做美甲的時(shí)候吐辙,我們設(shè)想的商業(yè)模式,有一項(xiàng)就是從上游誓军,了解美甲師用品的情況袱讹,跟生產(chǎn)廠家合作,把控渠道昵时;另外就是從下游捷雕,知道用戶的情況,從而也能夠跟其他美業(yè)產(chǎn)品合作(定向幫你把產(chǎn)品帶到家里壹甥,河貍家其實(shí)已經(jīng)在做)救巷,來讓用戶數(shù)據(jù)產(chǎn)生價(jià)值。
我之前聽說餓了么在嘗試一項(xiàng)新服務(wù)句柠,就是為餐館提供食材浦译。乍一聽有點(diǎn)怪,但后來想想的確是再合理不過溯职。除了餓了么還有誰更能清楚某塊區(qū)域的餐品售賣數(shù)據(jù)呢精盅?這地方蘿卜白菜賣得多、有多少量谜酒,餓了么清楚得很叹俏,跟農(nóng)場談合作,可以很好地把控上游渠道僻族。
<img src="https://pic4.zhimg.com/50/9644e5872c6d5d68e74f34784e5fd2b7_hd.png" data-rawwidth="808" data-rawheight="333" class="origin_image zh-lightbox-thumb" width="808" data-original="https://pic4.zhimg.com/9644e5872c6d5d68e74f34784e5fd2b7_r.png">這階段的大數(shù)據(jù)粘驰,已經(jīng)可以成為產(chǎn)品,為用戶直接服務(wù)述么。
這階段的大數(shù)據(jù)蝌数,已經(jīng)可以成為產(chǎn)品,為用戶直接服務(wù)度秘。
從另一個(gè)角度看顶伞,不知道你發(fā)現(xiàn)沒,通過我們行為數(shù)據(jù)這些元數(shù)據(jù),我們已經(jīng)在慢慢被量化的信息給描述出來了枝哄∫蘩妫看到這些數(shù)字(一年花了多少錢、在哪方面花的錢等等)已經(jīng)對(duì)這個(gè)人可以有相對(duì)粗糙的認(rèn)識(shí)了挠锥。
而大數(shù)據(jù)最終的形態(tài)開始初現(xiàn)众羡。
4. 大數(shù)據(jù)應(yīng)用的第三階段:塑造我們。
我之前也總是對(duì)行為數(shù)據(jù)表示不屑蓖租。你知道我在淘寶買了點(diǎn)東西粱侣、跟誰微信聊了幾句話、去百度隨便查了點(diǎn)東西蓖宦,就能知道我是什么人了齐婴?
還真的可以。只要數(shù)據(jù)保質(zhì)保量稠茂。
我知道你一個(gè)月沒買避孕套這兩天突然買了三盒柠偶,那可能是你要跟異地戀的女朋友見面了;我發(fā)現(xiàn)你微信跟異地的某個(gè)妹子聊得特別多睬关、經(jīng)常還視頻诱担,那這大概就是你異地的女朋友;我了解你在百度一直搜東南亞的機(jī)票和旅行攻略电爹,那我知道你可能要去那里玩蔫仙。
就是這么簡單的三條元數(shù)據(jù),我就能推測出來丐箩,你很大概率上摇邦,最近要跟女朋友一起去東南亞旅行。
說實(shí)話屎勘,做這么基礎(chǔ)的邏輯推斷施籍,比下圍棋容易多了。
這是說明元數(shù)據(jù)能夠推理信息的邏輯性概漱。而對(duì)于可獲取的元數(shù)據(jù)法梯,也越來越多了。
你打電話時(shí)犀概,可以知道你給誰打(婦科醫(yī)生?要生孩子了夜惭。律師姻灶?最近有官司。)
你買東西時(shí)诈茧,可以知道你的消費(fèi)能力产喉、家庭狀況、喜好甚至性格(高端筆記本?愛玩游戲曾沈。蠟筆和簡筆畫冊这嚣?家里有小孩。)
你出門消費(fèi)時(shí)塞俱,可以知道你的生活習(xí)慣和個(gè)人情況(健身房姐帚?應(yīng)該很健康。經(jīng)常大保秸涎摹罐旗?可能身體比較虛。)
你加別人微信時(shí)唯蝶,可以知道你的社交圈子(認(rèn)識(shí)李開復(fù)九秀?應(yīng)該不是一般人。通訊錄里都是快遞員粘我?那可能也是快遞員鼓蜒。)
作為這些產(chǎn)品的數(shù)據(jù)的擁有者,我完全不需要派個(gè)私家偵探來跟蹤你征字。只需要等你自己乖乖把這些數(shù)據(jù)送上來都弹。
春節(jié)的時(shí)候,支付寶為什么要和微信爭搶小額支付和社交場景的支付柔纵?不是為了那點(diǎn)手續(xù)費(fèi)缔杉,就是為了它缺失的社交支付這一塊。這塊數(shù)據(jù)的價(jià)值搁料,遠(yuǎn)超想象或详。
未來我們每個(gè)人的衣食住行、生活起居郭计,都將有大量的數(shù)據(jù)記錄霸琴。我們的行為會(huì)變成一串串?dāng)?shù)字成為可量化的數(shù)據(jù),成為描述我們的信息昭伸。我們工作用云筆記梧乘、吃飯用餓了么、打車用滴滴庐杨、搜東西用百度选调、社交用微信,每一步都事無巨細(xì)被記了下來灵份。
不信你可以翻出你歷史所有在百度或者 Google 的搜索記錄來仁堪,對(duì)你生活的描述絕對(duì)比你自己的日記都要真實(shí)。
這些數(shù)據(jù)將被轉(zhuǎn)換成有價(jià)值的商業(yè)數(shù)據(jù)填渠,來描述你各方面的信息弦聂。你喜歡黑色的衣服鸟辅、你喜歡胸大的妹子、你比較文藝莺葫、你有高度近視匪凉、你最近剛失戀...... 關(guān)于你,可能這些數(shù)據(jù)比你爹媽都要清楚捺檬。
<img src="https://pic2.zhimg.com/50/3b67117e66216233bacc4638fcd3aa35_hd.png" data-rawwidth="820" data-rawheight="299" class="origin_image zh-lightbox-thumb" width="820" data-original="https://pic2.zhimg.com/3b67117e66216233bacc4638fcd3aa35_r.png">最終再层,我們本身就是可以被量化的大數(shù)據(jù)對(duì)象,不存在多層的邏輯了欺冀。
最終树绩,我們本身就是可以被量化的大數(shù)據(jù)對(duì)象,不存在多層的邏輯了隐轩。
這樣的未來自然有利有弊饺饭。利是我們無處不在享受著大數(shù)據(jù)帶來的便利,我們看到的每一條廣告都會(huì)是我們自己喜歡的职车,我們查的每一條搜索記錄都是根據(jù)我們特點(diǎn)來推薦的瘫俊,我們在加好友時(shí)系統(tǒng)甚至都可以說他是不是會(huì)跟我們合得來。
弊在于悴灵,我們的隱私就暴露無疑扛芽。只要數(shù)據(jù)的擁有者想做點(diǎn)壞事,那真的是什么都有可能积瞒。
大數(shù)據(jù)絕不會(huì)止步在為決策僅僅提供幫助川尖,它的終極形態(tài)就是可以用海量的數(shù)據(jù)描述我們一個(gè)個(gè)具體的個(gè)體。當(dāng)達(dá)到這一步時(shí)茫孔,現(xiàn)在所謂的市場調(diào)研叮喳、用戶分析就都是小兒科了。
因?yàn)殓直矗髷?shù)據(jù)已經(jīng)完全能夠塑造出我們了馍悟。