大數(shù)據(jù)應(yīng)用的關(guān)鍵點(diǎn)是數(shù)據(jù)來源、產(chǎn)品化和價(jià)值創(chuàng)造;數(shù)據(jù)資源分布不均帕识,大數(shù)據(jù)應(yīng)用在數(shù)據(jù)密集領(lǐng)域更易獲得突破泛粹;須對(duì)不當(dāng)?shù)男袠I(yè)管理模式進(jìn)行改革,以促進(jìn)大數(shù)據(jù)在已有各個(gè)行業(yè)中應(yīng)用。
大數(shù)據(jù)貴在應(yīng)用肮疗。當(dāng)前晶姊,在國家層面,國務(wù)院出臺(tái)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》族吻;在地方層面帽借,大數(shù)據(jù)被作為區(qū)域發(fā)展戰(zhàn)略引擎;在企業(yè)層面超歌,各類大數(shù)據(jù)概念公司方興未艾砍艾、蓬勃發(fā)展。我們獨(dú)關(guān)注大數(shù)據(jù)應(yīng)用巍举,關(guān)注數(shù)據(jù)從哪里來脆荷、數(shù)據(jù)怎么用、成果誰買單懊悯,也就是數(shù)據(jù)來源蜓谋、產(chǎn)品化和價(jià)值創(chuàng)造三個(gè)關(guān)鍵點(diǎn)。一個(gè)好的大數(shù)據(jù)應(yīng)用炭分,從技術(shù)上可能很復(fù)雜桃焕,但從業(yè)務(wù)模式上應(yīng)當(dāng)簡(jiǎn)單、直白捧毛、管用观堂。我們還關(guān)注,是否存在若干“數(shù)據(jù)密集型”行業(yè)或領(lǐng)域呀忧,大數(shù)據(jù)應(yīng)用在這些領(lǐng)域可能更容易開展师痕。在產(chǎn)業(yè)政策方面,我們關(guān)注作為新興業(yè)態(tài)的大數(shù)據(jù)而账,過去屢試不爽的做法胰坟,如給地、給錢泞辐、給項(xiàng)目等笔横,是否還會(huì)繼續(xù)有效?科多大數(shù)據(jù)帶你們一起來看看铛碑。
大數(shù)據(jù)應(yīng)用的三個(gè)關(guān)鍵點(diǎn)
國務(wù)院《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(簡(jiǎn)稱《大數(shù)據(jù)綱要》)將大數(shù)據(jù)定位為“新一代信息技術(shù)和服務(wù)業(yè)態(tài)”狠裹,賦予大數(shù)據(jù)“推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展”“重塑國家競(jìng)爭(zhēng)優(yōu)勢(shì)”“提升政府治理能力”的戰(zhàn)略功能,并將數(shù)據(jù)界定為“國家基礎(chǔ)性戰(zhàn)略資源”汽烦。在應(yīng)用方面沈矿,《大數(shù)據(jù)綱要》在公共領(lǐng)域提出許多發(fā)展方向靶瘸,如宏觀調(diào)控科學(xué)化且轨、政府治理精準(zhǔn)化堆巧、商事服務(wù)便捷化、安全保障高效化牍颈、民生服務(wù)普惠化迄薄;在產(chǎn)業(yè)層面,主要按行業(yè)領(lǐng)域劃分為工業(yè)大數(shù)據(jù)煮岁、新興產(chǎn)業(yè)大數(shù)據(jù)讥蔽、農(nóng)業(yè)農(nóng)村大數(shù)據(jù)、萬眾創(chuàng)新大數(shù)據(jù)画机,以及大數(shù)據(jù)產(chǎn)品體系和大數(shù)據(jù)產(chǎn)業(yè)鏈冶伞。這些方向,只是大數(shù)據(jù)應(yīng)用的潛力和空間步氏,能不能應(yīng)用起來响禽,能不能發(fā)揮作用,還得看有沒有可行模式和實(shí)際效果荚醒。無論是在公共領(lǐng)域還是在產(chǎn)業(yè)層面芋类,大數(shù)據(jù)應(yīng)用都離不開數(shù)據(jù)來源、處理技術(shù)和方法界阁、創(chuàng)造價(jià)值的模式侯繁,這是我們關(guān)注的重點(diǎn)。概括來說泡躯,需要回答下面三個(gè)看似簡(jiǎn)單贮竟、卻是關(guān)鍵的問題。
(一)數(shù)據(jù)從哪里來
關(guān)于數(shù)據(jù)來源精续,普遍認(rèn)為互聯(lián)網(wǎng)及物聯(lián)網(wǎng)是產(chǎn)生并承載大數(shù)據(jù)的基地坝锰。互聯(lián)網(wǎng)公司是天生的大數(shù)據(jù)公司重付,在搜索顷级、社交、媒體确垫、交易等各自核心業(yè)務(wù)領(lǐng)域弓颈,積累并持續(xù)產(chǎn)生海量數(shù)據(jù)。物聯(lián)網(wǎng)設(shè)備每時(shí)每刻都在采集數(shù)據(jù)删掀,設(shè)備數(shù)量和數(shù)據(jù)量都與日俱增翔冀。這兩類數(shù)據(jù)資源作為大數(shù)據(jù)金礦,正在不斷產(chǎn)生各類應(yīng)用披泪。國外關(guān)于大數(shù)據(jù)的成功經(jīng)驗(yàn)介紹纤子,大多是這類數(shù)據(jù)資源應(yīng)用的經(jīng)典案例。還有一些企業(yè),在業(yè)務(wù)中也積累了許多數(shù)據(jù)控硼,如房地產(chǎn)交易泽论、大宗商品價(jià)格、特定群體消費(fèi)信息等卡乾。從嚴(yán)格意義上講翼悴,這些數(shù)據(jù)資源還算不上大數(shù)據(jù),但對(duì)商業(yè)應(yīng)用而言幔妨,卻是最易獲得和比較容易加工處理的數(shù)據(jù)資源鹦赎,也是當(dāng)前在國內(nèi)比較常見的應(yīng)用資源。
在國內(nèi)還有一類是政府部門掌握的數(shù)據(jù)資源误堡,普遍認(rèn)為質(zhì)量好古话、價(jià)值高,但開放程度低埂伦∩范睿《大數(shù)據(jù)綱要》把公共數(shù)據(jù)互聯(lián)開放共享作為努力方向,認(rèn)為大數(shù)據(jù)技術(shù)可以實(shí)現(xiàn)這個(gè)目標(biāo)沾谜。實(shí)際上膊毁,長期以來政府部門間信息數(shù)據(jù)相互封閉割裂,是治理問題而不是技術(shù)問題基跑。面向社會(huì)的公共數(shù)據(jù)開放愿望十分美好婚温,恐怕一段時(shí)間內(nèi)可望不可及。在數(shù)據(jù)資源方面媳否,國內(nèi)“小數(shù)據(jù)”“中數(shù)據(jù)”應(yīng)用并不充分栅螟,試圖一步跨入大數(shù)據(jù)時(shí)代,借機(jī)一并解決前期信息化過程中沒能解決的問題篱竭,前景并不樂觀力图。另外,由于中國互聯(lián)網(wǎng)公司業(yè)務(wù)主要在國內(nèi)掺逼,其大數(shù)據(jù)資源也不是全球性的吃媒。
數(shù)據(jù)從哪里來是我們?cè)u(píng)價(jià)大數(shù)據(jù)應(yīng)用的第一個(gè)關(guān)注點(diǎn)。一是要看這個(gè)應(yīng)用是否真有數(shù)據(jù)支撐吕喘,數(shù)據(jù)資源是否可持續(xù)赘那,來源渠道是否可控,數(shù)據(jù)安全和隱私保護(hù)方面是否有隱患氯质。二是要看這個(gè)應(yīng)用的數(shù)據(jù)資源質(zhì)量如何募舟,是“富礦”還是“貧礦”,能否保障這個(gè)應(yīng)用的實(shí)效闻察。對(duì)于來自自身業(yè)務(wù)的數(shù)據(jù)資源拱礁,具有較好的可控性琢锋,數(shù)據(jù)質(zhì)量一般也有保證,但數(shù)據(jù)覆蓋范圍可能有限觅彰,需要借助其他資源渠道吩蔑。對(duì)于從互聯(lián)網(wǎng)抓取的數(shù)據(jù)钮热,技術(shù)能力是關(guān)鍵填抬,既要有能力獲得足夠大的量,又要有能力篩選出有用的內(nèi)容隧期。對(duì)于從第三方獲取的數(shù)據(jù)飒责,需要特別關(guān)注數(shù)據(jù)交易的穩(wěn)定性。數(shù)據(jù)從哪里來是分析大數(shù)據(jù)應(yīng)用的起點(diǎn)仆潮,如果一個(gè)應(yīng)用沒有可靠的數(shù)據(jù)來源宏蛉,再好、再高超的數(shù)據(jù)分析技術(shù)都是無本之木性置。
(二)數(shù)據(jù)怎么用
數(shù)據(jù)怎么用是我們?cè)u(píng)價(jià)大數(shù)據(jù)應(yīng)用的第二個(gè)關(guān)注點(diǎn)拾并。大數(shù)據(jù)只是一種手段,并不能無所不包鹏浅、無所不用嗅义。我們關(guān)注大數(shù)據(jù)能做什么、不能做什么隐砸,現(xiàn)在看來之碗,大數(shù)據(jù)主要有以下幾種較為常用的功能。
追蹤季希⊥誓牵互聯(lián)網(wǎng)和物聯(lián)網(wǎng)無時(shí)無刻都在記錄,大數(shù)據(jù)可以追蹤式塌、追溯任何一個(gè)記錄博敬,形成真實(shí)的歷史軌跡。追蹤是許多大數(shù)據(jù)應(yīng)用的起點(diǎn)峰尝,包括消費(fèi)者購買行為偏窝、購買偏好、支付手段境析、搜索和瀏覽歷史囚枪、位置信息,等等劳淆。
識(shí)別链沼。在對(duì)各種因素全面追蹤的基礎(chǔ)上,通過定位沛鸵、比對(duì)括勺、篩選缆八,可以實(shí)現(xiàn)精準(zhǔn)識(shí)別,尤其是對(duì)語音疾捍、圖像奈辰、視頻進(jìn)行識(shí)別,使可分析內(nèi)容大大豐富乱豆,得到的結(jié)果更為精準(zhǔn)奖恰。
畫像。通過對(duì)同一主體不同數(shù)據(jù)源的追蹤宛裕、識(shí)別瑟啃、匹配,形成更立體的刻畫和更全面的認(rèn)識(shí)揩尸。對(duì)消費(fèi)者畫像蛹屿,可以精準(zhǔn)推送廣告和產(chǎn)品;對(duì)企業(yè)畫像岩榆,可以準(zhǔn)確判斷信用及風(fēng)險(xiǎn)错负。
提示。在歷史軌跡勇边、識(shí)別和畫像基礎(chǔ)上犹撒,對(duì)未來趨勢(shì)及重復(fù)出現(xiàn)的可能性進(jìn)行預(yù)測(cè),當(dāng)某些指標(biāo)出現(xiàn)預(yù)期變化或超預(yù)期變化時(shí)給予提示粥诫、預(yù)警油航。以前也有基于統(tǒng)計(jì)的預(yù)測(cè),大數(shù)據(jù)大大豐富了預(yù)測(cè)手段怀浆,對(duì)建立風(fēng)險(xiǎn)控制模型有深刻意義谊囚。
匹配。在海量信息中精準(zhǔn)追蹤和識(shí)別执赡,利用相關(guān)性镰踏、接近性等進(jìn)行篩選比對(duì),更有效率地實(shí)現(xiàn)產(chǎn)品搭售和供需匹配沙合。大數(shù)據(jù)匹配功能是互聯(lián)網(wǎng)約車奠伪、租房、金融等共享經(jīng)濟(jì)新商業(yè)模式的基礎(chǔ)首懈。
優(yōu)化绊率。按距離最短、成本最低等給定的原則究履,通過各種算法對(duì)路徑滤否、資源等進(jìn)行優(yōu)化配置。對(duì)企業(yè)而言最仑,提高服務(wù)水平藐俺、提升內(nèi)部效率炊甲;對(duì)公共部門而言,節(jié)約公共資源欲芹、提升公共服務(wù)能力卿啡。
當(dāng)前許多貌似復(fù)雜的應(yīng)用,大都可以細(xì)分成以上幾種類型菱父。例如颈娜,貴州推行的“大數(shù)據(jù)精準(zhǔn)扶貧項(xiàng)目”,從大數(shù)據(jù)應(yīng)用角度滞伟,通過識(shí)別揭鳞、畫像,可以對(duì)貧困戶實(shí)現(xiàn)精準(zhǔn)篩選和界定梆奈,找準(zhǔn)扶貧對(duì)象;通過追蹤称开、提示亩钟,可以對(duì)扶貧資金、扶貧行為和扶貧效果進(jìn)行監(jiān)控和評(píng)估鳖轰;通過配對(duì)清酥、優(yōu)化,可以更好地發(fā)揮扶貧資源的作用蕴侣。這些功能也并不都是大數(shù)據(jù)所特有的焰轻,只是大數(shù)據(jù)遠(yuǎn)遠(yuǎn)超出以前的技術(shù),可以做得更強(qiáng)大昆雀、更精準(zhǔn)辱志、更快、更好狞膘。
(三)成果誰買單
成果誰買單是我們?cè)u(píng)價(jià)大數(shù)據(jù)應(yīng)用的第三個(gè)也是最后一個(gè)關(guān)注點(diǎn)揩懒。道理很簡(jiǎn)單,不創(chuàng)造價(jià)值的應(yīng)用不是好應(yīng)用挽封。我們關(guān)注大數(shù)據(jù)的應(yīng)用是否實(shí)實(shí)在在地提升了能力已球、改善了績效。如果大數(shù)據(jù)用于自身的產(chǎn)品設(shè)計(jì)辅愿、營銷推廣智亮、資源配置,那就看企業(yè)競(jìng)爭(zhēng)力是不是提升了点待,看企業(yè)最終是不是比以前更賺錢了阔蛉。如果大數(shù)據(jù)用于為第三方提供服務(wù),那就看是不是有人愿意付費(fèi)亦鳞、愿意持續(xù)付費(fèi)馍忽。但如果是用于公共領(lǐng)域棒坏,還要看政府或公共部門的付費(fèi)值不值,不僅僅是從出資方的視角看值不值遭笋,還要從老百姓的視角看值不值坝冕。
當(dāng)我們面對(duì)一項(xiàng)大數(shù)據(jù)應(yīng)用時(shí),只要簡(jiǎn)單問一問上面三個(gè)問題——數(shù)據(jù)從哪里來瓦呼、數(shù)據(jù)怎么用喂窟、成果誰買單,就能揭開許多“偽裝”央串。當(dāng)然磨澡,如果經(jīng)得起上述“大數(shù)據(jù)三問”,也并非一定算得上優(yōu)秀质和,卻也離優(yōu)秀的大數(shù)據(jù)應(yīng)用不遠(yuǎn)了稳摄。
尋找數(shù)據(jù)密集型領(lǐng)域
既然大數(shù)據(jù)被視為一種資源,那就要考慮資源分布的問題饲宿。一般而言厦酬,資源分布是極不均勻的,如水瘫想、礦產(chǎn)仗阅、耕地、能源等自然資源国夜;人力資源和知識(shí)的分布更是不均减噪。大數(shù)據(jù)是否也存在分布不均的問題?發(fā)展大數(shù)據(jù)產(chǎn)業(yè)是否真的能彎道超車车吹?這些問題值得深入思考筹裕。
與可以探測(cè)的自然資源不同,數(shù)據(jù)資源分布難以定位和刻畫礼搁。不過饶碘,可以用大數(shù)據(jù)人力資源分布狀況來間接反映大數(shù)據(jù)應(yīng)用在地區(qū)、行業(yè)間的差異馒吴,哪些行業(yè)扎运、哪些地區(qū)大數(shù)據(jù)人力資源密集,這些行業(yè)和地區(qū)就可以看作是數(shù)據(jù)密集的饮戳。
我們對(duì)兩家主流招聘網(wǎng)站“前程無憂”和“智聯(lián)招聘”2014年下半年以來發(fā)布的招聘信息進(jìn)行篩選豪治,得到兩家網(wǎng)站兩年來共發(fā)布相關(guān)信息涉及企業(yè)22.7萬家,職位100.7萬個(gè)扯罐,數(shù)據(jù)量確實(shí)足夠“大”负拟。通過分地區(qū)、分行業(yè)進(jìn)行匯總分析歹河,結(jié)果顯示大數(shù)據(jù)人力資源分布極不均勻掩浙,各地區(qū)花吟、各行業(yè)差異極大。不過厨姚,確切來說衅澈,通過招聘網(wǎng)站反映的是人才需求情況,并不是嚴(yán)格意義上的人力資源存量分布情況谬墙,但這兩者是緊密相關(guān)的今布。
從大數(shù)據(jù)相關(guān)崗位工作地來看,北京拭抬、廣東部默、上海三地高度密集,遙遙領(lǐng)先于其他地區(qū)造虎。三地相加傅蹂,發(fā)布招聘信息企業(yè)數(shù)在兩家網(wǎng)站占到52.35%和47.48%,職位數(shù)占到61.23%和56.74%累奈”崤桑可以推測(cè),大數(shù)據(jù)人力資源的半壁江山都集中在這三個(gè)地方澎媒,這與我們平時(shí)的直觀感受是高度一致的。在這三個(gè)地方之外波桩,我們關(guān)心是不是地方政府重視大數(shù)據(jù)產(chǎn)業(yè)戒努、將大數(shù)據(jù)作為區(qū)域經(jīng)濟(jì)發(fā)展引擎,就可能促進(jìn)人力資源集聚镐躲,就可能超越與自己相似經(jīng)濟(jì)發(fā)展水平的其他地區(qū)储玫。從數(shù)據(jù)反映情況看,至少目前還看不到這樣的結(jié)果萤皂,這揭示出人力資源結(jié)構(gòu)是后發(fā)地區(qū)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)最需要彌補(bǔ)的短板和最難克服的困難撒穷。改變一個(gè)地方人力資源構(gòu)成的難度要遠(yuǎn)遠(yuǎn)大于改變地面建筑面貌,要么需要一個(gè)長期的過程裆熙,要么需要一個(gè)獨(dú)特的制度端礼。
即便在同一省份內(nèi),大數(shù)據(jù)人力資源分布也極為不均入录。例如在廣東蛤奥,單深圳一市就大體占到了全省的一半。再加上廣州僚稿,竟然能夠達(dá)到九成凡桥。其他地方,即使經(jīng)濟(jì)實(shí)力不俗蚀同,但與深圳缅刽、廣州相比啊掏,在大數(shù)據(jù)人力資源方面相差甚遠(yuǎn)。這再次表明衰猛,大數(shù)據(jù)人力資源分布是極不均勻的迟蜜。顯然,大數(shù)據(jù)人力資源密集地區(qū)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)要優(yōu)于人力資源貧瘠的地區(qū)腕侄。
從城市排名看小泉,北上深廣可以視作大數(shù)據(jù)人力資源需求密集的一線城市,杭州冕杠、南京微姊、成都、武漢分预、西安等可以看作二線城市兢交。大數(shù)據(jù)人力資源分布與城市經(jīng)濟(jì)實(shí)力、活力乃至房價(jià)水平都是大體一致的笼痹。
從行業(yè)分布看配喳,對(duì)大數(shù)據(jù)人力資源的需求分布更不均勻,主要集中在互聯(lián)網(wǎng)凳干、信息技術(shù)及計(jì)算機(jī)相關(guān)行業(yè)晴裹。這充分說明了大數(shù)據(jù)是互聯(lián)網(wǎng)或IT產(chǎn)業(yè)的一部分,是在原有基礎(chǔ)上的新發(fā)展救赐。這些行業(yè)是典型的“數(shù)據(jù)密集型”行業(yè)涧团,是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的搖籃。
金融是另一個(gè)特別重要的“數(shù)據(jù)密集”領(lǐng)域经磅。金融行業(yè)既是產(chǎn)生數(shù)據(jù)尤其是有價(jià)值數(shù)據(jù)的基地泌绣,又是數(shù)據(jù)分析服務(wù)的需求方和應(yīng)用地。更為重要的是预厌,金融行業(yè)具備充足的支付能力阿迈,將是大數(shù)據(jù)產(chǎn)業(yè)競(jìng)爭(zhēng)的重要戰(zhàn)場(chǎng)。許多大數(shù)據(jù)是通過在金融領(lǐng)域的應(yīng)用輻射到了各個(gè)行業(yè)轧叽。
除此之外苗沧,電信、專業(yè)服務(wù)(如咨詢犹芹、人力資源崎页、財(cái)會(huì))、教育培訓(xùn)腰埂、影視媒體飒焦、網(wǎng)絡(luò)游戲等,相對(duì)而言也是當(dāng)前數(shù)據(jù)較為密集的行業(yè)。
《大數(shù)據(jù)綱要》幾乎面面俱到地對(duì)所有行業(yè)和領(lǐng)域都規(guī)劃了大數(shù)據(jù)應(yīng)用的廣闊前景牺荠,但數(shù)據(jù)資源分布極為不均翁巍,在“數(shù)據(jù)密集”領(lǐng)域的大數(shù)據(jù)應(yīng)用,取得市場(chǎng)成功的可能性較大休雌。
大數(shù)據(jù)需要什么樣的產(chǎn)業(yè)政策
大數(shù)據(jù)應(yīng)用需要什么樣的產(chǎn)業(yè)政策灶壶?從應(yīng)用的角度來看,大數(shù)據(jù)并非一個(gè)全新的產(chǎn)業(yè)杈曲,而是與已有產(chǎn)業(yè)融合驰凛,對(duì)已有模式的改造、升級(jí)和替代担扑。制約大數(shù)據(jù)發(fā)展的往往并不是大數(shù)據(jù)本身恰响,而是大數(shù)據(jù)所應(yīng)用的行業(yè)和領(lǐng)域原本存在的問題,如行業(yè)管制涌献、行政壟斷胚宦、要素不能自由流動(dòng),等等燕垃。因此枢劝,促進(jìn)大數(shù)據(jù)發(fā)展,用給地卜壕、貼錢您旁、上項(xiàng)目的方法,并不能解決根本問題轴捎。要從大數(shù)據(jù)應(yīng)用領(lǐng)域角度被冒,對(duì)不當(dāng)?shù)男袠I(yè)管理模式進(jìn)行改革,對(duì)既有利益格局進(jìn)行調(diào)整轮蜕,使大數(shù)據(jù)應(yīng)用具備必要的條件。即使在企業(yè)內(nèi)部蝗锥,大數(shù)據(jù)應(yīng)用也不僅僅是個(gè)技術(shù)問題跃洛,而是涉及業(yè)務(wù)流程重組和管理模式變革,是對(duì)企業(yè)管理能力的一個(gè)考驗(yàn)终议。
金融汇竭、電信、教育穴张、影視媒體等“數(shù)據(jù)密集型”行業(yè)细燎,既是大數(shù)據(jù)應(yīng)用潛力巨大的領(lǐng)域,也是迫切推進(jìn)行業(yè)改革的重點(diǎn)領(lǐng)域皂甘。另一方面玻驻,大數(shù)據(jù)的應(yīng)用也可以為行業(yè)改革提供技術(shù)支撐,能以更有效的技術(shù)路線實(shí)現(xiàn)行業(yè)發(fā)展目標(biāo)。
大數(shù)據(jù)應(yīng)用需要的產(chǎn)業(yè)政策其實(shí)就是市場(chǎng)經(jīng)濟(jì)下各個(gè)行業(yè)發(fā)展所應(yīng)有的政策璧瞬,如放開準(zhǔn)入户辫、公平競(jìng)爭(zhēng)、減輕企業(yè)負(fù)擔(dān)嗤锉、消除企業(yè)所有制歧視渔欢、消除企業(yè)規(guī)模歧視,等等瘟忱。只有在一個(gè)開放的產(chǎn)業(yè)環(huán)境中奥额,大數(shù)據(jù)才能在這些產(chǎn)業(yè)得以有效運(yùn)用。一個(gè)地方若要在金融访诱、醫(yī)療垫挨、教育等領(lǐng)域大力推動(dòng)大數(shù)據(jù)運(yùn)用,最管用的政策就是對(duì)這些行業(yè)進(jìn)行有力的改革盐数。