不知大家會(huì)不會(huì)有個(gè)疑問竣灌,大數(shù)據(jù)到底是什么?然后總是能聽身邊的人提起這個(gè)詞匯秆麸,但是具體是做什么的初嘹,那些方面的作用,給生活帶來什么幫助沮趣,好像一無所知有點(diǎn)屯烦,那么大數(shù)據(jù)到底是什么呢?從何而來呢房铭?
一:產(chǎn)生的背景
?
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫驻龟,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域缸匪,成為重要的生產(chǎn)因素翁狐。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來凌蔬。 “大數(shù)據(jù)”在物理學(xué)露懒、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事砂心、金融懈词、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙砘ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注辩诞。
二坎弯、大數(shù)據(jù)的特征
?
第一個(gè)特征:數(shù)據(jù)量大
大數(shù)據(jù)的起始計(jì)量單位至少是P(1000個(gè)T)、E(100萬個(gè)T)或Z(10億個(gè)T),我們每人每天產(chǎn)生的數(shù)據(jù)高達(dá)數(shù)大約幾百GB荞怒。
第二個(gè)特征:數(shù)據(jù)類型繁多
圍繞社交洒琢、金融交易、網(wǎng)絡(luò)購物褐桌、生活記錄衰抑、網(wǎng)絡(luò)日志、音頻荧嵌、視頻呛踊、圖片、地理位置信息等等各種應(yīng)用產(chǎn)生數(shù)據(jù)啦撮,多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求谭网。
第三個(gè)特征:數(shù)據(jù)過大價(jià)值密度相對(duì)較低
如隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在赃春,信息海量愉择,但價(jià)值密度卻普遍較低,通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”织中,是大數(shù)據(jù)時(shí)代等待解決的難題锥涕。
第四個(gè)特征:處理速度快,時(shí)效性要求高
既有的技術(shù)架構(gòu)和路線狭吼,已經(jīng)無法高效處理如此海量的數(shù)據(jù)层坠,而對(duì)于相關(guān)組織來說,如果投入巨大采集的信息無法通過及時(shí)處理反饋有效信息刁笙,那將是得不償失的破花。大數(shù)據(jù)時(shí)代對(duì)人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn),也為人們獲得更為深刻疲吸、全面的洞察能力提供了前所未有的空間與潛力座每。
三、大數(shù)據(jù)的應(yīng)用
?
大數(shù)據(jù)時(shí)代的到來磅氨,可以說大數(shù)據(jù)的應(yīng)用非常的廣泛,而且隨著大數(shù)據(jù)覆蓋更多的行業(yè),運(yùn)用的范圍將更加廣泛尺栖。
1、電商領(lǐng)域的應(yīng)用
通過對(duì)客戶的訂單信息進(jìn)行分類整理烦租,根據(jù)客戶的購買習(xí)慣延赌、年齡、喜好叉橱、地域等區(qū)分進(jìn)行推薦產(chǎn)品挫以,進(jìn)行個(gè)性化的頁面展示。還可以根據(jù)以往數(shù)據(jù)窃祝,來決定庫存數(shù)量和物流資源的動(dòng)態(tài)調(diào)整掐松。
]2、交通旅游領(lǐng)域的應(yīng)用
通過WIFI+ibeacon或基站定位技術(shù),收集到個(gè)體的出行數(shù)據(jù)大磺。政府可以對(duì)每個(gè)車站抡句、機(jī)場(chǎng)、道路交通各時(shí)段的流量規(guī)律信息杠愧,進(jìn)行針對(duì)性的安防及其他部署待榔。景區(qū)可以根據(jù)不同景點(diǎn)的客流密度、游客的停留時(shí)長(zhǎng)以及游覽路徑流济,來決定景區(qū)的運(yùn)營(yíng)方向锐锣。
3、金融行業(yè)的應(yīng)用
通過對(duì)客戶的健康狀況绳瘟,事故記錄等信息進(jìn)行分析雕憔,保險(xiǎn)公司可以決定是否允許投保人投保,以及具體投保金額糖声。銀行可以根據(jù)個(gè)體的收入情況斤彼、消費(fèi)記錄以及信用記錄,來決定是否給申請(qǐng)人發(fā)放信用卡以及發(fā)放額度蘸泻。
4畅卓、商場(chǎng)零售行業(yè)的應(yīng)用
商場(chǎng)同樣是通過定位技術(shù)收集客戶信息。根據(jù)商場(chǎng)內(nèi)部蟋恬,各類貨架、店鋪趁冈、樓層的客流信息和消費(fèi)趨勢(shì)分析出市場(chǎng)需求動(dòng)態(tài)歼争,做出相應(yīng)調(diào)整。還可以結(jié)合客流趨勢(shì)以及銷售額渗勘,進(jìn)行投資回報(bào)周期預(yù)測(cè)沐绒。
5、醫(yī)療行業(yè)的應(yīng)用
根據(jù)眾多病人的體質(zhì)特征旺坠,病癥信息乔遮,病史信息,分布情況進(jìn)行分析處理取刃,可以實(shí)現(xiàn)流行疾病預(yù)測(cè)蹋肮,為各類疾病的治療方案優(yōu)化提供數(shù)據(jù)支撐。
6璧疗、資訊娛樂行業(yè)的應(yīng)用
通過收集用戶的以往閱讀信息坯辩,分析用戶的閱讀喜好,從而進(jìn)行個(gè)性化信息推送崩侠。通過收集用戶的觀影喜好漆魔,進(jìn)行票房預(yù)測(cè)等。
四、就業(yè)方向
大數(shù)據(jù)主要的三大就業(yè)方向:大數(shù)據(jù)系統(tǒng)研發(fā)類人才改抡、大數(shù)據(jù)應(yīng)用開發(fā)類人才和大數(shù)據(jù)分析類人才矢炼,
十大職位:一、ETL研發(fā)阿纤;二句灌、Hadoop開發(fā);三阵赠、可視化(前端展現(xiàn))工具開發(fā)涯塔;四、信息架構(gòu)開發(fā)清蚀;五匕荸、數(shù)據(jù)倉庫研究;六枷邪、OLAP開發(fā)榛搔;七、數(shù)據(jù)科學(xué)研究东揣;八践惑、數(shù)據(jù)預(yù)測(cè)(數(shù)據(jù)挖掘)分析;九嘶卧、企業(yè)數(shù)據(jù)管理尔觉;十、數(shù)據(jù)安全研究芥吟。
比較常見的有:大數(shù)據(jù)產(chǎn)品分析專員侦铜、大數(shù)據(jù)客戶分析專員、大數(shù)據(jù)市場(chǎng)分析專員钟鸵、大數(shù)據(jù)運(yùn)營(yíng)分析專員钉稍、證劵數(shù)據(jù)分析師、互聯(lián)網(wǎng)金融分析師棺耍、大數(shù)據(jù)算法工程師贡未、大數(shù)據(jù)可視化工程師、大數(shù)據(jù)分析工程師
五蒙袍、總結(jié)
大數(shù)據(jù)時(shí)代的到來俊卤,給大數(shù)據(jù)開發(fā)人才帶來了巨大的機(jī)遇和挑戰(zhàn),給生活與出行帶來了巨大的便利左敌,精準(zhǔn)的推送瘾蛋,信息的透明,足不出戶買遍全球優(yōu)質(zhì)好貨矫限,獲取信息知識(shí)的便捷性哺哼,但也伴隨著個(gè)人信息很容易被追蹤曝光佩抹,每個(gè)人的信息變得透明,大數(shù)據(jù)時(shí)代代來了便利但相應(yīng)的也蘊(yùn)含著無盡的危險(xiǎn)取董,信息時(shí)代發(fā)展的路途還會(huì)很遙遠(yuǎn)棍苹,相信伴隨著大數(shù)據(jù)越來越成熟的技術(shù),每個(gè)人追求美好生活的方式都會(huì)變得與眾不同茵汰。
注:本文部分素材來自于網(wǎng)絡(luò)枢里,如有侵權(quán),請(qǐng)聯(lián)系作者刪除蹂午。