一咪惠、大數(shù)據(jù)概念
"大數(shù)據(jù)"是一個(gè)體量特別大击吱,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無(wú)法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取遥昧、管理和處理覆醇。 "大數(shù)據(jù)"首先是指數(shù)據(jù)體量(volumes)?大,指代大型數(shù)據(jù)集渠鸽,一般在10TB?規(guī)模左右叫乌,但在實(shí)際應(yīng)用中,很多企業(yè)用戶把多個(gè)數(shù)據(jù)集放在一起徽缚,已經(jīng)形成了PB級(jí)的數(shù)據(jù)量;其次是指數(shù)據(jù)類別(variety)大革屠,數(shù)據(jù)來自多種數(shù)據(jù)源凿试,數(shù)據(jù)種類和格式日漸豐富排宰,已沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)那婉。接著是數(shù)據(jù)處理速度(Velocity)快板甘,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實(shí)時(shí)處理详炬。最后一個(gè)特點(diǎn)是指數(shù)據(jù)真實(shí)性(Veracity)高盐类,隨著社交數(shù)據(jù)、企業(yè)內(nèi)容呛谜、交易與應(yīng)用數(shù)據(jù)等新數(shù)據(jù)源的興趣在跳,傳統(tǒng)數(shù)據(jù)源的局限被打破,企業(yè)愈發(fā)需要有效的信息之力以確保其真實(shí)性及安全性隐岛。
"大數(shù)據(jù)"是需要新處理模式才能具有更強(qiáng)的決策力猫妙、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)聚凹。從數(shù)據(jù)的類別上看割坠,"大數(shù)據(jù)"指的是無(wú)法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小妒牙、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集彼哼。
亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)、大數(shù)據(jù)科學(xué)家JohnRauser提到一個(gè)簡(jiǎn)單的定義:大數(shù)據(jù)就是任何超過了一臺(tái)計(jì)算機(jī)處理能力的龐大數(shù)據(jù)量湘今。
研發(fā)小組對(duì)大數(shù)據(jù)的定義:"大數(shù)據(jù)是最大的宣傳技術(shù)敢朱、是最時(shí)髦的技術(shù),當(dāng)這種現(xiàn)象出現(xiàn)時(shí)象浑,定義就變得很混亂蔫饰。" Kelly說:"大數(shù)據(jù)是可能不包含所有的信息,但我覺得大部分是正確的愉豺。對(duì)大數(shù)據(jù)的一部分認(rèn)知在于篓吁,它是如此之大,分析它需要多個(gè)工作負(fù)載蚪拦,這是AWS的定義杖剪。當(dāng)你的技術(shù)達(dá)到極限時(shí),也就是數(shù)據(jù)的極限"驰贷。 大數(shù)據(jù)不是關(guān)于如何定義盛嘿,最重要的是如何使用。最大的挑戰(zhàn)在于哪些技術(shù)能更好的使用數(shù)據(jù)以及大數(shù)據(jù)的應(yīng)用情況如何括袒。這與傳統(tǒng)的數(shù)據(jù)庫(kù)相比次兆,開源的大數(shù)據(jù)分析工具的如Hadoop的崛起,這些非結(jié)構(gòu)化的數(shù)據(jù)服務(wù)的價(jià)值在哪里锹锰。
二芥炭、大數(shù)據(jù)分析
從所周知漓库,大數(shù)據(jù)已經(jīng)不簡(jiǎn)簡(jiǎn)單單是數(shù)據(jù)大的事實(shí)了,而最重要的現(xiàn)實(shí)是對(duì)大數(shù)據(jù)進(jìn)行分析园蝠,只有通過分析才能獲取很多智能的渺蒿,深入的,有價(jià)值的信息彪薛。那么越來越多的應(yīng)用涉及到大數(shù)據(jù)茂装,而這些大數(shù)據(jù)的屬性,包括數(shù)量善延,速度少态,多樣性等等都是呈現(xiàn)了大數(shù)據(jù)不斷增長(zhǎng)的復(fù)雜性,所以大數(shù)據(jù)的分析方法在大數(shù)據(jù)領(lǐng)域就顯得尤為重要挚冤,可以說是決定最終信息是否有價(jià)值的決定性因素况增。基于如此的認(rèn)識(shí)训挡,大數(shù)據(jù)分析普遍存在的方法理論有哪些呢澳骤?
1、可視化分析
大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家澜薄,同時(shí)還有普通用戶为肮,但是他們二者對(duì)于大數(shù)據(jù)分析最基本的要求就是可視化分析,因?yàn)榭梢暬治瞿軌蛑庇^的呈現(xiàn)大數(shù)據(jù)特點(diǎn)肤京,同時(shí)能夠非常容易被讀者所接受颊艳,就如同看圖說話一樣簡(jiǎn)單明了
2、數(shù)據(jù)挖掘算法
大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法忘分,各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學(xué)的呈現(xiàn)出數(shù)據(jù)本身具備的特點(diǎn)棋枕,也正是因?yàn)檫@些被全世界統(tǒng)計(jì)學(xué)家所公認(rèn)的各種統(tǒng)計(jì)方法(可以稱之為真理)才能深入數(shù)據(jù)內(nèi)部,挖掘出公認(rèn)的價(jià)值妒峦。另外一個(gè)方面也是因?yàn)橛羞@些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù)重斑,如果一個(gè)算法得花上好幾年才能得出結(jié)論,那大數(shù)據(jù)的價(jià)值也就無(wú)從說起了肯骇。
3窥浪、預(yù)測(cè)性分析能力
大數(shù)據(jù)分析最終要的應(yīng)用領(lǐng)域之一就是預(yù)測(cè)性分析,從大數(shù)據(jù)中挖掘出特點(diǎn)笛丙,通過科學(xué)的建立模型漾脂,之后便可以通過模型帶入新的數(shù)據(jù),從而預(yù)測(cè)未來的數(shù)據(jù)胚鸯。
4骨稿、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理
大數(shù)據(jù)分析離不開數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理,高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理,無(wú)論是在學(xué)術(shù)研究還是在商業(yè)應(yīng)用領(lǐng)域啊终,都能夠保證分析結(jié)果的真實(shí)和有價(jià)值镜豹。
大數(shù)據(jù)分析的基礎(chǔ)就是以上五個(gè)方面傲须,當(dāng)然更加深入大數(shù)據(jù)分析的話蓝牲,還有很多很多更加有特點(diǎn)的、更加深入的泰讽、更加專業(yè)的大數(shù)據(jù)分析方法例衍。
三、大數(shù)據(jù)技術(shù)
1已卸、數(shù)據(jù)采集:ETL工具負(fù)責(zé)將分布的佛玄、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗累澡、轉(zhuǎn)換梦抢、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中愧哟,成為聯(lián)機(jī)分析處理奥吩、數(shù)據(jù)挖掘的基礎(chǔ)。
2蕊梧、數(shù)據(jù)存认己铡:關(guān)系數(shù)據(jù)庫(kù)、NOSQL肥矢、SQL等端衰。
3、基礎(chǔ)架構(gòu):云存儲(chǔ)甘改、分布式文件存儲(chǔ)等旅东。
4、數(shù)據(jù)處理:自然語(yǔ)言處理(NLP十艾,NaturalLanguageProcessing)是研究人與計(jì)算機(jī)交互的語(yǔ)言問題的一門學(xué)科抵代。處理自然語(yǔ)言的關(guān)鍵是要讓計(jì)算機(jī)"理解"自然語(yǔ)言,所以自然語(yǔ)言處理又叫做自然語(yǔ)言理解(NLU疟羹,NaturalLanguage Understanding)主守,也稱為計(jì)算語(yǔ)言學(xué)(Computational Linguistics。一方面它是語(yǔ)言信息處理的一個(gè)分支榄融,另一方面它是人工智能(AI, Artificial Intelligence)的核心課題之一参淫。
5、統(tǒng)計(jì)分析:假設(shè)檢驗(yàn)愧杯、顯著性檢驗(yàn)涎才、差異分析、相關(guān)分析、T檢驗(yàn)耍铜、方差分析邑闺、卡方分析、偏相關(guān)分析棕兼、距離分析陡舅、回歸分析、簡(jiǎn)單回歸分析伴挚、多元回歸分析靶衍、逐步回歸、回歸預(yù)測(cè)與殘差分析茎芋、嶺回歸颅眶、logistic回歸分析、曲線估計(jì)田弥、因子分析涛酗、聚類分析、主成分分析偷厦、因子分析商叹、快速聚類法與聚類法、判別分析沪哺、對(duì)應(yīng)分析沈自、多元對(duì)應(yīng)分析(最優(yōu)尺度分析)、bootstrap技術(shù)等等辜妓。
6枯途、數(shù)據(jù)挖掘:分類(Classification)、估計(jì)(Estimation)籍滴、預(yù)測(cè)(Prediction)酪夷、相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping orassociation rules)、聚類(Clustering)孽惰、描述和可視化晚岭、Description and Visualization)、復(fù)雜數(shù)據(jù)類型挖掘(Text,Web ,圖形圖像勋功,視頻坦报,音頻等)
7、模型預(yù)測(cè):預(yù)測(cè)模型狂鞋、機(jī)器學(xué)習(xí)片择、建模仿真。
8骚揍、結(jié)果呈現(xiàn):云計(jì)算字管、標(biāo)簽云啰挪、關(guān)系圖等。
四嘲叔、大數(shù)據(jù)特點(diǎn)
要理解大數(shù)據(jù)這一概念亡呵,首先要從"大"入手,"大"是指數(shù)據(jù)規(guī)模硫戈,大數(shù)據(jù)一般指在10TB(1TB=1024GB)規(guī)模以上的數(shù)據(jù)量锰什。大數(shù)據(jù)同過去的海量數(shù)據(jù)有所區(qū)別,其基本特征可以用4個(gè)V來總結(jié)(Vol-ume掏愁、Variety歇由、Value和Veloc-ity),即體量大果港、多樣性、價(jià)值密度低糊昙、速度快辛掠。
1、數(shù)據(jù)體量巨大释牺。從TB級(jí)別萝衩,躍升到PB級(jí)別。
2没咙、數(shù)據(jù)類型繁多猩谊,如前文提到的網(wǎng)絡(luò)日志、視頻祭刚、圖片牌捷、地理位置信息,等等涡驮。
3暗甥、價(jià)值密度低。以視頻為例捉捅,連續(xù)不間斷監(jiān)控過程中撤防,可能有用的數(shù)據(jù)僅僅有一兩秒。
4棒口、處理速度快寄月。1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同无牵。物聯(lián)網(wǎng)漾肮、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)合敦、車聯(lián)網(wǎng)初橘、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器保檐,無(wú)一不是數(shù)據(jù)來源或者承載的方式耕蝉。
大數(shù)據(jù)技術(shù)是指從各種各樣類型的巨量數(shù)據(jù)中,快速獲得有價(jià)值信息的技術(shù)夜只。解決大數(shù)據(jù)問題的核心是大數(shù)據(jù)技術(shù)垒在。目前所說的"大數(shù)據(jù)"不僅指數(shù)據(jù)本身的規(guī)模,也包括采集數(shù)據(jù)的工具扔亥、平臺(tái)和數(shù)據(jù)分析系統(tǒng)场躯。大數(shù)據(jù)研發(fā)目的是發(fā)展大數(shù)據(jù)技術(shù)并將其應(yīng)用到相關(guān)領(lǐng)域,通過解決巨量數(shù)據(jù)處理問題促進(jìn)其突破性發(fā)展旅挤。因此踢关,大數(shù)據(jù)時(shí)代帶來的挑戰(zhàn)不僅體現(xiàn)在如何處理巨量數(shù)據(jù)從中獲取有價(jià)值的信息,也體現(xiàn)在如何加強(qiáng)大數(shù)據(jù)技術(shù)研發(fā)粘茄,搶占時(shí)代發(fā)展的前沿签舞。
五、大數(shù)據(jù)處理
大數(shù)據(jù)處理之一:采集
大數(shù)據(jù)的采集是指利用多個(gè)數(shù)據(jù)庫(kù)來接收發(fā)自客戶端(Web柒瓣、App或者傳感器形式等)的數(shù)據(jù)儒搭,并且用戶可以通過這些數(shù)據(jù)庫(kù)來進(jìn)行簡(jiǎn)單的查詢和處理工作。比如芙贫,電商會(huì)使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)MySQL和Oracle等來存儲(chǔ)每一筆事務(wù)數(shù)據(jù)搂鲫,除此之外,Redis和MongoDB這樣的NoSQL數(shù)據(jù)庫(kù)也常用于數(shù)據(jù)的采集磺平。
在大數(shù)據(jù)的采集過程中魂仍,其主要特點(diǎn)和挑戰(zhàn)是并發(fā)數(shù)高,因?yàn)橥瑫r(shí)有可能會(huì)有成千上萬(wàn)的用戶來進(jìn)行訪問和操作褪秀,比如火車票售票網(wǎng)站和淘寶蓄诽,它們并發(fā)的訪問量在峰值時(shí)達(dá)到上百萬(wàn),所以需要在采集端部署大量數(shù)據(jù)庫(kù)才能支撐媒吗。并且如何在這些數(shù)據(jù)庫(kù)之間進(jìn)行負(fù)載均衡和分片的確是需要深入的思考和設(shè)計(jì)仑氛。
大數(shù)據(jù)處理之二:導(dǎo)入/預(yù)處理
雖然采集端本身會(huì)有很多數(shù)據(jù)庫(kù),但是如果要對(duì)這些海量數(shù)據(jù)進(jìn)行有效的分析闸英,還是應(yīng)該將這些來自前端的數(shù)據(jù)導(dǎo)入到一個(gè)集中的大型分布式數(shù)據(jù)庫(kù)锯岖,或者分布式存儲(chǔ)集群,并且可以在導(dǎo)入基礎(chǔ)上做一些簡(jiǎn)單的清洗和預(yù)處理工作甫何。也有一些用戶會(huì)在導(dǎo)入時(shí)使用來自Twitter的Storm來對(duì)數(shù)據(jù)進(jìn)行流式計(jì)算出吹,來滿足部分業(yè)務(wù)的實(shí)時(shí)計(jì)算需求。
導(dǎo)入與預(yù)處理過程的特點(diǎn)和挑戰(zhàn)主要是導(dǎo)入的數(shù)據(jù)量大辙喂,每秒鐘的導(dǎo)入量經(jīng)常會(huì)達(dá)到百兆捶牢,甚至千兆級(jí)別鸠珠。
大數(shù)據(jù)處理之三:統(tǒng)計(jì)/分析
統(tǒng)計(jì)與分析主要利用分布式數(shù)據(jù)庫(kù),或者分布式計(jì)算集群來對(duì)存儲(chǔ)于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總等秋麸,以滿足大多數(shù)常見的分析需求渐排,在這方面,一些實(shí)時(shí)性需求會(huì)用到EMC的GreenPlum灸蟆、Oracle的Exadata驯耻,以及基于MySQL的列式存儲(chǔ)Infobright等,而一些批處理炒考,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop可缚。
統(tǒng)計(jì)與分析這部分的主要特點(diǎn)和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對(duì)系統(tǒng)資源斋枢,特別是I/O會(huì)有極大的占用帘靡。
大數(shù)據(jù)處理之四:挖掘
與前面統(tǒng)計(jì)和分析過程不同的是,數(shù)據(jù)挖掘一般沒有什么預(yù)先設(shè)定好的主題杏慰,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計(jì)算测柠,從而起到預(yù)測(cè)(Predict)的效果,從而實(shí)現(xiàn)一些高級(jí)別數(shù)據(jù)分析的需求缘滥。比較典型算法有用于聚類的Kmeans、用于統(tǒng)計(jì)學(xué)習(xí)的SVM和用于分類的NaiveBayes谒主,主要使用的工具有Hadoop的Mahout等朝扼。該過程的特點(diǎn)和挑戰(zhàn)主要是用于挖掘的算法很復(fù)雜,并且計(jì)算涉及的數(shù)據(jù)量和計(jì)算量都很大澎媒,常用數(shù)據(jù)挖掘算法都以單線程為主鸣个。
整個(gè)大數(shù)據(jù)處理的普遍流程至少應(yīng)該滿足這四個(gè)方面的步驟酌予,才能算得上是一個(gè)比較完整的大數(shù)據(jù)處理
六、大數(shù)據(jù)應(yīng)用與案例分析
大數(shù)據(jù)應(yīng)用的關(guān)鍵搂捧,也是其必要條件,就在于"IT"與"經(jīng)營(yíng)"的融合懂缕,當(dāng)然允跑,這里的經(jīng)營(yíng)的內(nèi)涵可以非常廣泛,小至一個(gè)零售門店的經(jīng)營(yíng)搪柑,大至一個(gè)城市的經(jīng)營(yíng)聋丝。以下是關(guān)于各行各業(yè),不同的組織機(jī)構(gòu)在大數(shù)據(jù)方面的應(yīng)用的案例工碾,在此申明弱睦,以下案例均來源于網(wǎng)絡(luò),本文僅作引用渊额,并在此基礎(chǔ)上作簡(jiǎn)單的梳理和分類况木。
大數(shù)據(jù)應(yīng)用案例之:醫(yī)療行業(yè)
[1] Seton Healthcare是采用IBM最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測(cè)的首個(gè)客戶垒拢。該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過大數(shù)據(jù)處理火惊,更好地分析病人的信息求类。
[2] 在加拿大多倫多的一家醫(yī)院,針對(duì)早產(chǎn)嬰兒矗晃,每秒鐘有超過3000次的數(shù)據(jù)讀取仑嗅。通過這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對(duì)性地采取措施张症,避免早產(chǎn)嬰兒夭折仓技。
[3] 它讓更多的創(chuàng)業(yè)者更方便地開發(fā)產(chǎn)品,比如通過社交網(wǎng)絡(luò)來收集數(shù)據(jù)的健康類App俗他。也許未來數(shù)年后脖捻,它們搜集的數(shù)據(jù)能讓醫(yī)生給你的診斷變得更為精確,比方說不是通用的成人每日三次一次一片兆衅,而是檢測(cè)到你的血液中藥劑已經(jīng)代謝完成會(huì)自動(dòng)提醒你再次服藥地沮。
大數(shù)據(jù)應(yīng)用案例之:能源行業(yè)
[1] 智能電網(wǎng)現(xiàn)在歐洲已經(jīng)做到了終端,也就是所謂的智能電表羡亩。在德國(guó)摩疑,為了鼓勵(lì)利用太陽(yáng)能,會(huì)在家庭安裝太陽(yáng)能畏铆,除了賣電給你雷袋,當(dāng)你的太陽(yáng)能有多余電的時(shí)候還可以買回來。通過電網(wǎng)收集每隔五分鐘或十分鐘收集一次數(shù)據(jù)辞居,收集來的這些數(shù)據(jù)可以用來預(yù)測(cè)客戶的用電習(xí)慣等楷怒,從而推斷出在未來2~3個(gè)月時(shí)間里,整個(gè)電網(wǎng)大概需要多少電瓦灶。有了這個(gè)預(yù)測(cè)后鸠删,就可以向發(fā)電或者供電企業(yè)購(gòu)買一定數(shù)量的電。因?yàn)殡娪悬c(diǎn)像期貨一樣贼陶,如果提前買就會(huì)比較便宜刃泡,買現(xiàn)貨就比較貴。通過這個(gè)預(yù)測(cè)后每界,可以降低采購(gòu)成本捅僵。
[2] 維斯塔斯風(fēng)力系統(tǒng),依靠的是BigInsights軟件和IBM超級(jí)計(jì)算機(jī)眨层,然后對(duì)氣象數(shù)據(jù)進(jìn)行分析庙楚,找出安裝風(fēng)力渦輪機(jī)和整個(gè)風(fēng)電場(chǎng)最佳的地點(diǎn)。利用大數(shù)據(jù)趴樱,以往需要數(shù)周的分析工作馒闷,現(xiàn)在僅需要不足1小時(shí)便可完成酪捡。
大數(shù)據(jù)應(yīng)用案例之:通信行業(yè)
[1] XO Communications通過使用IBM SPSS預(yù)測(cè)分析軟件,減少了將近一半的客戶流失率纳账。XO現(xiàn)在可以預(yù)測(cè)客戶的行為逛薇,發(fā)現(xiàn)行為趨勢(shì),并找出存在缺陷的環(huán)節(jié)疏虫,從而幫助公司及時(shí)采取措施永罚,保留客戶。此外卧秘,IBM新的Netezza網(wǎng)絡(luò)分析加速器呢袱,將通過提供單個(gè)端到端網(wǎng)絡(luò)、服務(wù)翅敌、客戶分析視圖的可擴(kuò)展平臺(tái)羞福,幫助通信企業(yè)制定更科學(xué)、合理決策蚯涮。
[2] 電信業(yè)者透過數(shù)以千萬(wàn)計(jì)的客戶資料治专,能分析出多種使用者行為和趨勢(shì),賣給需要的企業(yè)遭顶,這是全新的資料經(jīng)濟(jì)张峰。
[3] 中國(guó)移動(dòng)通過大數(shù)據(jù)分析,對(duì)企業(yè)運(yùn)營(yíng)的全業(yè)務(wù)進(jìn)行針對(duì)性的監(jiān)控棒旗、預(yù)警挟炬、跟蹤。系統(tǒng)在第一時(shí)間自動(dòng)捕捉市場(chǎng)變化嗦哆,再以最快捷的方式推送給指定負(fù)責(zé)人,使他在最短時(shí)間內(nèi)獲知市場(chǎng)行情婿滓。
[4] NTT docomo把手機(jī)位置信息和互聯(lián)網(wǎng)上的信息結(jié)合起來老速,為顧客提供附近的餐飲店信息,接近末班車時(shí)間時(shí)凸主,提供末班車信息服務(wù)橘券。
大數(shù)據(jù)應(yīng)用案例之:零售業(yè)
[1] "我們的某個(gè)客戶,是一家領(lǐng)先的專業(yè)時(shí)裝零售商卿吐,通過當(dāng)?shù)氐陌儇浬痰昱越ⅰ⒕W(wǎng)絡(luò)及其郵購(gòu)目錄業(yè)務(wù)為客戶提供服務(wù)。公司希望向客戶提供差異化服務(wù)嗡官,如何定位公司的差異化箭窜,他們通過從 Twitter 和 Facebook 上收集社交信息,更深入的理解化妝品的營(yíng)銷模式衍腥,隨后他們認(rèn)識(shí)到必須保留兩類有價(jià)值的客戶:高消費(fèi)者和高影響者磺樱。希望通過接受免費(fèi)化妝服務(wù)纳猫,讓用戶進(jìn)行口碑宣傳,這是交易數(shù)據(jù)與交互數(shù)據(jù)的完美結(jié)合竹捉,為業(yè)務(wù)挑戰(zhàn)提供了解決方案芜辕。"Informatica的技術(shù)幫助這家零售商用社交平臺(tái)上的數(shù)據(jù)充實(shí)了客戶主數(shù)據(jù),使他的業(yè)務(wù)服務(wù)更具有目標(biāo)性块差。
[2] 零售企業(yè)也監(jiān)控客戶的店內(nèi)走動(dòng)情況以及與商品的互動(dòng)侵续。它們將這些數(shù)據(jù)與交易記錄相結(jié)合來展開分析,從而在銷售哪些商品憨闰、如何擺放貨品以及何時(shí)調(diào)整售價(jià)上給出意見状蜗,此類方法已經(jīng)幫助某領(lǐng)先零售企業(yè)減少了17%的存貨,同時(shí)在保持市場(chǎng)份額的前提下起趾,增加了高利潤(rùn)率自有品牌商品的比例诗舰。