C
點擊流分析(Clickstream analytics):用于分析用戶在網(wǎng)絡(luò)上瀏覽時的在線點擊數(shù)據(jù)媒区。有沒有想過即使在切換網(wǎng)站時捆探,為什么某些谷歌廣告還是陰魂不散?因為谷歌大佬知道你在點擊什么岁钓。
聚類分析(Cluster Analysis):是一個試圖識別數(shù)據(jù)結(jié)構(gòu)的探索性分析壳咕,也稱為分割分析或分類分析壮不。更具體地說由缆,它試圖確定案例的同質(zhì)組(homogenous groups),即觀察猾蒂、參與者均唉、受訪者。如果分組以前未知肚菠,則使用聚類分析來識別案例組舔箭。因為它是探索性的,確實對依賴變量和獨立變量進行了區(qū)分蚊逢。SPSS 提供的不同的聚類分析方法可以處理二進制层扶、標(biāo)稱、序數(shù)和規(guī)模(區(qū)間或比率)數(shù)據(jù)烙荷。
比較分析(Comparative Analytics):因為大數(shù)據(jù)的關(guān)鍵就在于分析镜会,顧名思義,比較分析是使用諸如模式分析终抽、過濾和決策樹分析等統(tǒng)計技術(shù)來比較多個進程戳表、數(shù)據(jù)集或其他對象。我知道它涉及的技術(shù)越來越少昼伴,但是我仍無法完全避免使用術(shù)語匾旭。比較分析可用于醫(yī)療保健領(lǐng)域,通過比較大量的醫(yī)療記錄圃郊、文件价涝、圖像等,給出更有效和更準(zhǔn)確的醫(yī)療診斷持舆。
關(guān)聯(lián)分析(Connection Analytics):你一定看到了像圖表一樣的蜘蛛網(wǎng)將人與主題連接起來色瘩,從而確定特定主題的影響者。關(guān)聯(lián)分析分析可以幫助發(fā)現(xiàn)人們吏廉、產(chǎn)品泞遗、網(wǎng)絡(luò)之中的系統(tǒng),甚至是數(shù)據(jù)與多個網(wǎng)絡(luò)結(jié)合之間的相關(guān)連接和影響席覆。
Cassandra:是一個很流行的開源數(shù)據(jù)管理系統(tǒng),由 Apache Software Foundation 開發(fā)并運營汹买。Apache 掌握了很多大數(shù)據(jù)處理技術(shù)佩伤,Cassandra 就是他們專門設(shè)計用于在分布式服務(wù)器之間處理大量數(shù)據(jù)的系統(tǒng)。
云計算(Cloud computing):構(gòu)建在網(wǎng)絡(luò)上的分布式計算系統(tǒng)晦毙,數(shù)據(jù)是存儲于機房外的(即云端)生巡,軟件或數(shù)據(jù)在遠程服務(wù)器上進行處理,并且這些資源可以在網(wǎng)絡(luò)上任何地方被訪問见妒,那么它就可被稱為云計算孤荣。
集群計算(Cluster computing):這是一個來描述使用多個服務(wù)器豐富資源的一個集群(cluster)的計算的形象化術(shù)語。更技術(shù)層面的理解是,在集群處理的語境下盐股,我們可能會討論節(jié)點(node)钱豁、集群管理層(cluster management layer)、負(fù)載平衡(load balancing)和并行處理(parallel processing)等等疯汁。
分類分析(Classification analysis) :從數(shù)據(jù)中獲得重要的相關(guān)性信息的系統(tǒng)化過程; 這類數(shù)據(jù)也被稱為元數(shù)據(jù)(meta data),是描述數(shù)據(jù)的數(shù)據(jù)牲尺。
商業(yè)分析(Commerce analytics):指的是包括審視預(yù)計的銷售額、成本和利潤是否達到公司預(yù)計目標(biāo)幌蚊;如達到谤碳,則此產(chǎn)品概念才能進一步發(fā)展到產(chǎn)品開發(fā)階段。
聚類分析(Clustering analysis) – 它是將相似的對象聚合在一起溢豆,每類相似的對象組合成一個聚類(也叫作簇)的過程蜒简。這種分析方法的目的在于分析數(shù)據(jù)間的差異和相似性。
冷數(shù)據(jù)存儲(Cold data storage) – 在低功耗服務(wù)器上存儲那些幾乎不被使用的舊數(shù)據(jù)漩仙。但這些數(shù)據(jù)檢索起來將會很耗時搓茬。
眾包(Crowdsourcing):從一廣泛群體,特別是在線社區(qū)讯赏,獲取所需想法垮兑,服務(wù)或內(nèi)容貢獻的實踐。
集群服務(wù)器(Cluster server):把多臺服務(wù)器通過快速通信鏈路連接起來漱挎,從外部看來系枪,這些服務(wù)器就像一臺服務(wù)器在工作,而對內(nèi)來說磕谅,外面來的負(fù)載通過一定的機制動態(tài)地分配到這些節(jié)點機中去私爷,從而達到超級服務(wù)器才有的高性能、高可用膊夹。
對比分析(Comparative analysis) – 在非常大的數(shù)據(jù)集中進行模式匹配時衬浑,進行一步步的對比和計算過程得到分析結(jié)果。
復(fù)雜結(jié)構(gòu)的數(shù)據(jù)(Complex structured data) – 由兩個或多個復(fù)雜而相互關(guān)聯(lián)部分組成的數(shù)據(jù)放刨,這類數(shù)據(jù)不能簡單地由結(jié)構(gòu)化查詢語言或工具(SQL)解析工秩。
計算機產(chǎn)生的數(shù)據(jù)(Computer generated data) – 如日志文件這類由計算機生成的數(shù)據(jù)。
并發(fā)(Concurrency) – 同時執(zhí)行多個任務(wù)或運行多個進程进统。
相關(guān)性分析(Correlation analysis) – 是一種數(shù)據(jù)分析方法助币,用于分析變量之間是否存在正相關(guān),或者負(fù)相關(guān)螟碎。
客戶關(guān)系管理(CRM: Customer Relationship Management) – 用于管理銷售眉菱、業(yè)務(wù)過程的一種技術(shù),大數(shù)據(jù)將影響公司的客戶關(guān)系管理的策略掉分。
云數(shù)據(jù)(Cloud data):是基于云計算商業(yè)模式應(yīng)用的數(shù)據(jù)集成俭缓、數(shù)據(jù)分析克伊、數(shù)據(jù)整合、數(shù)據(jù)分配华坦、數(shù)據(jù)預(yù)警的技術(shù)與平臺的總稱愿吹。