大數(shù)據(jù)要學習哪些技術呢妇汗?大數(shù)據(jù)技術的分類與選擇路線

大數(shù)據(jù)的處理過程可以分為大數(shù)據(jù)采集帘不、存儲、結(jié)構化處理杨箭、隱私保護寞焙、挖掘、結(jié)果展示(發(fā)布)等互婿,各種領域的大數(shù)據(jù)應用一般都會涉及到這些基本過程捣郊,但不同應用可能會有所側(cè)重〈炔危科多大數(shù)據(jù)認為對于互聯(lián)網(wǎng)大數(shù)據(jù)而言呛牲,由于其具有獨特完整的大數(shù)據(jù)特點,除了共性技術外驮配,采集技術娘扩、結(jié)構化處理技術着茸、隱私保護也非常突出。

有很多算法和模型可以解決這些處理過程中的技術問題琐旁,并且為了最終用戶的使用方便涮阔,它們大都被進一步的封裝,形成了比較簡單易用的操作平臺旋膳。目前大數(shù)據(jù)技術平臺有很多澎语,歸納起來可以按照以下方式進行分類:

1. 從大數(shù)據(jù)處理的過程來分:包括數(shù)據(jù)存儲、數(shù)據(jù)挖掘分析验懊、以及為完成高效分析挖掘而設計的計算平臺擅羞,它們完成數(shù)據(jù)采集、ETL义图、存儲减俏、結(jié)構化處理、挖掘碱工、 分析娃承、預測、應用等功能怕篷。

2. 從大數(shù)據(jù)處理的數(shù)據(jù)類型來劃分:可以分為針對關系型數(shù)據(jù)历筝、非關系型數(shù)據(jù)(圖數(shù)據(jù)、文本數(shù)據(jù)廊谓、網(wǎng)絡型數(shù)據(jù)等)梳猪、半結(jié)構化數(shù)據(jù)、混合類型數(shù)據(jù)處理的技術平臺蒸痹。

3. 從大數(shù)據(jù)處理的方式來劃分:可以分為批量處理春弥、實時處理、綜合處理叠荠。其中批量數(shù)據(jù)是對成批數(shù)據(jù)進行一次性處理匿沛,而實時處理(流處理)對處理的延時有嚴格的要求,綜合處理是指同時具備批量處理和實時處理兩種方式榛鼎。

4. 從平臺對數(shù)據(jù)的部署方式看:可以分為基于內(nèi)存的逃呼、基于磁盤的。前者在分布式系統(tǒng)內(nèi)部的數(shù)據(jù)交換是在內(nèi)存中進行者娱,后者則是通過磁盤文件的方式蜘渣。

此外,技術平臺還有分布式肺然、集中式之分,云環(huán)境和非云環(huán)境之分等腿准。阿里云大數(shù)據(jù)平臺構建在阿里云云計算基礎設施之上际起,為用戶提供了大數(shù)據(jù)存儲拾碌、計算能力、大數(shù)據(jù)分析挖掘街望、以及輸出展示等服務校翔,用戶可以容易地實現(xiàn)BI商業(yè)智能、人工智能服務灾前,具備一站式數(shù)據(jù)應用能力防症。在以前的一篇推送(“基于阿里云大數(shù)據(jù)技術的個性化新聞推薦”)中,描述了基于阿里云大數(shù)據(jù)技術的個性化新聞推薦系統(tǒng)分析設計與部署方法哎甲。

不同的大數(shù)據(jù)技術平臺提供了對這些處理過程的支持蔫敲,有的平臺可能會支持多個過程,但是側(cè)重點也不同炭玫,支持的深度也有所不同奈嘿,因此有必要熟悉各種平臺的功能,并做出比較分析吞加,以便在實際應用中選擇適合于自己需求的技術平臺裙犹。

選擇一個合適的大數(shù)據(jù)技術平臺是非常重要的,它能夠使得大數(shù)據(jù)應用開發(fā)更加容易衔憨、讓開發(fā)人員更集中精力在業(yè)務層面的數(shù)據(jù)分析與處理上叶圃。一些共性的基礎問題,例如數(shù)據(jù)如何存儲践图、如何檢索掺冠、數(shù)據(jù)統(tǒng)計等,就可以由平臺來完成平项。選擇合適的大數(shù)據(jù)技術平臺應當考慮以下因素:

1. 平臺的功能與性能:由于不同平臺側(cè)重的功能不同赫舒,平臺的性能也就有很多需要考察的方面。比如對于存儲平臺來說闽瓢,數(shù)據(jù)的存儲效率接癌、讀寫效率、并發(fā)訪問能力扣讼、對結(jié)構化與非結(jié)構化數(shù)據(jù)存儲的支持缺猛,所提供的數(shù)據(jù)訪問接口等方面就是比較重要的。對于大數(shù)據(jù)挖掘平臺來說椭符,所支持的挖掘算法荔燎、算法的封裝程度、數(shù)據(jù)挖掘結(jié)果的展示能力销钝、挖掘算法的時間和空間復雜度等有咨,是比較重要的指標。

2. 平臺的集成度:好的平臺應該具有較高的集成度蒸健,為用戶提供良好的操作界面座享,具有完善的幫助和使用手冊婉商、系統(tǒng)易于配置、移植性好渣叛。同時隨著目前軟件開源的趨勢丈秩,開源平臺有助于其版本的快速升級,盡快發(fā)現(xiàn)其中的bug淳衙,此外蘑秽,開源的架構也比較容易進行擴展,植入更多的新算法箫攀,這對于最終用戶而言也是比較重要的肠牲。

3. 是否符合技術發(fā)展趨勢:大數(shù)據(jù)技術是當前發(fā)展和研究的熱點,其最終將走向逐步成熟匠童,可以預見在這個過程中埂材,并非所有的技術平臺都能生存下來。只有符合技術發(fā)展趨勢的技術平臺才會被用戶汤求、被技術開發(fā)人員所接受俏险。因此,一些不支持分布式扬绪、集群計算的平臺大概只能針對較小的數(shù)據(jù)量竖独,側(cè)重于對挖掘算法的驗證。而與云計算挤牛、物聯(lián)網(wǎng)莹痢、人工智能聯(lián)系密切的技術平臺將成為主流,是技術發(fā)展趨勢墓赴。

同時應當充分意識到竞膳,技術迭代更新速度加快,當我們花很多時間去掌握熟悉某種技術平臺后诫硕,可能新的更好的技術平臺出現(xiàn)了坦辟,導致我們受累奔波于各種技術平臺,因此章办,最好的策略就是全面系統(tǒng)地掌握大數(shù)據(jù)技術的原理和實現(xiàn)方案锉走,這樣學習新的技術平臺就很容易上手。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末藕届,一起剝皮案震驚了整個濱河市挪蹭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌休偶,老刑警劉巖梁厉,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異踏兜,居然都是意外死亡词顾,警方通過查閱死者的電腦和手機只冻,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來计技,“玉大人,你說我怎么就攤上這事山橄】迕剑” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵航棱,是天一觀的道長睡雇。 經(jīng)常有香客問我,道長饮醇,這世上最難降的妖魔是什么它抱? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮朴艰,結(jié)果婚禮上观蓄,老公的妹妹穿的比我還像新娘。我一直安慰自己祠墅,他們只是感情好侮穿,可當我...
    茶點故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著毁嗦,像睡著了一般亲茅。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上狗准,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天克锣,我揣著相機與錄音,去河邊找鬼腔长。 笑死袭祟,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的饼酿。 我是一名探鬼主播榕酒,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼故俐!你這毒婦竟也來了想鹰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤药版,失蹤者是張志新(化名)和其女友劉穎辑舷,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體槽片,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡何缓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年肢础,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碌廓。...
    茶點故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡传轰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出谷婆,到底是詐尸還是另有隱情慨蛙,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布纪挎,位于F島的核電站期贫,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏异袄。R本人自食惡果不足惜通砍,卻給世界環(huán)境...
    茶點故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望烤蜕。 院中可真熱鬧封孙,春花似錦、人聲如沸玖绿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斑匪。三九已至呐籽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蚀瘸,已是汗流浹背狡蝶。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留贮勃,地道東北人贪惹。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像寂嘉,于是被迫代替她去往敵國和親奏瞬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容