姓名:王飛宇 16160111036
轉(zhuǎn)載自:https://rc.mbd.baidu.com/1xf2ewq.有刪節(jié)
【嵌牛導讀】:我們都知道大數(shù)據(jù)時代已經(jīng)來臨诲泌。在生活中享受著大數(shù)據(jù)給我們帶來的便利盲赊。但什么是大數(shù)據(jù),我們又該怎么理解和應對大數(shù)據(jù)档礁?
【嵌牛鼻子】:大數(shù)據(jù)的含義與特征,數(shù)據(jù)的存在形式吝沫,大數(shù)據(jù)宇我們的關系和它給我們帶來的便利呻澜,我們應該如何應對大數(shù)據(jù)。
【嵌牛提問】:什么是大數(shù)據(jù)惨险,大數(shù)據(jù)給我們帶來了那些便利羹幸。我們應該如何應對它?
【嵌牛正文】:當我們談論數(shù)據(jù)的時候我們在談什么辫愉?在大部分人的日常印象中栅受,數(shù)據(jù)代表的可能是每月水電煤賬單上的數(shù)字,股票k線圖上的紅綠指數(shù)恭朗,還有可能是電腦文件里那一堆看不懂的源代碼屏镊。
1.大數(shù)據(jù)的含義。大數(shù)據(jù)big data痰腮,指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉而芥、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力膀值、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量棍丐、高增長率和多樣化的信息資產(chǎn)〔滋ぃ“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力歌逢、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)翘狱。從概念中可以得知大數(shù)據(jù)技術的關鍵不在于掌握龐大的數(shù)據(jù)信息秘案,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理,在于提高對數(shù)據(jù)的“加工能力”潦匈,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”踏烙。從技術上看,大數(shù)據(jù)必然無法用單臺的計算機進行處理历等,必須采用分布式架構讨惩。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理寒屯、分布式數(shù)據(jù)庫和云存儲荐捻、虛擬化技術黍少。大數(shù)據(jù)包括結構化、半結構化和非結構化數(shù)據(jù)处面,非結構化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分厂置。
大數(shù)據(jù)必須具有幾大特征:①大數(shù)據(jù)的“大”。與傳統(tǒng)數(shù)據(jù)的儲存方式相比是幾何量級的差距魂角。
②多維度昵济。表示大數(shù)據(jù)可以對一個事物進行多方位的描述,從而更準確野揪。
③處理非結構數(shù)據(jù)的能力访忿。未來10年新生數(shù)據(jù)總量的90%為非結構化數(shù)據(jù)。大數(shù)據(jù)通過圖像識別斯稳,語音識別海铆,自然語言分析等技術計算,分析大量非結構化數(shù)據(jù)挣惰,大大提升數(shù)據(jù)維度卧斟。
④大數(shù)據(jù)是生生不息的“流”,具有時間性憎茂。一是因為數(shù)據(jù)量巨大珍语,無法全部儲存。另一方面是大數(shù)據(jù)和人類生生不息的行動相關竖幔,瞬息萬變廊酣。
⑤最重要的是,大數(shù)據(jù)的大表現(xiàn)為無盡的重復赏枚。量變促成質(zhì)變亡驰,在機器智能領域,數(shù)據(jù)量的大小和處理速度的快慢可以直接決定智力水平的高低饿幅。
2.數(shù)據(jù)的存在形式隨著人類文明的發(fā)展不斷改變凡辱,從最初的聲音,文字栗恩,圖畫透乾,數(shù)字,到電子時代的每一張圖片磕秤,每一段語音乳乌,每一個視頻,再到如今互聯(lián)網(wǎng)時代人類每一次的鼠標點擊市咆,用手機時每一次的手指滑動汉操,乃至每一下心跳和呼吸,甚至經(jīng)濟生產(chǎn)中的一切人機動作蒙兰,軌跡磷瘤,都已融入數(shù)據(jù)流芒篷。今天的人類已經(jīng)能夠?qū)⒏鞣N或大或小的事物轉(zhuǎn)化為數(shù)據(jù)記錄,變成我們生活的一部分采缚。數(shù)據(jù)已經(jīng)浸染我們生活的每一個細節(jié)针炉,就如生物學家所說人體組織的一半是由微生物組成,在數(shù)字時代扳抽,我們生活的一半已然是數(shù)據(jù)篡帕。
3.大數(shù)據(jù)于我們的關系以及它給我們帶來的便利。在日常生活中贸呢,數(shù)據(jù)的概念對于我們既親近又陌生镰烧。親近它是因為我們從小就會接觸加減乘除這些最基本的數(shù)據(jù)和算法。步入社會后也在與各種文件報表賬單打交道贮尉。與此同時拌滋,當面對高科技產(chǎn)品中各種關于內(nèi)存朴沿,分辨率等時髦又復雜的數(shù)據(jù)時猜谚,我們又覺得不了解它們甚至沒意識到它們的存在。隨著大數(shù)據(jù)赌渣,機器算法和人工智能的理念相繼到來魏铅,這種陌生感會越發(fā)加深。那么數(shù)據(jù)生活距離我們遙遠嗎坚芜?正相反览芳,數(shù)據(jù)與我們?nèi)粘I畹穆?lián)系從未如此緊密過,從沒有像今天如此活躍鸿竖,具體的記錄著人類與世界沧竟。從最初的計算機,攝像頭到家用計算機缚忧,智能手機悟泵,再到大數(shù)據(jù)和人工智能,我們不斷升級采集和利用數(shù)據(jù)的方式闪水。而現(xiàn)在糕非,從一輛車的每日碳排放量統(tǒng)計到全球氣溫的檢測,從預測個人在網(wǎng)上喜好分析到總統(tǒng)選舉時投票趨勢的預測球榆,我們都可以做到朽肥。數(shù)據(jù)將人與人,人與世界連接起來持钉,構成一張繁密的網(wǎng)絡衡招,每個人都在影響世界,又在被他人影響著每强。
4.我們應該如何應對大數(shù)據(jù)蚁吝。傳統(tǒng)的統(tǒng)計方法已經(jīng)無法處理這種相互影響的數(shù)據(jù)旱爆,怎么辦?答案是讓機器自己來處理數(shù)據(jù)窘茁,從數(shù)據(jù)中習得知識怀伦。這便是當代人工智能的本質(zhì)。與傳統(tǒng)的數(shù)據(jù)記錄定義不同山林,這種數(shù)據(jù)是有“生命”的房待。它更像是我們身體的一種自然延伸:聆聽我們的聲音,拓寬我們的視野驼抹,加深我們的記憶桑孩,甚至組成一個以數(shù)據(jù)形式存在“我”。