一. 現(xiàn)象羔沙,數(shù)據(jù),信息和知識(shí)
現(xiàn)象是事物表現(xiàn)出來(lái)的厨钻,能被人感覺(jué)到的一切情況。現(xiàn)象是人能夠看到坚嗜、聽(tīng)到夯膀、聞到、觸摸到的苍蔬。按照是否有自然屬性诱建,可分為自然現(xiàn)象和社會(huì)現(xiàn)象。現(xiàn)象包含數(shù)據(jù)碟绑,信息和知識(shí)俺猿。
數(shù)據(jù)本身是客觀存在的茎匠,它的范疇隨著人類文明的進(jìn)程也在不斷發(fā)展變化,它不僅包含數(shù)字押袍,還包括一切文字诵冒,語(yǔ)音,圖像谊惭,甚至行為和社會(huì)關(guān)系等汽馋。人類對(duì)數(shù)據(jù)的認(rèn)知也反映出了文明程度。
信息是關(guān)于世界圈盔,包括人和事的描述豹芯,它比數(shù)據(jù)更抽象,信息藏在現(xiàn)象的背后驱敲,需要挖掘铁蹈,測(cè)量,計(jì)算和推理而得出众眨。不過(guò)握牧,數(shù)據(jù)是人類根據(jù)自身的水平創(chuàng)造出來(lái)的,有很多是沒(méi)有價(jià)值的围辙,甚至是偽造的我碟。信息可以是數(shù)據(jù),數(shù)據(jù)不一定是信息姚建。
人類對(duì)數(shù)據(jù)和信息進(jìn)行處理后就獲得了知識(shí)矫俺。知識(shí)比信息層次更高,更抽象掸冤,也有系統(tǒng)性的特點(diǎn)厘托。書(shū)中舉例,我們看到天空中星球運(yùn)動(dòng)變化的現(xiàn)象稿湿,通過(guò)測(cè)量得到星球的位置和對(duì)應(yīng)的時(shí)間铅匹,得到數(shù)據(jù);通過(guò)數(shù)據(jù)得到了星球運(yùn)動(dòng)的軌跡饺藤,這是信息包斑;通過(guò)對(duì)信息的總結(jié)提煉得出開(kāi)普勒定律,形成了人類的知識(shí)涕俗。
開(kāi)普勒三定律
二. 圖靈測(cè)試罗丰,人工智能和機(jī)器智能
圖靈測(cè)試
圖靈測(cè)試是由計(jì)算機(jī)科學(xué)之父阿蘭圖靈博士提出的,他認(rèn)為機(jī)器是可以有智能的再姑,提出了一種驗(yàn)證機(jī)制萌抵,讓一臺(tái)機(jī)器和一個(gè)人坐在幕后,讓一個(gè)裁判同時(shí)與幕后的人和機(jī)器進(jìn)行交流,如果這個(gè)裁判無(wú)法判斷自己交流的是人還是機(jī)器绍填,就認(rèn)為機(jī)器有了人的智能霎桅。
人工智能有兩個(gè)定義,廣義的是泛指機(jī)器智能讨永,也就是任何可以讓計(jì)算機(jī)通過(guò)圖靈測(cè)試的方法滔驶,包括數(shù)據(jù)驅(qū)動(dòng),知識(shí)發(fā)現(xiàn)或機(jī)器學(xué)習(xí)的方法住闯。狹義的指20世紀(jì)五六十年代傳統(tǒng)的研究機(jī)器智能的方法瓜浸,即首先了解人類如何產(chǎn)生智能的,然后讓計(jì)算機(jī)按照人的思路去處理問(wèn)題比原。
發(fā)展到今天插佛,傳統(tǒng)的人工智能方法在語(yǔ)音識(shí)別、圍棋比賽量窘、無(wú)人駕駛等領(lǐng)域比以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)驅(qū)動(dòng)和機(jī)器學(xué)習(xí)的機(jī)器智能方法落后很多雇寇,幾乎被棄用。
三. 大數(shù)據(jù)的特征
大數(shù)據(jù)的第一個(gè)特征是數(shù)據(jù)體量大蚌铜。數(shù)據(jù)量大意味著信息量大锨侯,是大數(shù)據(jù)的前提。但是冬殃,數(shù)據(jù)不是越大越好囚痴,它體現(xiàn)的數(shù)據(jù)價(jià)值也很重要,否則數(shù)據(jù)的量再大也沒(méi)有意義审葬。比如深滚,把全世界人口的出生時(shí)間全部統(tǒng)計(jì)出來(lái)的數(shù)據(jù)量也不小,但是這個(gè)數(shù)據(jù)出來(lái)給出全世界人口的年齡分步之外涣觉,也得不到其他太多有價(jià)值的信息痴荐,而且這種數(shù)據(jù)通過(guò)抽樣調(diào)查也可以得到近似的結(jié)果,意義不大官册。
大數(shù)據(jù)的第二個(gè)特征是多維度生兆,多樣性的數(shù)據(jù)。舉例膝宁,百度在2013年發(fā)布的全國(guó)吃貨排行榜鸦难,百度通過(guò)用戶搜索數(shù)據(jù)和百度知道的數(shù)據(jù),把看似無(wú)關(guān)的維度员淫,如時(shí)間合蔽,地域,食品满粗,價(jià)格,做法和成分等聯(lián)系了起來(lái)愚争,得到了準(zhǔn)確反映中國(guó)不同地區(qū)的飲食習(xí)慣的統(tǒng)計(jì)規(guī)律映皆。他并沒(méi)有刻意去調(diào)研統(tǒng)計(jì)挤聘,而是通過(guò)日常數(shù)據(jù)挖掘而來(lái)。它的方法是傳統(tǒng)統(tǒng)計(jì)學(xué)很難達(dá)到的捅彻,一個(gè)是全樣本調(diào)查的成本代價(jià)组去,一個(gè)是統(tǒng)計(jì)學(xué)的抽樣調(diào)查方式,如問(wèn)卷調(diào)查步淹,準(zhǔn)確性不高从隆。
大數(shù)據(jù)的第三個(gè)特征是全面性,完備性缭裆。舉例:2012年美國(guó)大選键闺,一個(gè)叫斯維爾的年輕人,通過(guò)盡可能全面的收集網(wǎng)絡(luò)上特別是社交網(wǎng)絡(luò)上所有關(guān)于2012年選舉的信息澈驼,進(jìn)行整理和分析辛燥,成功預(yù)測(cè)了全部50+1個(gè)州的選舉結(jié)果,讓著名的蓋洛普調(diào)查公司也自嘆不如缝其。
大數(shù)據(jù)的及時(shí)性很重要挎塌,可以處理很多以前不能處理的問(wèn)題,比如城市交通管理的問(wèn)題内边,可以實(shí)時(shí)監(jiān)測(cè)人流和車流榴都。但是對(duì)大數(shù)據(jù)而言,并不是只有即時(shí)性的數(shù)據(jù)才有價(jià)值漠其,歷史數(shù)據(jù)依然有意義嘴高,這不是成為大數(shù)據(jù)的前提。
[四. 智能問(wèn)題還是數(shù)據(jù)問(wèn)題
機(jī)器智能還停留在普通人觀看的科幻小說(shuō)和電影中的時(shí)候辉懒,計(jì)算機(jī)的運(yùn)行速度卻一直在呈指數(shù)級(jí)的增長(zhǎng)阳惹,不過(guò)在現(xiàn)實(shí)中,人們發(fā)現(xiàn)機(jī)器智能仍然不算智能眶俩,不會(huì)下棋莹汤,不會(huì)回答問(wèn)題,不善于主動(dòng)作成判斷颠印。但從1996年IBM的超級(jí)計(jì)算機(jī)深藍(lán)和國(guó)際象棋大師卡斯帕羅夫?qū)臅r(shí)纲岭,機(jī)器智能發(fā)生了質(zhì)的飛躍。
1996年线罕,深藍(lán)和卡斯帕羅夫在國(guó)際象棋六番棋的比賽成績(jī)?yōu)?.5:3.5止潮,雖然從比分上輸了,但是這是計(jì)算機(jī)第一次戰(zhàn)勝人類的世界冠軍钞楼。
1997年喇闸,短短一年后,IBM收集了所有卡斯帕羅夫的對(duì)弈記錄,利用這些記錄數(shù)據(jù)建立了計(jì)算模型燃乍,讓深藍(lán)進(jìn)行學(xué)習(xí)唆樊。當(dāng)深藍(lán)再次挑戰(zhàn)卡斯帕羅夫,六盤(pán)比賽兩勝一負(fù)叁平局刻蟹,獲勝逗旁。
其后,計(jì)算機(jī)開(kāi)始挑戰(zhàn)更高水平的圍棋對(duì)弈舆瘪。
2016年1月片效,谷歌AlphaGo戰(zhàn)勝歐洲圍棋冠軍樊麾二段。
2016年3月英古,谷歌AlphaGo戰(zhàn)勝韓國(guó)九段圍棋高手李世石淀衣。
計(jì)算機(jī)智能的飛速進(jìn)步,是得益于計(jì)算能力和大數(shù)據(jù)哺呜∩噻停科學(xué)家把機(jī)器智能問(wèn)題轉(zhuǎn)化為大數(shù)據(jù)和機(jī)器學(xué)習(xí)的問(wèn)題,大數(shù)據(jù)對(duì)機(jī)器智能起到?jīng)Q定性作用某残。