大數(shù)據(jù)的大家都知道阁簸,但是他們的力量到底有多大枣耀,很多人沒有概念。大數(shù)據(jù)的意義之一乔宿,就是提供客觀真實(shí)的情況膳汪,在數(shù)據(jù)面前人們的常識(shí)往往是不準(zhǔn)確甚至偏差很大唯蝶。舉個(gè)簡(jiǎn)單例子,說起全球人口最多的十大城市遗嗽,大家首先想到的是東京粘我、北京、紐約痹换、上海征字、重慶、新德里娇豫、倫敦匙姜、巴黎、里約熱內(nèi)盧冯痢、首爾氮昧。但是或详,根據(jù)聯(lián)合國最新的調(diào)查顯示,人口最多十個(gè)城市郭计,有印度的孟買、新德里椒振、巴基斯坦的卡拉奇昭伸,墨西哥城、埃及的開羅澎迎、印尼的雅加達(dá)庐杨,這些城市人口都到了2000萬。
另一個(gè)方面夹供,就是大數(shù)據(jù)本身就是最有價(jià)值的地方灵份,尤其對(duì)于互聯(lián)網(wǎng)行業(yè)。比如對(duì)Google而言最重要的搜索業(yè)務(wù)哮洽,需要不斷提供給客戶更準(zhǔn)確填渠、高質(zhì)量的搜索結(jié)果。目前鸟辅,對(duì)于搜索網(wǎng)頁的質(zhì)量的排序規(guī)則氛什,60%權(quán)重是根據(jù)用戶的點(diǎn)擊量,剩余的40%權(quán)重是由搜索算法決定的匪凉。經(jīng)過多年的改進(jìn)枪眉,Goolge和微軟、百度在算法方面幾乎已經(jīng)沒有改進(jìn)的空間再层,改進(jìn)搜索質(zhì)量主要的靠統(tǒng)計(jì)客戶的點(diǎn)擊量來優(yōu)化網(wǎng)頁的相關(guān)性排名贸铜。換句話說,誰積累了最多的用戶的頁面點(diǎn)擊的統(tǒng)計(jì)數(shù)據(jù)聂受,誰就能提供高質(zhì)量就搜素結(jié)果蒿秦。對(duì)于搜索領(lǐng)域的后來者微軟而言,想在搜索質(zhì)量上趕上Google饺饭,除了算法的改進(jìn)和投入外渤早,用戶點(diǎn)擊數(shù)據(jù)的積累是最大的短板,這只能通過時(shí)間的積累瘫俊,沒有其他辦法捷徑可走鹊杖。
所以,微軟扛芽、Google骂蓖、百度都在全力推廣各自的Chrome瀏覽器、IE瀏覽器川尖、百度瀏覽器登下,其目的就在于收集用戶的頁面點(diǎn)擊情況為自己的搜索業(yè)務(wù)提供高質(zhì)量的大數(shù)據(jù)。這也是為什么各大公司都樂此不疲的推出新版本的瀏覽器免費(fèi)給大家下載的原因。大數(shù)據(jù)已經(jīng)成了互聯(lián)網(wǎng)企業(yè)的核心競(jìng)爭(zhēng)力被芳。