今天每個(gè)搜索引擎都有用戶點(diǎn)擊數(shù)據(jù)和搜索結(jié)果的相關(guān)數(shù)據(jù)模型妆兑,也就是所謂的“點(diǎn)擊模型”呀打,該模型的準(zhǔn)確性取決于數(shù)據(jù)量的大小肪虎,一個(gè)搜索引擎積累的數(shù)據(jù)越多,搜索就越精準(zhǔn)哮幢,bing 做不過(guò)google的原因不是因?yàn)樗惴ú恍写颍侨狈?shù)據(jù),同理橙垢,中國(guó)的小搜索引擎公司相對(duì)于百度的最大劣勢(shì)也是在數(shù)據(jù)上垛叨;因此整個(gè)搜索行業(yè)其實(shí)是在數(shù)據(jù)層面的競(jìng)爭(zhēng)。
從這個(gè)角度思考柜某,一些奇怪的問(wèn)題就有答案了:
1. 搜狗為什么做不賺錢(qián)的輸入法
2. 為什么國(guó)內(nèi)各大互聯(lián)網(wǎng)公司都設(shè)法推出自己的瀏覽器(沒(méi)有太多真正的技術(shù)含量)
3.為什么360免費(fèi)殺毒第一個(gè)給你推薦的安裝軟件就是360瀏覽器
因?yàn)槲④浲ㄟ^(guò)IE收集用戶使用Google的點(diǎn)擊情況嗽元,用來(lái)完善并改進(jìn)自己的搜索模型。這在國(guó)內(nèi)市場(chǎng)上也是如此莺琳,搜索質(zhì)量的競(jìng)爭(zhēng)轉(zhuǎn)變成了瀏覽器以及其它客戶端軟件市場(chǎng)占有率的競(jìng)爭(zhēng),從外面看是技術(shù)的競(jìng)爭(zhēng)载慈,更準(zhǔn)確的將是獲取數(shù)據(jù)的競(jìng)爭(zhēng)惭等。
頂級(jí)的互聯(lián)網(wǎng)公司的成功不僅靠的是技術(shù)和數(shù)據(jù),還是采用了大數(shù)據(jù)的方法論办铡,或者說(shuō)是大數(shù)據(jù)思維辞做;而作為數(shù)據(jù)公司琳要,做事情的方法跟傳統(tǒng)的公司是不一樣的,因?yàn)楹芏鄷r(shí)候工程師很少花大量的時(shí)間來(lái)確定因果關(guān)系秤茅,而是從大數(shù)據(jù)中去挖掘相關(guān)性稚补,據(jù)說(shuō)google 有四成的工程師是從事數(shù)據(jù)挖掘的。