爬蟲就是從網(wǎng)絡(luò)上發(fā)現(xiàn)你想要數(shù)據(jù)的工具乍惊。
來自網(wǎng)絡(luò)
大互聯(lián)網(wǎng)公司
我原來在互聯(lián)網(wǎng)公司,覺得獲取數(shù)據(jù)so easy解幼。只要你需要抑党,好像各種數(shù)據(jù)都有,數(shù)據(jù)多到必須把一些不是很重要的的數(shù)據(jù)按期老化掉撵摆,不重要的數(shù)據(jù)不接受底靠。
傳統(tǒng)行業(yè)和小公司
離開大互聯(lián)網(wǎng)公司后,接觸的公司也比較多了特铝,原來很多公司都沒有數(shù)據(jù)暑中,但是還是想搞大數(shù)據(jù)。我原來也是不理解鲫剿,你沒數(shù)據(jù)搞啥大數(shù)據(jù)嗎鳄逾?這不是讓馬兒跑,還不給馬兒草么灵莲。
但是雕凹,現(xiàn)在我不這樣想了。在大數(shù)據(jù)的熱潮下政冻,大家都怕錯(cuò)過這個(gè)風(fēng)口枚抵,所以必須參加進(jìn)來;再大數(shù)據(jù)對傳統(tǒng)行業(yè)的改變明场,大家也有目共睹俄精,比如uber對打車的改變,余額寶對金融的改變等榕堰。所以我們需要想辦法獲取數(shù)據(jù)竖慧,而不是沒有數(shù)據(jù)我們就不搞大數(shù)據(jù)了嫌套。
數(shù)據(jù)來源
一方面,使自己的產(chǎn)品互聯(lián)網(wǎng)化圾旨,數(shù)據(jù)可以積累起來踱讨,但是路程漫長。
另一方面砍的,從互聯(lián)網(wǎng)中獲取數(shù)據(jù)痹筛。但是互聯(lián)網(wǎng)中的數(shù)據(jù)又不開放,那么爬蟲就派上用場了廓鞠,而且還可以快速獲取數(shù)據(jù)帚稠。
專題主要內(nèi)容
- 爬蟲技術(shù)交流
- 數(shù)據(jù)分享