一個(gè)叫做搜索引擎的家伙


謝宇衡

概述

隨著時(shí)代的發(fā)展,人與人之間的交流變得越來越便捷到逊。至WEB開創(chuàng)以來吮便,短短10年間人類就產(chǎn)生了10億網(wǎng)頁骆姐,而人類自有文字以來上萬年間產(chǎn)生的書也不過1億本左右镜粤。信息數(shù)字化傳媒逐漸替代紙媒,但是面對如此海量甚至泛濫的信息玻褪,我們應(yīng)該如何從中篩選出有用的信息呢肉渴?

為了解決這一問題,搜索引擎應(yīng)運(yùn)而生了带射。作為查找信息的入口同规,熟悉地掌握搜索引擎并了解一些使用搜索引擎的方法能幫助我們節(jié)約查找信息的時(shí)間,甚至我們可以通過搜索引擎了解到一些我們前所未知的東西窟社。下面我將向大家介紹一些使用搜索引擎的方法券勺。

基本知識

一般來說搜索內(nèi)容主要由三個(gè)要素構(gòu)成,即標(biāo)題灿里、URL关炼、摘要。下面通過大家最常用的Google來說明匣吊。

注:跟“關(guān)鍵詞”一致的標(biāo)題或摘要內(nèi)容儒拂,搜索引擎一般會以“紅色”的形式標(biāo)注出來。

需要說明的兩個(gè)問題:

  1. 為了保證搜索的效率和反饋搜索內(nèi)容的及時(shí)性色鸳,當(dāng)用戶提交查詢的時(shí)候社痛,搜索引擎并非立即在Web上“搜索”一通,而是事先已將網(wǎng)頁收集好放在搜索引擎的數(shù)據(jù)庫中命雀,用戶通過搜索得到的信息只是搜索引擎內(nèi)部數(shù)據(jù)庫的靜態(tài)網(wǎng)頁數(shù)據(jù)而已蒜哀。
  2. 當(dāng)用戶點(diǎn)擊搜索結(jié)果的標(biāo)題或鏈接,獲得網(wǎng)頁全文的時(shí)候吏砂,他此時(shí)訪問的則不再是搜索引擎數(shù)據(jù)庫中的靜態(tài)網(wǎng)頁撵儿,而是網(wǎng)頁的原始出處。

所以狐血,從理論上講统倒,搜索引擎并不能保證用戶從搜索結(jié)果看到的標(biāo)題摘要信息與他點(diǎn)擊的URL一致,甚至不能保證原有網(wǎng)頁的存在氛雪,這就是為什么有的時(shí)候搜索內(nèi)容的鏈接無法打開的原因。值得提出的是不同的搜索引擎收集網(wǎng)頁信息的時(shí)間不一樣耸成,Google收集網(wǎng)頁的周期為28天而百度大概每3個(gè)月一次报亩。

為了彌補(bǔ)這方面的缺陷浴鸿,搜索引擎都會保存網(wǎng)頁收集過程中的網(wǎng)頁全文,并在返回結(jié)果中提供“網(wǎng)頁快照”或“歷史網(wǎng)頁”鏈接弦追,保證讓用戶看到的網(wǎng)頁信息和摘要信息一致岳链。關(guān)于如何利用網(wǎng)頁快照還有一些小技巧可以談。

主流搜索引擎的特點(diǎn)

現(xiàn)在的搜索引擎非常多劲件,每一家互聯(lián)網(wǎng)公司似乎都想在搜索引擎上做點(diǎn)文章掸哑,百度、Google這樣的老牌搜索引擎就不必說了零远,一些不是主營搜索業(yè)務(wù)的公司也推出了搜索引擎苗分,如騰訊的soso,搜狗的sogou牵辣,360最新推出的360sou摔癣,甚至Google離開中國后廣東幾個(gè)在校女生還推出了一個(gè)“谷姐搜索”。

每個(gè)搜索引擎的特點(diǎn)和搜索方式都存在一些差異纬向,因?yàn)闀r(shí)間有限择浊,下面僅介紹“百度”和“Google”的異同之處。

  1. 從搜索結(jié)果上看逾条,谷歌在搜索結(jié)果顯的更客觀一些琢岩,尤其在搜索技術(shù)性文章的時(shí)候,結(jié)果更加精準(zhǔn)师脂。而百度則更側(cè)重于中國網(wǎng)民的搜索習(xí)慣担孔,搜索結(jié)果更加大眾化。這就是為什么技術(shù)人員更喜歡用谷歌危彩,而百度更符合大眾口味的原因攒磨。值得提出的是在一些冷門、專業(yè)化的搜索結(jié)果上Google比百度表現(xiàn)的優(yōu)秀得多汤徽,說明Google在搜索技術(shù)上更成熟一些娩缰。
  2. 在收錄網(wǎng)頁方面,Google的更新速率更快一些谒府,一般的新站拼坎,如果被收錄了首頁,Google在接下來的很短的一段時(shí)間里完疫,整個(gè)網(wǎng)站大部分網(wǎng)頁都會被收錄泰鸡;而百度相對來說要謹(jǐn)慎得多,百度收錄網(wǎng)站的過程就是一個(gè)比較平緩的進(jìn)程壳鹤,它在一開始就會審核網(wǎng)站的所有文章盛龄,分析文章的價(jià)值,有選擇的進(jìn)行收錄,這個(gè)過程持續(xù)不斷余舶,收錄量也不會有太大波動(dòng)啊鸭。
  3. 在網(wǎng)頁標(biāo)題上,百度對含有多個(gè)關(guān)鍵詞的標(biāo)題比谷歌更友好匿值,例如免費(fèi)小說網(wǎng)赠制,就可以拆分出免費(fèi)小說、小說網(wǎng)挟憔,免費(fèi)小說網(wǎng)钟些,小說四個(gè)關(guān)鍵詞;Google就不一定了绊谭。百度這種做法可以對用戶搜索的“關(guān)鍵詞”提供更多的“搜索結(jié)果”政恍,但是搜索內(nèi)容不一定是用戶想要的,這是Google的搜索內(nèi)容比百度更精確的原因之一龙誊。

值得提出的是百度對用戶多個(gè)“關(guān)鍵詞”處理會自動(dòng)處理成“或”的語法抚垃,而Google會自動(dòng)處理成“與”的語法,特別是返回列表前面的內(nèi)容趟大。例如搜索關(guān)鍵詞“宋城 技術(shù)”鹤树,百度的搜索結(jié)果為“宋城v技術(shù)”只要包含杭州或西湖的標(biāo)題都呈現(xiàn);而Google則是“宋城^技術(shù)”逊朽,搜索標(biāo)題里既包含杭州又西湖的頁面會優(yōu)先呈現(xiàn)出來罕伯。

百度搜索“宋城 技術(shù)”的返回結(jié)果


Google搜索“宋城 技術(shù)”的返回結(jié)果


在收錄內(nèi)容上Google一般會比百度收錄的多一些,所以Google在搜索結(jié)果會比百度更全面一些叽讳。下面我通過站內(nèi)搜索中國教育類網(wǎng)站(關(guān)鍵詞“site:edu.cn”)來說明兩個(gè)搜索引擎之間的差別追他。

圖:百度搜索關(guān)鍵詞“site:edu.cn”的返回結(jié)果

圖: Google搜索關(guān)鍵詞“site:edu.cn”的返回結(jié)果

通過搜索內(nèi)容可以看出百度收錄了43,300,000個(gè)網(wǎng)頁;而Google收錄了 76,200,000個(gè)網(wǎng)頁(二者收錄的差距近一倍5涸椤)邑狸。

百度在一些個(gè)性化服務(wù)方面做得比Google相對較好,如 “百度知道”涤妒、“百度貼吧”单雾、“百度百科”等極大地豐富、便利了網(wǎng)民的生活她紫;另外百度推出了一個(gè)框計(jì)劃硅堆,如搜索音樂或者快遞時(shí),可直接在百度框里面得到自己想要的信息贿讹。相對百度渐逃,Google在做整合搜索方面的創(chuàng)新,意在將互聯(lián)網(wǎng)相關(guān)信息的內(nèi)容多面化立體性地展示給用戶民褂;二者各有特點(diǎn)茄菊。

如百度搜索關(guān)鍵詞“歌曲 我愿意 王菲”的返回結(jié)果可直接在“百度框”里播放歌曲或者M(jìn)V疯潭,是不是讓搜索變得便捷了?

搜索引擎的一些基本語法及應(yīng)用

下面僅介紹使用百度搜索時(shí)买羞,搜索過程中會常用的一些語法袁勺。Google跟百度的搜索語法大同小異。

站內(nèi)搜索“site”

Site語法的作用是限定在特定網(wǎng)站內(nèi)搜索畜普。如果你知道這些網(wǎng)站中有你想要的信息,可以使用site語法縮小搜索范圍群叶,加快搜索速度吃挑。

需要注意的是,“site”后面的一系列字符街立、標(biāo)點(diǎn)都必須是英文字符舶衬、標(biāo)點(diǎn),另外 “site”后面的地址不能加“http//www.”或“www.”赎离,這樣做是不合法的逛犹!如搜索“越獄 site:www.verycd.com”就不行。

使用雙引號("")縮小搜索范圍

在進(jìn)行搜索時(shí)梁剔,搜索引擎為了返回給用戶盡可能多的內(nèi)容虽画,會對用戶搜索的關(guān)鍵詞進(jìn)行拆分。如搜索我的郵箱郵箱“goldsmile@163.com”荣病,這時(shí)百度搜索引擎會拆分為“gold”码撰、“smile”、“163.com”等關(guān)鍵詞个盆。有時(shí)候這種拆分未必是用戶所希望的脖岛,可使用語法雙引號””來限定搜索結(jié)果中必須出現(xiàn)內(nèi)容。如搜索“goldsmile@163.com”時(shí)颊亮,加上””會返回僅跟“goldsmile@163.com ”相關(guān)的網(wǎng)頁內(nèi)容柴梆。

百度搜索關(guān)鍵詞“goldsmile@163.com”的返回結(jié)果

百度搜索關(guān)鍵詞“”goldsmile@163.com””的返回結(jié)果

google搜索關(guān)鍵詞“”goldsmile@163.com””的返回結(jié)果

使用語法“-”號

在關(guān)鍵詞的前面使用減號,也就意味著在查詢結(jié)果中不能出現(xiàn)該關(guān)鍵詞终惑,例如绍在,在搜索引擎中輸入“電視臺-中國網(wǎng)絡(luò)電視臺”,它就表示最后的搜索結(jié)果中一定不包含“中國網(wǎng)絡(luò)電視臺”狠鸳。

在百度搜索中揣苏,這個(gè)語法的界定并不嚴(yán)格!

使用filetype語法搜索特定的文本信息

在搜索關(guān)鍵詞中加入“filetype”意即搜索結(jié)果中包含制定格式的文件內(nèi)容件舵。如搜索“番茄炒蛋 filetype:txt”時(shí)卸察,網(wǎng)頁返回的都是txt的文件信息。用filetype搜索文本信息非常方便铅祸,如搜索“入黨申請 filetype:txt”時(shí)就會有許多“TXT”格式的文檔可下載坑质。搜索電子書時(shí)也可將后綴名改為常見的電子書格式合武,如“filetype:epub”、“filetype:word”涡扼、“filetype:chm”稼跳。

百度搜索關(guān)鍵詞“入黨申請 filetype:txt”的返回結(jié)果

使用搜索引擎應(yīng)注意的一些問題

1,了解你所搜索的東西在網(wǎng)上是否存在?如果存在的話會在什么地方以什么樣的形式存在吃沪?有的時(shí)候你所搜索的東西在網(wǎng)上并不一定存在汤善,這個(gè)時(shí)候用搜索引擎未必是最好的選擇(114查詢可能比使用搜索引擎更好),所以進(jìn)行搜索之前應(yīng)仔細(xì)思考你所搜索的東西在網(wǎng)上是否存在票彪,有沒比搜索引擎更好的方式红淡。

一般說來像文獻(xiàn)、小說降铸、電影在旱、音樂、新聞推掸,生活中遇到的常識桶蝎、發(fā)生的問題等都能在網(wǎng)上找到相關(guān)的信息。而且根據(jù)信息類型的不同谅畅,信息存在的方式也有差別登渣。比如新聞存在的形式就是多種多樣的,有官方報(bào)道铃彰、小道消息绍豁、門戶網(wǎng)站發(fā)布等。作為信息的查詢者不能只通過一種渠道進(jìn)行單一的途徑來獲取信息牙捉,而是應(yīng)多渠道立體化地了解這些信息竹揍。

百度搜索關(guān)鍵詞“朝鮮衛(wèi)星”的返回結(jié)果

Google搜索關(guān)鍵詞“朝鮮新聞”的返回結(jié)果

從以上例子可以看出,同樣是朝鮮衛(wèi)星發(fā)射成功邪铲,不同媒體的報(bào)道內(nèi)容芬位、態(tài)度、立場都不盡相同带到。所以搜索者應(yīng)盡量立體化全方面地檢索自己需要了解的信息昧碉。

2,搜索時(shí)應(yīng)盡量避免一些低級錯(cuò)誤揽惹,如搜錯(cuò)關(guān)鍵詞被饿,將“王菲”打成了“王非”,這樣的查找結(jié)果肯定不是你所需要的搪搏。為了避免關(guān)鍵詞被搜索引擎拆分狭握,可在關(guān)鍵詞上加上引號。

3疯溺,注意搜索內(nèi)容的網(wǎng)頁特征论颅。搜索之前一定要注意自己所搜索的內(nèi)容會在什么樣的網(wǎng)站以什么樣的形式存在哎垦,會出現(xiàn)哪些特別的關(guān)鍵詞。根據(jù)這些關(guān)鍵詞進(jìn)行查找會起到事半功倍的效果恃疯。

這個(gè)是如何使用好搜索引擎最核心的內(nèi)容漏设,我通過下面的例子來說明:
如何查找電影

尋找頁面特征

查找電影時(shí)我們會發(fā)現(xiàn)在有時(shí)頁面上有時(shí)會出現(xiàn)鏈接地址,直接復(fù)制就可以用迅雷今妄、旋風(fēng)等下載工具下載郑口,非常方便。下圖為論壇上出現(xiàn)的《邊境風(fēng)云》的下載鏈接蛙奖。通過直接復(fù)制下載地址就可以用迅雷下載潘酗。

圖:論壇上出現(xiàn)的關(guān)于電影《邊境風(fēng)云》的頁面

根據(jù)頁面特征,我們會發(fā)現(xiàn)可以直接復(fù)制的鏈接里面有“thunder://…”這樣比較獨(dú)特的關(guān)鍵詞雁仲。

根據(jù)頁面特征進(jìn)行檢索

那么我們通過剛剛出現(xiàn)的頁面特征搜索關(guān)鍵詞“《邊境風(fēng)云》 thunder”會是什么效果呢?

圖:百度搜索關(guān)鍵詞“《邊境風(fēng)云》 thunder”的返回結(jié)果

巧用“快照”

是不是搜索好了點(diǎn)擊頁面直接下載就好了琐脏?是的攒砖,但先別急,因?yàn)檫@樣還不夠方便日裙。最好的方法是點(diǎn)開百度快照吹艇,這樣做有三個(gè)好處:其一,保證你搜索到的信息一定存在(你點(diǎn)擊的頁面可能不存在了昂拂,而快照上一定存在)受神;其二,快照里面會將你查找的關(guān)鍵詞標(biāo)紅格侯,便于你快速尋找鼻听;其三,規(guī)避頁面上出現(xiàn)的廣告或者病毒等联四。

圖:打開百度快照后的頁面

影視搜索特點(diǎn)

電影具有時(shí)效性撑碴,最新出來的電影在搜索引擎上是很難查找到的,這跟搜索引擎的靜態(tài)數(shù)據(jù)庫更新周期有關(guān)朝墩,前面已講醉拓,這里不在贅述了。所以最新出來的電影不建議通過搜索引擎來查找收苏,但是大家可以通過新浪微博等這樣短亿卤、平、快的平臺來搜索最新的信息鹿霸。

其它搜索方式

查找信息時(shí)搜索引擎未必是你最佳的選擇排吴,有的時(shí)候在一些門戶網(wǎng)站反而更容易搜索到一些你想要的內(nèi)容。

影視搜索

胖次搜索(訪問地址)的頁面看起來很二杜跷,但是搜索效果非常好傍念,搜索完后所反饋的結(jié)果都是百度網(wǎng)盤的內(nèi)容矫夷,通過胖次找到的資料可以直接存到自己的百度云盤里,若是搜索影視保存完后可以用百度云直接觀看憋槐,非常方便双藕。筆者經(jīng)常通過胖次搜索查找一些經(jīng)典影視。

企業(yè)信息

啟信寶搜索(訪問地址)查找企業(yè)相關(guān)的信息非常方便阳仔,啟信寶收錄的企業(yè)不僅多而且全面忧陪,如果企業(yè)經(jīng)營信息有變化啟信寶也會經(jīng)常更新。通過啟信寶搜索企業(yè)信息比用搜索引擎直接搜索反饋結(jié)果更好近范。

電子書

鳩摩搜書(訪問地址)是一個(gè)聚合了百度云嘶摊,kindle114等諸多國內(nèi)著名電子書資源匯集網(wǎng)站。在鳩摩搜書上你可以自由選擇文件格式评矩,并且可以看到電子書資源所處的網(wǎng)站叶堆。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市斥杜,隨后出現(xiàn)的幾起案子虱颗,更是在濱河造成了極大的恐慌,老刑警劉巖蔗喂,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件忘渔,死亡現(xiàn)場離奇詭異,居然都是意外死亡缰儿,警方通過查閱死者的電腦和手機(jī)畦粮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來乖阵,“玉大人宣赔,你說我怎么就攤上這事∫迤穑” “怎么了拉背?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長默终。 經(jīng)常有香客問我椅棺,道長,這世上最難降的妖魔是什么齐蔽? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任两疚,我火速辦了婚禮,結(jié)果婚禮上含滴,老公的妹妹穿的比我還像新娘诱渤。我一直安慰自己,他們只是感情好谈况,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布勺美。 她就那樣靜靜地躺著递胧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪赡茸。 梳的紋絲不亂的頭發(fā)上缎脾,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天,我揣著相機(jī)與錄音占卧,去河邊找鬼遗菠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛华蜒,可吹牛的內(nèi)容都是我干的辙纬。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼叭喜,長吁一口氣:“原來是場噩夢啊……” “哼贺拣!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起捂蕴,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤纵柿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后启绰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡沟使,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年委可,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腊嗡。...
    茶點(diǎn)故事閱讀 39,711評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡着倾,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出燕少,到底是詐尸還是另有隱情卡者,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布客们,位于F島的核電站崇决,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏底挫。R本人自食惡果不足惜恒傻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望建邓。 院中可真熱鬧盈厘,春花似錦、人聲如沸官边。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至契吉,卻和暖如春跳仿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背栅隐。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工塔嬉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人租悄。 一個(gè)月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓谨究,卻偏偏與公主長得像,于是被迫代替她去往敵國和親泣棋。 傳聞我的和親對象是個(gè)殘疾皇子胶哲,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容