一、GOOGLE簡介
Google是一個(gè)搜索引擎,由兩個(gè)斯坦福大學(xué)博士生Larry Page與Sergey Brin于1998年9月發(fā)明案淋,Google Inc. 于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎蔽氨,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。98年至今鹉究,GOOGLE已經(jīng)獲得30多項(xiàng)業(yè)界大獎(jiǎng)宇立。
二、GOOGLE特色
GOOGLE支持多達(dá)132種語言自赔,包括簡體中文和繁體中文妈嘹;
GOOGLE網(wǎng)站只提供搜索引擎功能,沒有花里胡哨的累贅绍妨;
GOOGLE速度極快润脸,據(jù)說有8000多臺(tái)服務(wù)器,200多條T3級寬帶他去;
GOOGLE的專利網(wǎng)頁級別技術(shù)PageRank能夠提供高命中率的搜索結(jié)果毙驯;
GOOGLE的搜索結(jié)果摘錄查詢網(wǎng)頁的部分具體內(nèi)容,而不僅僅是網(wǎng)站簡介孤页;
GOOGLE智能化的“手氣不錯(cuò)”功能尔苦,提供可能最符合要求的網(wǎng)站;
GOOGLE的“網(wǎng)頁快照”功能行施,能從GOOGLE服務(wù)器里直接取出緩存的網(wǎng)頁允坚。
三、基本搜索
GOOGLE的基本搜索語法:+蛾号,-稠项,OR
GOOGLE無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了鲜结。
示例:搜索所有包含關(guān)鍵詞“易筋經(jīng)”和“吸星大法”的中文網(wǎng)頁
搜索:“易筋經(jīng) 吸星大法”
結(jié)果:已搜索有關(guān)易筋經(jīng) 吸星大法的中文(簡體)網(wǎng)頁展运。共約有988項(xiàng)查詢結(jié)果,這是第1-10項(xiàng)精刷。搜索用時(shí)0.30秒拗胜。
注意:文章中搜索語法外面的引號(hào)僅起引用作用,不能帶入搜索欄內(nèi)怒允。
GOOGLE用減號(hào)“-”表示邏輯“非”操作埂软。
示例:搜索所有包含“易筋經(jīng)”而不含“吸星大法”的中文網(wǎng)頁
搜索:“易筋經(jīng) -吸星大法”
結(jié)果:已搜索有關(guān)易筋經(jīng) -吸星大法的中文(簡體)網(wǎng)頁。共約有6,030項(xiàng)查詢結(jié)果纫事,這是第1-10項(xiàng)勘畔。搜索用時(shí)0.20秒。
注意:這里的“+”和“-”號(hào)丽惶,是英文字符炫七,而不是中文字符的“+”和“-”。此外钾唬,操作符與作用的關(guān)鍵字之間万哪,不能有空格侠驯。比如“易筋經(jīng) - 吸星大法”,搜索引擎將視為邏輯“與”操作壤圃,中間的“-”被忽略陵霉。
GOOGLE不支持關(guān)鍵字為中文的邏輯“或”查詢,但支持英文關(guān)鍵字的“或”操作伍绳,語法是大寫的“OR”。
示例:搜索包含布蘭妮“Britney”或者披頭士“Beatles”乍桂、或者兩者均有的中文網(wǎng)頁冲杀。
搜索:“britney OR beatles”
結(jié)果:已搜索有關(guān)beatles OR britney的中文(簡體)網(wǎng)頁。共約有19,800項(xiàng)查詢結(jié)果睹酌,這是第1-10項(xiàng)权谁。搜索用時(shí)0.35秒。
搜索:“布蘭妮 OR 披頭士”
結(jié)果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網(wǎng)頁憋沿。
“+”和“-”的作用有的時(shí)候是相同的旺芽,都是為了縮小搜索結(jié)果的范圍,提高查詢結(jié)果命中率辐啄。
例:查閱天龍八部具體是哪八部采章。
分析:如果光用“天龍八部”做關(guān)鍵字,搜索結(jié)果有26,500項(xiàng)壶辜,而且排前列的主要與金庸的小說《天龍八部》相關(guān)悯舟,很難找到所需要的資訊≡颐瘢可以用兩個(gè)方法減少無關(guān)結(jié)果抵怎。
1,如果你知道八部中的某一部岭参,比如阿修羅反惕,增加“阿修羅”關(guān)鍵字,搜索結(jié)果就只有995項(xiàng)演侯,可以直接找到全部八部姿染,“天龍八部 阿修羅”。
2蚌本,如果你不知道八部中的任何一部盔粹,但知道這與佛教相關(guān),可以排除與金庸小說相關(guān)的記錄程癌,查詢結(jié)果為1,010項(xiàng)舷嗡,可以迅速找到需要的資料,“天龍八部 佛教 -金庸”嵌莉。
四进萄、輔助搜索
GOOGLE不支持通配符,如“*”、“?”等中鼠,只能做精確查詢可婶,關(guān)鍵字后面的“*”或者“?”會(huì)被忽略掉。
GOOGLE對英文字符大小寫不敏感援雇,“GOD”和“god”搜索的結(jié)果是一樣的矛渴。
GOOGLE的關(guān)鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格)惫搏,但是具温,用句子做關(guān)鍵字,必須加英文引號(hào)筐赔。
示例:搜索包含“l(fā)ong, long ago”字串的頁面铣猩。
搜索:“\"long, long ago\"”
結(jié)果:已向英特網(wǎng)搜索\"long, long ago\". 共約有24,600項(xiàng)查詢結(jié)果,這是第1-10項(xiàng)茴丰。搜索用時(shí)1.23秒达皿。
注意:GOOGLE對中文句子作智能化處理,會(huì)自動(dòng)把句子分割成詞語作為關(guān)鍵詞贿肩。比如峦椰,搜索包含“啊 我的太陽”這樣句子,“\"啊 我的太陽\"”尸曼,并沒有搜到完全匹配的結(jié)果们何,但是,GOOGLE以“啊”控轿、“我的”冤竹、“太陽”等詞語為關(guān)鍵詞,給出了符合諸如“啊茬射,我的太陽”這樣的結(jié)果鹦蠕。
GOOGLE對一些網(wǎng)路上出現(xiàn)頻率極高的詞(主要是英文單詞),如“i”在抛、“com”钟病,以及一些符號(hào)如“*”、“.”等刚梭,作忽略處理肠阱,如果用戶必須要求關(guān)鍵字中包含這些常用詞,就要用強(qiáng)制語法“+”朴读。
示例:搜索包含“Who am I ?”的網(wǎng)頁屹徘。如果用“\"who am i ?\"”,“Who”衅金、“I”噪伊、“?”會(huì)被省略掉簿煌,搜索將只用“am”作關(guān)鍵字,所以應(yīng)該用強(qiáng)制搜索鉴吹。
搜索:“\"+who am +i\"”
結(jié)果:已向英特網(wǎng)搜索\"+who am +i\". 共約有310,000項(xiàng)查詢結(jié)果姨伟,這是第1-10項(xiàng)。搜索用時(shí)0.30秒豆励。
注意:英文符號(hào)無法成為搜索關(guān)鍵字夺荒,加強(qiáng)制也不行。
五肆糕、高級搜索
GOOGLE的常用高級搜索語法:site般堆,link,inurl诚啃,allinurl,intitle私沮,allintitle
“site”表示搜索結(jié)果局限于某個(gè)具體網(wǎng)站或者網(wǎng)站頻道始赎,如“sina.com.cn”、“edu.sina.com.cn”仔燕,或者是某個(gè)域名造垛,如“com.cn”、“com”等等晰搀。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面五辽,只需用“-網(wǎng)站/域名”。
示例:搜索中文教育科研網(wǎng)站(edu.cn)上所有包含“金庸”的頁面外恕。
搜索:“金庸 site:edu.cn”
結(jié)果:已搜索有關(guān)金庸 site:edu.cn的中文(簡體)網(wǎng)頁杆逗。共約有3,780項(xiàng)查詢結(jié)果,這是第1-10項(xiàng) 鳞疲。搜索用時(shí)0.31秒罪郊。
示例:搜索包含“金庸”和“古龍”的中文新浪網(wǎng)站頁面,
搜索:“金庸 古龍 siteina.com.cn”
結(jié)果:已在sina.com.cn搜索有關(guān)金庸 古龍的中文(簡體)網(wǎng)頁尚洽。共約有722項(xiàng)查詢結(jié)果悔橄,這是第1-10項(xiàng)。搜索用時(shí)0.34秒腺毫。
注意:site后的冒號(hào)為英文字符癣疟,而且,冒號(hào)后不能有空格潮酒,否則睛挚,“site:”將被作為一個(gè)搜索的關(guān)鍵字。此外澈灼,網(wǎng)站域名不能有“http”以及“www”前綴竞川,也不能有任何“/”的目錄后綴店溢;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式委乌。諸如“金庸 site:edu.sina.com.cn/1/”的語法是錯(cuò)誤的床牧。
“l(fā)ink”語法返回所有鏈接到某個(gè)URL地址的網(wǎng)頁。
示例:搜索所有含指向華軍軟件園“www.newhua.com”鏈接的網(wǎng)頁遭贸。
搜索:“l(fā)ink:www.newhua.com”
結(jié)果:搜索有鏈接到www.newhua.com的網(wǎng)頁戈咳。共約有883項(xiàng)查...閹饔檬?.23秒。
注意:“l(fā)ink”不能與其他語法相混合操作壕吹,所以“l(fā)ink:”后面即使有空格著蛙,也將被GOOGLE忽略。
inurl語法返回的網(wǎng)頁鏈接中包含第一個(gè)關(guān)鍵字耳贬,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中踏堡。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”咒劲、“GALLARY”等顷蟆,于是,就可以用INURL語法找到這些相關(guān)資源鏈接腐魂,然后帐偎,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語法和基本搜索語法的最大區(qū)別在于蛔屹,前者通常能提供非常精確的專題資料削樊。
示例:查找MIDI曲“滄海一聲笑”。
搜索:“inurl:midi 滄海一聲笑”
結(jié)果:已搜索有關(guān)inurl:midi 滄海一聲笑的中文(簡體)網(wǎng)頁兔毒。共約有21項(xiàng)查詢結(jié)果漫贞,這是第1-10項(xiàng)。搜索用時(shí)0.01秒眼刃。
示例:查找微軟網(wǎng)站上關(guān)于windows2000的安全課題資料绕辖。
搜索:“inurlecurity windows2000 site:microsoft.com”
結(jié)果:已在microsoft.com內(nèi)搜索有關(guān) inurlecurity windows2000的網(wǎng)頁。共約有234項(xiàng)查詢結(jié)果擂红,這是第1-10項(xiàng)仪际。搜索用時(shí)0.37秒。
注意:“inurl:”后面不能有空格昵骤,GOOGLE也不對URL符號(hào)如“/”進(jìn)行搜索树碱。GOOGLE對“cgi-bin/phf”中的“/”當(dāng)成空格處理。
allinurl語法返回的網(wǎng)頁的鏈接中包含所有查詢關(guān)鍵字变秦。這個(gè)查詢的對象只集中于網(wǎng)頁的鏈接字符串成榜。
示例:查找可能具有PHF安全漏洞的公司網(wǎng)站。通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序(這個(gè)腳本是不安全的)蹦玫,表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”赎婚。
語法:“allinurl:\"cgi-bin\" phf +com”
搜索:已向英特網(wǎng)搜索allinurl:\"cgi-bin\" phf +com. 共約有48項(xiàng)查詢結(jié)果刘绣,這是第1-10項(xiàng)。搜索用時(shí)0.06秒挣输。
allintitle和intitle的用法類似于上面的allinurl和inurl纬凤,只是后者對URL進(jìn)行查詢,而前者對網(wǎng)頁的標(biāo)題欄進(jìn)行查詢撩嚼。網(wǎng)頁標(biāo)題停士,就是HTML標(biāo)記語言中之間的部分。網(wǎng)頁設(shè)計(jì)的一個(gè)原則就是要把主頁的關(guān)鍵內(nèi)容用簡潔的語言表示在網(wǎng)頁標(biāo)題中完丽。因此恋技,只查詢標(biāo)題欄,通常也可以找到高相關(guān)率的專題頁面。
示例:查找日本明星藤原紀(jì)香的照片集。
搜索:“intitle:藤原紀(jì)香 寫真”
結(jié)果:已搜索有關(guān)intitle:藤原紀(jì)香 寫真的中文(簡體)網(wǎng)頁吼野。共約有121項(xiàng)查詢結(jié)果,這是第1-10項(xiàng)朱躺。搜索用時(shí)0.03秒。
GOOGLE的罕用高級搜索語法:related搁痛,cache,info
related用來搜索結(jié)構(gòu)內(nèi)容方面相似的網(wǎng)頁宇弛。例:搜索所有與中文新浪網(wǎng)主頁相似的頁面(如網(wǎng)易首頁鸡典,搜狐首頁,中華網(wǎng)首頁等)枪芒,“related:www.sina.com.cn/index.shtml”彻况。
cache用來搜索GOOGLE服務(wù)器上某頁面的緩存,這個(gè)功能同“網(wǎng)頁快照”舅踪,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁或者某些被ISP封掉的網(wǎng)站的頁面纽甘,相當(dāng)于使用普通搜索結(jié)果頁面中的“網(wǎng)頁快照”功能。
示例:查找某IP被封的網(wǎng)站頁面抽碌。
搜索:“cache:www.giantdot.com/GB/politics/index.asp”
結(jié)果:This is G o o g l e\'s cache ofhttp://www.giantdot.com/GB/politics/index.asp.
Google 已先預(yù)覽各網(wǎng)站悍赢,拍下網(wǎng)頁的快照存檔。
這網(wǎng)頁可能有更新的版本货徙,請按此查看新版左权。
Google 和網(wǎng)頁作者無關(guān),不對網(wǎng)頁的內(nèi)容負(fù)責(zé)痴颊。
...
info用來顯示與某鏈接相關(guān)的一系列搜索赏迟,提供cache、link蠢棱、related和完全包含該鏈接的網(wǎng)頁的功能锌杀。
示例:查找和新浪首頁相關(guān)的一些資訊甩栈。
搜索:“info:www.sina.com.cn”
結(jié)果:有關(guān)www.sina.com.cn的網(wǎng)頁信息。
新浪首頁
北京站 上海站 廣東站. ... 游戲世界, |, 影音娛樂, |, Club緣, |, 男
人女人, |, 論壇聊天, |, 時(shí)尚潮流, |, 文教育兒, |, 車行天下, |,
軟件下載. ...
Google 提供這個(gè)網(wǎng)址的信息:
查看Google網(wǎng)頁快照里www.sina.com.cn的存檔
尋找和www.sina.com.cn類似的網(wǎng)頁
尋找網(wǎng)頁有鏈接到www.sina.com.cn
尋找網(wǎng)頁包含有\(zhòng)"www.sina.com.cn\"