目標(biāo):
- 了解什么是全文索引技術(shù)踏兜?
想明白字典的出現(xiàn)是為什么袜爪?
結(jié)構(gòu)化數(shù)據(jù):指固定格式或有限長(zhǎng)度的數(shù)據(jù);如數(shù)據(jù)庫(kù)娜搂,元數(shù)據(jù)等迁霎。
非結(jié)構(gòu)化數(shù)據(jù): 指不定長(zhǎng)或無(wú)固定的數(shù)據(jù); 如 互聯(lián)網(wǎng)數(shù)據(jù)百宇,郵件考廉,word文檔等。
非結(jié)構(gòu)化數(shù)據(jù)又叫全文數(shù)據(jù)携御。 - 全文索引技術(shù)可以用來做什么昌粤?
搜索引擎:百度既绕,谷歌,搜狗等
站內(nèi)搜索: 小說網(wǎng)站涮坐,電商網(wǎng)站凄贩,論壇等。
文件系統(tǒng)搜索: Windows 文件系統(tǒng)搜索
先建立索引袱讹,再對(duì)索引進(jìn)行搜索文檔的過程就叫 全文索引(full-text Search) - 有哪些主流的JAVA全文檢索技術(shù)?
Lucene: Java 語(yǔ)言去全文檢索技術(shù)的底層實(shí)現(xiàn)(開山鼻祖)
Solr: 基于 Lucene, 簡(jiǎn)化開發(fā)疲扎,同時(shí)提升性能和擴(kuò)展性。也能通過 solrCloud 實(shí)現(xiàn)分布式搜索
ElasticSearch(ES): 基于 Lucene, 更傾向于實(shí)現(xiàn)實(shí)時(shí)搜索捷雕。 - 這些技術(shù)如何選擇椒丧?
清楚每個(gè)技術(shù)的特點(diǎn)及缺點(diǎn)。