1脚仔、全文檢索,倒排索引
全文檢索是指計(jì)算機(jī)索引程序通過(guò)掃描文章中的每一個(gè)詞舆绎,對(duì)每一個(gè)詞建立一個(gè)索引鲤脏,指明該詞在文章中出現(xiàn)的次數(shù)和位置,當(dāng)用戶查詢時(shí)吕朵,檢索程序就根據(jù)事先建立的索引進(jìn)行查找猎醇,并將查找的結(jié)果反饋給用戶的檢索方式。這個(gè)過(guò)程類似于通過(guò)字典中的檢索字表查字的過(guò)程努溃。全文搜索搜索引擎數(shù)據(jù)庫(kù)中的數(shù)據(jù)硫嘶。
2、Lucene
lucene梧税,就是一個(gè)jar包沦疾,里面包含了封裝好的各種建立倒排索引,以及進(jìn)行搜索的代碼第队,包括各種算法哮塞。我們就用java開(kāi)發(fā)的時(shí)候,引入lucene jar凳谦,然后基于lucene的api去進(jìn)行開(kāi)發(fā)就可以了忆畅。