Lucene搜索时都是搜索的索引库,并不搜索原文档。
在索引时,Lucene首先将文档内容进行分词,然后做成倒排索引,搜索是搜索该倒排索引。
建立索引时,可以针对每个字段(域)进行不同的索引设置,可设置是否分词?是否存储?以及使用到的分词器。此处设置的是否存储是指该字段(域)是否作为一个整体保留(不分词)。
例如:文档一:”巴西世界杯很好看!“
在索引时,如果是分词索引,则:
巴西/世界杯/很/好看
如果搜索世界杯,则文档一就会被搜索出来,在索引中保存的是巴西/世界杯/很/好看
这样的分词。
如果索引时除了分词之外还存储该字段(域),则:
巴西/世界杯/很/好看/巴西世界杯很好看
可以看出,索引中
将文档一的所有内容作为一个分词,搜索时必须输入整个字段内容才会搜索到
就想到这么多了,希望你能明白。