成语大全网 - 经典成语 - 请问一下Lucene对文档内容建立索引后是否将文档存储?

请问一下Lucene对文档内容建立索引后是否将文档存储?

Lucene搜索时都是搜索的索引库,并不搜索原文档。

在索引时,Lucene首先将文档内容进行分词,然后做成倒排索引,搜索是搜索该倒排索引。

建立索引时,可以针对每个字段(域)进行不同的索引设置,可设置是否分词?是否存储?以及使用到的分词器。此处设置的是否存储是指该字段(域)是否作为一个整体保留(不分词)。

例如:文档一:”巴西世界杯很好看!“

在索引时,如果是分词索引,则:

巴西/世界杯/很/好看

如果搜索世界杯,则文档一就会被搜索出来,在索引中保存的是巴西/世界杯/很/好看

这样的分词。

如果索引时除了分词之外还存储该字段(域),则:

巴西/世界杯/很/好看/巴西世界杯很好看

可以看出,索引中

将文档一的所有内容作为一个分词,搜索时必须输入整个字段内容才会搜索到

就想到这么多了,希望你能明白。