lucene针对一组数据创建了索引,该组数据中有个字段是id,索引创建后能否根据id将唯一的内容取回?

如何实现求指点。
2025-02-12 21:09:37
推荐回答(2个)
回答1:

只要ID是唯一的,在建立索引时对ID字段不要分词,查询是就可以根据ID来检索出来了。
建立索引时的例子:
Document doc = new Document();
doc.add(new Field("ID",“123456”,Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
........这里在增加这组数据里的其他字段
indexWriter.addDocument(doc);

搜索时的例子:

Term t11 = new Term("ID", "123456");
Query query11 = new TermQuery(t11);
TopDocs topDocs11 = searcher_tmp.search(query11, 1);
for (ScoreDoc scoreDoc11 : topDocs11.scoreDocs) {
int docNum11 = scoreDoc11.doc;
String id=searcher_tmp.doc(docNum11).get("ID");
String contents=searcher_tmp.doc(docNum11).get("contents");//假设contents是建立索引时除ID外的其他字段的名称
}

回答2:

建1个StoreField虽然可以达到目的。

但是根据Lucene的索引结构,storeField的data通常是大约14KB为1个chunk压缩存储的,

也就是说为了取到1个uid, 需要到fdt找到相应的chunk然后解码数据然后取出uid, 如果uid比较分散的话,可能每取1个数据就要访问1次磁盘,代价比较大。

至于如何优化,推荐下面1篇文章。

网页链接