使用lucene搜索会遇到什么难点?

2025-04-29 19:01:29
推荐回答(1个)
回答1:

一般来说,有两个问题会成为lucene项目的瓶颈:

  1. 分词. lucene自带了一些功能简单的分词器,也有一些开源的可用,但无论是mmseg,还是IK,在面对复杂的业务场景时都不能让人特别满意.很多公司都在做自己的分词器.

  2. 实时搜索.如何让新建的索引立刻被搜索到,让一个被删除的索引立即从消失在检索结果中.这是一个很严重的问题,尤其是在数据量超大的情况下.现有的方案中,只能尽可能的缩短时差,所以一般称之为近实时搜索而不是实时搜索.


以上两个问题,任何一个都可以被单独拿出来研究,进而扩展成一个很大的课题.