`
xinyangwjb
  • 浏览: 79898 次
  • 性别: Icon_minigender_1
  • 来自: 信阳
社区版块
存档分类
最新评论

关于lucene实时更新的纠结

 
阅读更多
仿百度文库这个小项目中,文档信息分别存入数据库和lucene
JavaBean:docInfoOracelTable:DOC_INFOcommentluceneIndex
docIdDOC_ID主键IDdocId
userIdUSER_ID用户IDuserId
logIdLOG_ID用户名logId
titleTITLE文档名title
summarySUMMARY文档简介,查询列表下的几行小字summary
mimeMIME文档后缀名mime
createTimeCREATE_TIME文档创建时间createTime
hitsHITS点击次数hits
文档内容context

其中hits更新很频繁,数据库可以承受,但是lucene的更新时删除原索引然后重新创建,这个频繁的更新并不是很好。
全文检索查询的只是lucene,并不去查数据库,lucene不更新,就无法做到实时。

最普通的做法:先更新索引,再更新数据库,这样能实时,但是显然还是很慢。特别是索引文件很大的时候。

用Job任务定时执行:索引文件的更新只能用线程定时根据条件触发更新。这样带来的问题是做不到实时。新增的数据用不到索引会很慢。

建立缓存:加一层缓存,数据结构根据业务定,hashmap也好,treemap也好,新增的数据放入缓存,等到缓存满一定容量的时候去触发线程更新索引文件。
查询的时候顺序是索引,缓存。先全文检索索引,再查缓存看有没有改变,然后将改变封装进来。
这样就不会因为索引的更新而影响效率了。
是不是很痛苦!
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics