Lucene多字段查询高亮显示

2023-10-12 03:18

本文主要是介绍Lucene多字段查询高亮显示,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 在百度搜索的时候,查询的关键词会高亮显示
  • 在搜索一个关键词的时候,有可能这个关键词在title和content中,搜索的时候要把结果全部显示出来

实例说明

package com.bart.lucene.mutilseacher;import java.util.ArrayList;
import java.util.List;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.junit.Test;
import com.bart.lucene.entity.Article;
import com.bart.lucene.util.LuceneUtils;/*** Article多条件搜索加高亮显示* @author hp*/
public class ArticleDao {/*** 高亮显示* 查询索引库中所有的记录* @throws Exception */@Testpublic void findAll() throws Exception{String keyword = "显卡";List<Article>articleList = new ArrayList<Article>(); IndexSearcher indexSearcher = new  IndexSearcher(LuceneUtils.getDirectory());//默认之搜索一个字段,单条件搜索//QueryParser queryParser = new QueryParser(LuceneUtils.getVersion(),"content",LuceneUtils.getAnalyzer());//搜索多个字段,多条件搜索QueryParser queryParser2 = new MultiFieldQueryParser(LuceneUtils.getVersion(),new String[]{"title","content"},LuceneUtils.getAnalyzer());//Query query = queryParser.parse(keyword);Query query = queryParser2.parse(keyword);TopDocs topDocs = indexSearcher.search(query,100);//以下代码对查询结果进行高亮显示// 1.格式化对象,设置前缀和后缀Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>");// 2.关键词对象Scorer scorer = new QueryScorer(query);// 3. 高亮对象Highlighter highlighter = new Highlighter(formatter, scorer);for(int i=0;i<topDocs.scoreDocs.length;i++){ScoreDoc scoreDoc = topDocs.scoreDocs[i];int no = scoreDoc.doc;//关键词没有高亮Document document = indexSearcher.doc(no);// 1. 关键词添加高亮String titleHighLight  = highlighter.getBestFragment(LuceneUtils.getAnalyzer(),"title",document.get("title"));String contentHighLight  = highlighter.getBestFragment(LuceneUtils.getAnalyzer(),"content",document.get("content"));// 2. 将高亮的结果再次封装到document对象中document.getField("title").setValue(titleHighLight);document.getField("content").setValue(contentHighLight);Article article = LuceneUtils.document2JavaBean(document,Article.class);articleList.add(article);}//遍历for(Article a : articleList){System.out.println(a);}}/*** 增加document对象到对象索引库中* @throws Exception*/@Testpublic void testCreate() throws Exception{Article article = new Article(1,"显卡","显卡是电脑的核心部件",10);Document document = LuceneUtils.javaBean2Document(article);IndexWriter indexWriter = new IndexWriter(LuceneUtils.getDirectory(), LuceneUtils.getAnalyzer(), LuceneUtils.getMaxFieldLength());indexWriter.addDocument(document);//设置当插入三条记录的时候合并到同一条记录,默认是10个缓存就合并索引的cfs文件indexWriter.setMergeFactor(3);
//        //合并记录,不管插入多少条
//        indexWriter.optimize();indexWriter.close();}}

输出结果:
Article [id=1, title=, content=是电脑的核心部件, count=10]

这篇关于Lucene多字段查询高亮显示的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/192861

相关文章

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

安卓链接正常显示,ios#符被转义%23导致链接访问404

原因分析: url中含有特殊字符 中文未编码 都有可能导致URL转换失败,所以需要对url编码处理  如下: guard let allowUrl = webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时,会被误伤转义为%23,导致链接无法访问

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

ural 1026. Questions and Answers 查询

1026. Questions and Answers Time limit: 2.0 second Memory limit: 64 MB Background The database of the Pentagon contains a top-secret information. We don’t know what the information is — you

Mybatis中的like查询

<if test="templateName != null and templateName != ''">AND template_name LIKE CONCAT('%',#{templateName,jdbcType=VARCHAR},'%')</if>

lvgl8.3.6 控件垂直布局 label控件在image控件的下方显示

在使用 LVGL 8.3.6 创建一个垂直布局,其中 label 控件位于 image 控件下方,你可以使用 lv_obj_set_flex_flow 来设置布局为垂直,并确保 label 控件在 image 控件后添加。这里是如何步骤性地实现它的一个基本示例: 创建父容器:首先创建一个容器对象,该对象将作为布局的基础。设置容器为垂直布局:使用 lv_obj_set_flex_flow 设置容器

C# dateTimePicker 显示年月日,时分秒

dateTimePicker默认只显示日期,如果需要显示年月日,时分秒,只需要以下两步: 1.dateTimePicker1.Format = DateTimePickerFormat.Time 2.dateTimePicker1.CustomFormat = yyyy-MM-dd HH:mm:ss Tips:  a. dateTimePicker1.ShowUpDown = t

京东物流查询|开发者调用API接口实现

快递聚合查询的优势 1、高效整合多种快递信息。2、实时动态更新。3、自动化管理流程。 聚合国内外1500家快递公司的物流信息查询服务,使用API接口查询京东物流的便捷步骤,首先选择专业的数据平台的快递API接口:物流快递查询API接口-单号查询API - 探数数据 以下示例是参考的示例代码: import requestsurl = "http://api.tanshuapi.com/a

DAY16:什么是慢查询,导致的原因,优化方法 | undo log、redo log、binlog的用处 | MySQL有哪些锁

目录 什么是慢查询,导致的原因,优化方法 undo log、redo log、binlog的用处  MySQL有哪些锁   什么是慢查询,导致的原因,优化方法 数据库查询的执行时间超过指定的超时时间时,就被称为慢查询。 导致的原因: 查询语句比较复杂:查询涉及多个表,包含复杂的连接和子查询,可能导致执行时间较长。查询数据量大:当查询的数据量庞大时,即使查询本身并不复杂,也可能导致