Elasticsearch：虚拟形象辅助和对话驱动的语音到 RAG 搜索

本文主要是介绍Elasticsearch：虚拟形象辅助和对话驱动的语音到 RAG 搜索，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

作者：来自 Elastic Sunile Manjee

搜索的演变

搜索已经从产生简单结果的简单文本查询发展成为容纳文本、图像、视频和问题等各种格式的复杂系统。

如今的搜索结果通过生成式人工智能、机器学习和交互式聊天功能得到增强，提供更丰富、更动态且与上下文相关的用户体验。不久前的搜索由文本查询和相关结果组成。

与你的数据对话，这是自然的

在对话支撑每一次互动的领域中，无论是与人类还是机器人，我们的搜索体验难道不应该反映这一基本方面吗？想象一下企业内存在大量的公司文档。自然地，这种环境会激发好奇心和大量问题，从而引发后续询问。这种与生俱来的人类特质驱使我们寻求答案，根据最初的反应进行更深入的研究，并不断探索。然而，传统的问答机制存在缺陷，因为它们经常忽视先前交流的背景，导致整个过程脱节且费力，感觉不自然，并促使用户过早退出。

超越问答

考虑使用电视搜索内容的行为，例如搜索尼古拉斯·凯奇主演的动作电影。虽然大多数当前系统都能熟练地提供相关结果，但查询很少就此结束。后续的问题，例如询问这些电影的运行时间或上映日期，是我们寻求信息的自然过程。然而，标准搜索应用程序并不是为了促进持续对话而设计的；它们是围绕孤立的问答格式构建的，这限制了交互和探索的深度。

与虚拟形象对话

这就是虚拟形象辅助搜索体验的概念发挥作用的地方，特别是在用户（包括我自己）更喜欢直接答案而无需筛选信息的情况下。有时，我们希望能够方便地获得答案，而无需费力阅读内容。开发用于生成响应的化身可以进一步使这种交互现代化，提供更具吸引力、更高效和更自然的用户体验。

Live Demo

在 Elasticsearch 中使用向量搜索驱动的机器学习动态分面

整合详情

语音转搜索

高级搜索体验始于用户语音交互，这些交互通过 Azure Speech to Text 转换为文本，形成搜索查询的基础。然后，使用 ELSER 通过 Elasticsearch 处理该查询，以检索相关文档，例如列出 “action movies featuring Nicolas Cage - 尼古拉斯·凯奇主演的动作电影” 的电视指南。这确保了搜索结果的准确性和相关性。

RAG 和缓存

在增强的搜索框架中，仅仅获取文档是不够的。 Azure OpenAI 的 GPT-4 将原始数据提炼为可理解的响应，确保对话流程顺畅。此外，Elasticsearch 作为 GenAI 缓存层提高了效率，回收相关查询的答案，从而节省资源。例如，如果有 “action movies featuring Nicolas Cage - 尼古拉斯·凯奇主演的动作电影” 的缓存响应，缓存 API 将迅速将其用于 “Nicolas Cage high-intensity movies - 尼古拉斯·凯奇高强度电影” 等类似问题，从而加速搜索体验。