一种针对自然语言文本的提示策略

2024-08-22 04:20

本文主要是介绍一种针对自然语言文本的提示策略,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章介绍了一种创新的提示策略,旨在利用大型语言模型从自然语言文本中提取业务流程相关信息,例如活动和参与者等,并建立它们之间的关系。通过这种方法,研究人员能够在无需大量数据的情况下实现高质量的信息提取,进而用于生成流程模型。这种策略在多个数据集上均能显著提升信息提取性能,相较于传统的机器学习和基于规则的方法,F1分数最高可提升8%。此外,该研究还分析了不同提示组件对提取质量的影响,并提供了一系列指导原则,有助于更有效地使用大型语言模型进行流程信息提取。
在这里插入图片描述

1 提示策略

提示策略旨在解决从文本描述中提取业务流程相关信息的挑战,特别是检测活动、参与者及其之间的关系。

(1)高阶提示结构:

提示被分为三个主要模块:上下文描述、任务描述和约束条件。

  • 上下文描述:这部分为任务设定了高层次框架,比如指明是在业务流程信息提取的背景下工作。

  • 任务描述:详细说明了具体的任务要求,例如定义了需要识别的实体类型(如活动和参与者)和关系类型。

  • 约束条件:进一步限制上下文和输出格式,并包含去模糊化的提示,帮助明确期望的结果形式。

(2)具体实现:

  • 角色设定:利用“角色设计模式”控制生成结果的语言风格,将角色设定为一个流程建模专家。

  • 任务细节:明确了需要检测的不同类型的提及,如活动和参与者,并且定义了这些提及的特征。

  • 关系类型:明确了不同实体之间的关系类型,这对于构建过程模型至关重要。

2 过程模型生成算法

**(1)提取过程信息:**使用LLMs提取过程信息:这一步骤涉及使用精心设计的提示来引导LLMs识别文本中的关键元素,如活动、参与者及它们之间的关系。为此,开发了一种包含三个模块的高级提示结构:

  • Context(上下文描述):为LLMs提供关于要处理文本的背景信息。

  • Task Description(任务描述):明确指出要完成的任务,比如检测提及的活动。

  • Restrictions(限制条件):提供具体的指导方针,以确保输出格式一致,便于自动化处理。

(2)算法设计:一旦从文本中提取出所需的过程信息,下一步就是将这些信息转换成一个过程模型。文中提到了一个概念验证的算法,但具体细节没有给出。这种算法可能基于提取到的数据,例如活动、参与者及其相互关系,来构建过程模型。

3 结语

本文提出了一种新颖的通用提示策略,用于利用大型语言模型从自然语言文本中高效提取业务流程信息,并将其用于生成流程模型,该策略在多种模型上均表现出优越性能。

论文题目: A Universal Prompting Strategy for Extracting Process Model Information from Natural Language Text using Large Language Models

论文链接: https://arxiv.org/abs/2407.18540

PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!
在这里插入图片描述

这篇关于一种针对自然语言文本的提示策略的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095221

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

在JS中的设计模式的单例模式、策略模式、代理模式、原型模式浅讲

1. 单例模式(Singleton Pattern) 确保一个类只有一个实例,并提供一个全局访问点。 示例代码: class Singleton {constructor() {if (Singleton.instance) {return Singleton.instance;}Singleton.instance = this;this.data = [];}addData(value)

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

jenkins 插件执行shell命令时,提示“Command not found”处理方法

首先提示找不到“Command not found,可能我们第一反应是查看目标机器是否已支持该命令,不过如果相信能找到这里来的朋友估计遇到的跟我一样,其实目标机器是没有问题的通过一些远程工具执行shell命令是可以执行。奇怪的就是通过jenkinsSSH插件无法执行,经一番折腾各种搜索发现是jenkins没有加载/etc/profile导致。 【解决办法】: 需要在jenkins调用shell脚

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

8. 自然语言处理中的深度学习:从词向量到BERT

引言 深度学习在自然语言处理(NLP)领域的应用极大地推动了语言理解和生成技术的发展。通过从词向量到预训练模型(如BERT)的演进,NLP技术在机器翻译、情感分析、问答系统等任务中取得了显著成果。本篇博文将探讨深度学习在NLP中的核心技术,包括词向量、序列模型(如RNN、LSTM),以及BERT等预训练模型的崛起及其实际应用。 1. 词向量的生成与应用 词向量(Word Embedding)

Level3 — PART 3 — 自然语言处理与文本分析

目录 自然语言处理概要 分词与词性标注 N-Gram 分词 分词及词性标注的难点 法则式分词法 全切分 FMM和BMM Bi-direction MM 优缺点 统计式分词法 N-Gram概率模型 HMM概率模型 词性标注(Part-of-Speech Tagging) HMM 文本挖掘概要 信息检索(Information Retrieval) 全文扫描 关键词

缓存策略使用总结

缓存是提高系统性能的最简单方法之一。相对而言,数据库(or NoSQL数据库)的速度比较慢,而速度却又是致胜的关键。 如果使用得当,缓存可以减少相应时间、减少数据库负载以及节省成本。本文罗列了几种缓存策略,选择正确的一种会有很大的不同。缓存策略取决于数据和数据访问模式。换句话说,数据是如何写和读的。例如: 系统是写多读少的吗?(例如基于时间的日志)数据是否是只写入一次并被读取多次?(例如用户配

Flink任务重启策略

概述 Flink支持不同的重启策略,以在故障发生时控制作业如何重启集群在启动时会伴随一个默认的重启策略,在没有定义具体重启策略时会使用该默认策略。如果在工作提交时指定了一个重启策略,该策略会覆盖集群的默认策略默认的重启策略可以通过 Flink 的配置文件 flink-conf.yaml 指定。配置参数 restart-strategy 定义了哪个策略被使用。常用的重启策略: 固定间隔 (Fixe

Java后端微服务架构下的API限流策略:Guava RateLimiter

Java后端微服务架构下的API限流策略:Guava RateLimiter 大家好,我是微赚淘客返利系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿! 在微服务架构中,API限流是保护服务不受过度使用和拒绝服务攻击的重要手段。Guava RateLimiter是Google开源的Java库中的一个组件,提供了简单易用的限流功能。 API限流概述 API限流通过控制请求的速率来防止