以报时机器人为例详细介绍tracker_store和event_broker

2024-01-08 03:44

本文主要是介绍以报时机器人为例详细介绍tracker_store和event_broker,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  报时机器人源码参考[1][2],本文重点介绍当 tracker_store 类型为 SQL 时,events 表的表结构以及数据是如何生成的。以及当 event_broker 类型为 SQL 时,events 表的表结构以及数据是如何生成的。

一.报时机器人启动 [3]

  Rasa 对话系统启动方式详见参考文献[3]中执行程序部分,这里不再赘述。如下所示:

1.加载模型:rasa run --cors "*"

2.运行 action server:rasa run actions

3.运行 Web 页面:python -m http.server 8080


二.(tracker_store)endpoints.yml 和 events 表结构

  使用 mysql 数据库来存储对话,使用 MySQL 新建 db 为 rasa_tracker_store,其中字符集和排序规则分别为 utf8mb4 – UTF-8 Unicode 和 utf8mb4_0900_ai_ci。

1.endpoints.yml 配置文件

tracker_store:type: SQLdialect: "mysql+pymysql"url: "localhost"  # your mysql hostdb: "rasa_tracker_store"  # name of the mysql databaseusername: "root"  # username to access the databasepassword: "root"  # password to access the database

2.新建数据库 rasa_tracker_store

3.events 表结构

(1)id:主键 id

(2)sender_id:发送者 id

(3)type_name:event 的类型名字

(4)timestamp:时间戳

(5)intent_name:意图名字

(6)action_name:action 名字

(7)data:数据

4.events 表数据内容

  以用户问:“今天星期几”,机器答:"星期三"为例子展开介绍。

  生成的 rasa_tracker_store.events 数据表内容,如下所示:

(1)id:主键 id。

  这个自增主键就不用多说了。

(2)sender_id:发送者 id。

  比如,oCMNVZ44YCbHIcFYAAAB。这个数据是如何来的?生成的规则是什么呢?

sender_id 是在 SQLTrackerStore 类中的 SQLEvent 子类中初始化的。SQLEvent 子类是 SQLAlchemy 的一部分,用于在数据库中创建一个表。在这个表中,sender_id 是一个字段,它的类型是字符串(最大长度为 255),并且它被设置为非空(nullable=False),并且为其创建了索引(index=True)。这意味着在数据库中,sender_id 字段不能为 null,并且可以被快速查找。

  sender_id 是在创建 DialogueStateTracker 对象时传入的一个参数,它通常用于标识对话的发送者。在 Rasa 中,每个对话都有一个唯一的 sender_id,这样可以区分不同的用户会话。在 from_events 类方法中,sender_id 是作为第一个参数传入的。这个方法用于从一系列事件中创建一个 DialogueStateTracker 对象。这些事件会被应用到新的跟踪器上,以重建其状态。生成 sender_id 的具体规则取决于你的应用,当客户端是 Rasa Shell、Rasa X、HTTP API 等的时候,都不相同。由于本次使用的是 Socket 方式,可以顺藤摸瓜去找 sender_id 的具体生成规则,这里不再细节展开。rasa/core/channels/socketio.py 如下所示:

(3)type_name:event 的类型名字。

  比如,action、session_started、user、slot、user_featurization、bot。这个数据是什么?除了这个数据还有其它的类型名字吗?(列出全部)。rasa/shared/core/events.py 如下所示:

序号事件类事件类型名字备注
1Event(ABC)类“event”描述对话中的事件以及它们如何影响对话状态。用户与助手进行对话期间发生的所有事情的不可变表示。告诉 rasa.shared.core.trackers.DialogueStateTracker 如何在事件发生时更新其状态。
2UserUttered(Event)“user”用户对机器人说了些什么。作为副作用,将在 Tracker 中创建一个新的 Turn
3DefinePrevUserUtteredFeaturization(SkipEventInMDStoryMixin)“user_featurization”存储 action 是基于文本还是意图预测的信息。
4EntitiesAdded(SkipEventInMDStoryMixin)“entities”用于将提取的实体添加到 tracker 状态的事件。
5BotUttered(SkipEventInMDStoryMixin)“bot”机器人对用户说了些什么。此类在故事训练中不使用,因为它包含在 ActionExecuted 类中。在 Tracker 中进行了记录。
6SlotSet(Event)“slot”用户已指定其对 slot 值的偏好。每个 slot 都有一个名称和一个值。此事件可用于在对话中设置 slot 的值。作为副作用,Tracker 的插槽将被更新,以便 tracker.slots[key]=value。
7Restarted(AlwaysEqualEventMixin)“restart”对话应该重新开始,历史记录被擦除。与删除所有事件不同,可以使用此事件来重置跟踪器状态(例如,忽略任何过去的用户消息并重置所有插槽)。
8UserUtteranceReverted(AlwaysEqualEventMixin)“rewind”机器人会撤消最近的用户消息之前的所有内容。机器人将撤消最新的 UserUttered 之后的所有事件,这也意味着跟踪器上的最后一个事件通常是 action_listen,机器人正在等待新的用户消息。
9AllSlotsReset(AlwaysEqualEventMixin)“reset_slots”所有插槽都重置为其初始值。如果要保留对话历史记录并仅重置插槽,则可以使用此事件将所有插槽设置为其初始值。
10ReminderScheduled(Event)“reminder”在给定时间安排异步触发用户意图。如果需要,触发的意图可以包括实体。
11ReminderCancelled(Event)“cancel_reminder”取消某些工作。
12ActionReverted(AlwaysEqualEventMixin)“undo”机器人撤消了最后的操作。机器人会撤消最近的操作之前的所有内容。这包括操作本身以及操作创建的任何事件,例如设置插槽事件-机器人现在将使用最近操作之前的状态来预测新操作。
13StoryExported(Event)“export”故事应该转储到文件。
14FollowupAction(Event)“followup”排队后续操作。
15ConversationPaused(AlwaysEqualEventMixin)“pause”忽略用户的消息,让人类接管。作为副作用,Tracker 的 paused 属性将被设置为 True
16ConversationResumed(AlwaysEqualEventMixin)“resume”机器人接管对话。PauseConversation 的反义词。作为副作用,Tracker 的 paused 属性将被设置为 False
17ActionExecuted(Event)“action”操作描述了执行的操作 + 其结果。它包括一个操作和一个事件列表。操作将附加到 Tracker.turns 中的最新 Turn
18AgentUttered(SkipEventInMDStoryMixin)“agent”agent 对用户说了些什么。由于它包含在 ActionExecuted 类中,因此此类在故事训练中不使用。在 Tracker 中进行了条目。
19ActiveLoop(Event)“active_loop”如果给出了 name:使用 name 激活循环,否则停用活动循环。
20LegacyForm(ActiveLoop)“form”Form 事件的旧版处理程序。ActiveLoop 事件曾被称为 Form。这个类是为了处理旧的遗留事件,这些事件是使用旧的类型名称 form 存储的。
21LoopInterrupted(SkipEventInMDStoryMixin)“loop_interrupted”FormPolicy 和 RulePolicy 添加的事件。通知表单操作是否验证用户输入。
22LegacyFormValidation(LoopInterrupted)“form_validation”FormValidation 事件的旧版处理程序。LoopInterrupted 事件曾被称为 FormValidation。这个类是为了处理旧的遗留事件,这些事件是使用旧的类型名称 form_validation 存储的。
23ActionExecutionRejected(SkipEventInMDStoryMixin)“action_execution_rejected”通知 Core 操作的执行已被拒绝。
24SessionStarted(AlwaysEqualEventMixin)“session_started”标记新会话会话的开始。

(4)timestamp:Unix 时间戳。

  比如,1704300000,转换后的日期时间:2024-01-03 16:40:00。Unix 时间戳是指从 1970 年 1 月 1 日 00:00:00UTC(协调世界时)开始的秒数。

from datetime import datetimetimestamp = 1704300000
date_object = datetime.utcfromtimestamp(timestamp)print("转换后的日期时间:", date_object)

(5)intent_name:意图名字

  比如,query_weekday。报时机器人总共的意图包括 greet、goodbye、query_time、query_date、query_weekday。对应的例子如下所示:

version: "3.0"
nlu:- intent: greetexamples: |- 你好- 您好- hello- hi- 喂- 在么- intent: goodbyeexamples: |- 拜拜- 再见- 拜- 退出- 结束- intent: query_timeexamples: |- 现在几点了- 什么时候了- 几点了- 现在什么时候了- 现在的时间- intent: query_dateexamples: |- [今天](date)几号- [今天](date)是几号- [昨天](date)几号- [明天](date)几号- [今天](date)的日期- [今天](date)几号了- [明天](date)的日期- 几号- intent: query_weekdayexamples: |- [今天](date)星期几- [明天](date)星期几- [昨天](date)星期几- [今天](date)是星期几- 星期几

(6)action_name:action 名字

  比如,action_session_start(会话开始)、action_listen(机器人处于监听状态,机器人每次回答完毕后都会处于监听状态)、date(日期实体)、action_query_weekday(自定义 action)。除此之外,还有哪些 action_name 呢?(列出全部)。rasa/core/actions/action.py 如下所示:

序号动作类动作名字备注
1ActionNotImplementedError响应对话状态的下一个操作。
2ActionBotResponse(Action)——一个动作,其唯一效果是在运行时发出响应。
3ActionEndToEndResponse(Action)——动作以端到端响应向用户发出响应。
4ActionRetrieveResponse(ActionBotResponse)——查询响应选择器以获取适当的响应的操作。
5ActionBack(ActionBotResponse)“action_back”将跟踪器状态恢复两个用户话语。
6ActionListen(Action)“action_listen”任何回合中的第一个动作-机器人等待用户消息。机器人应停止采取进一步的操作,并等待用户说些什么。
7ActionRestart(ActionBotResponse)“action_restart”将跟踪器重置为其初始状态。如果可用,则发出重启响应。
8ActionSessionStart(Action)“action_session_start”应用一个对话会话开始,将上一个会话中的所有 SlotSet 事件应用于新会话。
9ActionDefaultFallback(ActionBotResponse)“action_default_fallback”执行回退操作并返回对话的上一个状态。
10ActionDeactivateLoop(Action)“action_deactivate_loop”停用活动循环。
11RemoteAction(Action)————
12ActionRevertFallbackEvents(Action)“action_revert_fallback_events”撤消 TwoStageFallbackPolicy 期间完成的事件。这将撤消在 TwoStageFallbackPolicy 的回退期间完成的用户消息和机器人话语。通过这样做,不需要为不同的路径编写自定义故事,而只需要编写快乐的路径。这已被弃用,一旦删除 TwoStageFallbackPolicy,就可以删除它。
13ActionUnlikelyIntent(Action)“action_unlikely_intent”一个动作,指示 NLU 预测的意图是意外的。此操作可以由 UnexpecTEDIntentPolicy 预测。
14ActionDefaultAskAffirmation(Action)“action_default_ask_affirmation”默认实现,询问用户确认他的意图。建议使用自定义操作覆盖此默认操作,以获得更有意义的确认提示。例如。具有意图的描述而不是其标识符名称。
15ActionDefaultAskRephrase(ActionBotResponse)“action_default_ask_rephrase”默认实现,询问用户重新表达他的意图。
16ActionSendText(Action)“action_send_text”向输出通道发送文本消息。
17ActionExtractSlots(Action)“action_extract_slots”每个用户回合后自动运行的默认操作。在下一个预测的操作运行之前,在 MessageProcessor.handle_message(…)中自动执行操作。根据分配的槽映射将插槽设置为从用户消息中提取的值。
18ACTION_TWO_STAGE_FALLBACK_NAME“action_two_stage_fallback”——
19ACTION_VALIDATE_SLOT_MAPPINGS“action_validate_slot_mappings”——
20RULE_SNIPPET_ACTION_NAME“…”——

(7)data:数据

  取出一条 data 数据字段进行 json 显示,如下所示:

{"event": "action","timestamp": 1704297163.3703225,"metadata": {"model_id": "4ca8c86f1301497f9488c47c860f39fd","assistant_id": "20240103-232935-excited-category"},"name": "action_session_start","policy": null,"confidence": 1.0,"action_text": null,"hide_rule_turn": false
}
  • event:事件的名字。(列出全部)
  • timestamp:时间戳。
  • metadata-model_id:模型 id。这个并不是模型的名字,比如训练的报时机器人模型为 20240103-233232-windy-borzoi.tar.gz
  • metadata-assistant_id:这个是 config.yml 文件中定义的 assistant_id: 20240103-232935-excited-category
  • name:action 的名字。
  • policy:使用的策略。
  • confidence:置信度。
  • action_text:动作文本,即端到端机器人响应的文本。
  • hide_rule_turn:是否隐藏规则回合。

  上述字段大都来自于 ACTION_EXECUTED(rasa/shared/utils/schemas/events.py),ACTION_EXECUTED 是一个字典,它定义了 Rasa 中 “action” 事件的 JSON schema。这个 schema 描述了 “action” 事件的数据结构,包括它的属性和这些属性的类型。如下所示:

ACTION_EXECUTED = {"properties": {"event": {"const": "action"},"policy": {"type": ["string", "null"]},"confidence": {"type": ["number", "null"]},"name": {"type": ["string", "null"]},"hide_rule_turn": {"type": "boolean"},"action_text": {"type": ["string", "null"]},}
}

  在 ACTION_EXECUTED schema 中,相关属性解释如下所示:

  • event: 这是一个常量,值为 “action”,表示这是一个 “action” 事件。
  • policy: 这是一个字符串,表示执行这个动作的策略的名称。它也可以为 null。
  • confidence: 这是一个数字,表示执行这个动作的策略的置信度。它也可以为 null。
  • name: 这是一个字符串,表示执行的动作的名称。它也可以为 null。
  • hide_rule_turn: 这是一个布尔值,表示是否隐藏规则回合。
  • action_text: 这是一个字符串,表示动作的文本。它也可以为 null。

  这个 schema 用于验证 “action” 事件的数据是否符合预期的格式。如果一个 “action” 事件的数据不符合这个 schema,那么在处理这个事件时,Rasa 将会抛出一个错误。

5.action 和 event 间的关系

  在 Rasa 中,动作(action)和事件(event)是两个不同但相关的概念。如下所示:

(1)action

  动作是在对话中执行的一些操作,例如向用户发送消息、调用外部服务、或者进行自定义的计算。在 Rasa 中,动作通常与对话策略相关联,用于决定在特定的对话状态下应该执行哪个动作。动作由自定义的动作类或内置的动作类实现,它们被定义为继承自 Action 类。

(2)event

  事件是对话中的状态更改的表示,例如用户的输入、机器人的响应、槽位的更新等。在 Rasa 中,对话的历史记录是一系列事件的集合。事件被用于跟踪对话的状态,对话管理器使用事件来更新对话状态。不同的事件类型表示不同的对话动作和状态变化。

(3)两者关系

  • 当动作执行时,通常会生成一个或多个事件,这些事件描述了对话状态的变化。
  • 每个对话轮次中都会有一系列事件,包括用户的输入事件(例如 UserUttered)、动作执行事件(例如 ActionExecuted)、槽位更新事件(例如 SlotSet)、机器人响应事件(例如 BotUttered)等。

  在对话中,动作和事件密切相互关联。动作执行时会触发事件,这些事件进而影响对话状态的演进。一般来说,对话的历史记录中的事件序列描述了对话的全貌,对话管理器利用这些事件来进行决策。

三.(event_broker)endpoints.yml 和 events 表结构

1.endpoints.yml 配置文件

  使用 mysql 数据库来消息队列,如下所示:

event_broker:type: SQLurl: "localhost"port: 3306dialect: "mysql+pymysql"username: "root"password: "root"db: "rasa_event_broker"

2.新建数据库 rasa_tracker_store

  创建数据库方式与 rasa_tracker_store 相同,这里不再赘述。

3.events 表结构

  生成的 rasa_event_broker.events 数据表内容,如下所示:

(1)id:主键 id

(2)sender_id:发送者 id

(3)data:数据

4.events 表数据内容

  取出一条 data 数据字段进行 json 显示,如下所示:

{"sender_id": "oCMNVZ44YCbHIcFYAAAB","event": "action","timestamp": 1704297163.3703225,"metadata": {"model_id": "4ca8c86f1301497f9488c47c860f39fd","assistant_id": "20240103-232935-excited-category"},"name": "action_session_start","policy": null,"confidence": 1.0,"action_text": null,"hide_rule_turn": false
}

  发现 event_broker.events.data 和 tracker_store.events.data 相比,除了多一个 sender_id 字段,其它的都是一样的。跟踪源码发现,如下所示:

  执行顺序是先发布新的 tracker 事件集合到 event_broker,然后逐一遍历 event,并将其存储到 tracker_store.event 表中。

四.EventBroker 类和 SQLEventBroker(EventBroker)类

1.EventBroker 类

2.SQLEventBroker(EventBroker)类

  SQLEventBroker(EventBroker)类有个内部类 SQLBrokerEvent(Base),定义了 events 的 3 个字段,分别为 id、sender_id 和 data。剩下的基本是对 EventBroker 基类中方法的具体实现。rasa/core/brokers/sql.py 如下所示:



五.TrackerStore 类和 SQLTrackerStore 类

1.TrackerStore 类

  表示所有 TrackerStore 的公共行为和接口,如下所示:

2.SQLTrackerStore 类

  对 TrackerStore 基类的实现,包括 InMemoryTrackerStore、RedisTrackerStore、DynamoTrackerStore、MongoTrackerStore、SQLTrackerStore。SQLTrackerStore(TrackerStore, SerializedTrackerAsText)类有个内部类 SQLEvent(Base),定义了 events 的 7 个字段,分别为 id、sender_id、type_name、timestamp、intent_name、action_name 和 data。剩下的基本是对 TrackerStore 基类中方法的具体实现。rasa/core/tracker_store.py 如下所示:



参考文献

[1] rasa-v2024010701(报时机器人)源码:https://github.com/ai408/nlp-engineering/tree/main/知识工程-对话系统/公众号代码/rasa-v2024010701

[2] 报时机器人的 rasa shell 执行流程分析:https://z0yrmerhgi8.feishu.cn/wiki/CvASwk5SmiYkCXkqONycSxVfnJg

[3] 打通 Rasa Action Server 和 LLM 接口的尝试方法:https://z0yrmerhgi8.feishu.cn/wiki/UQa0wQBeJi6K7oknz2wcaSTnnNb

[4] 以报时机器人为例详细介绍tracker_store和event_broker:https://z0yrmerhgi8.feishu.cn/wiki/SQSGwzYR7iKSNukQDKicz1Vqnvg

这篇关于以报时机器人为例详细介绍tracker_store和event_broker的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/582218

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

VMware9.0详细安装

双击VMware-workstation-full-9.0.0-812388.exe文件: 直接点Next; 这里,我选择了Typical(标准安装)。 因为服务器上只要C盘,所以我选择安装在C盘下的vmware文件夹下面,然后点击Next; 这里我把√取消了,每次启动不检查更新。然后Next; 点击Next; 创建快捷方式等,点击Next; 继续Cont

20.Spring5注解介绍

1.配置组件 Configure Components 注解名称说明@Configuration把一个类作为一个loC容 器 ,它的某个方法头上如果注册7@Bean , 就会作为这个Spring容器中的Bean@ComponentScan在配置类上添加@ComponentScan注解。该注解默认会扫描该类所在的包下所有的配置类,相当于之前的 <context:component-scan>@Sc

(超详细)YOLOV7改进-Soft-NMS(支持多种IoU变种选择)

1.在until/general.py文件最后加上下面代码 2.在general.py里面找到这代码,修改这两个地方 3.之后直接运行即可

Java注解详细总结

什么是注解?         Java注解是代码中的特殊标记,比如@Override、@Test等,作用是:让其他程序根据注解信息决定怎么执行该程序。         注解不光可以用在方法上,还可以用在类上、变量上、构造器上等位置。 自定义注解  现在我们自定义一个MyTest注解 public @interface MyTest{String aaa();boolean bbb()

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述。以下是从不同角度对气象站的种类和应用范围的介绍: 一、气象站的种类 根据用途和安装环境分类: 农业气象站:专为农业生产服务,监测土壤温度、湿度等参数,为农业生产提供科学依据。交通气象站:用于公路、铁路、机场等交通场所的气象监测,提供实时气象数据以支持交通运营和调度。林业气象站:监测林区风速、湿度、温度等气象要素,为林区保护和

基于Java医院药品交易系统详细设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W+,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码+数据库🌟 感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人  Java精品实战案例《600套》 2023-2025年最值得选择的Java毕业设计选题大全:1000个热

青龙面板2.9之Cdle傻妞机器人编译教程

看到有的朋友对傻妞机器人感兴趣,这里写一下傻妞机器人的编译教程。 第一步,这里以linux amd64为例,去官网下载安装go语言安装包: 第二步,输入下方指令 cd /usr/local && wget https://golang.google.cn/dl/go1.16.7.linux-amd64.tar.gz -O go1.16.7.linux-amd64.tar.gz

XMG 重写- (UIView *)hitTest:(CGPoint)point withEvent:(UIEvent *)event方法

//重写这个方法,来完成一些指定的事件。比如说按钮被遮到下面了,但是我想让点击到这块区域的时候让按钮去相应点击 - (UIView *)hitTest:(CGPoint)point withEvent:(UIEvent *)event {     // 当前坐标系上的点转换到按钮上的点     CGPoint btnP = [self convertPoint:point toVi

C++标准模板库STL介绍

STL的六大组成部分 STL(Standard Template Library)是 C++ 标准库中的一个重要组成部分,提供了丰富的通用数据结构和算法,使得 C++ 编程变得更加高效和方便。STL 包括了 6 大类组件,分别是算法(Algorithm)、容器(Container)、空间分配器(Allocator)、迭代器(Iterator)、函数对象(Functor)、适配器(Adapter)