联系上下文,自行划重点!这只“高情商”AI能读懂对话语境,让客服问答丝般顺滑

本文主要是介绍联系上下文,自行划重点!这只“高情商”AI能读懂对话语境,让客服问答丝般顺滑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
大数据文摘出品
作者:郑璇真

也许你也有过这样的经历,向智能客服咨询问题,却陷入毫无进展的对话里:

-你们家的面膜都是纯天然的?
-亲亲,我们家的面膜都是芦荟精华提取,纯天然的哦~
-我皮肤有点干,推荐一款呗~
-冬天皮肤干燥推荐给亲亲我们的保湿精华乳~
-我是要买面膜,你是机器人吧,让人来说话。

作为顾客,此时你大概要叹一句“人工智能真不智能”。这些所谓“智能”客服们往往只能做到一问一答,一旦对话涉及稍微复杂的情境,它们就开始答非所问。

让人工智能学会根据上下文去处理信息,是自然语言处理技术一个关键的门槛,也是多年来整个学术界和工业界都在努力攻克的难题。尽管在通用NLP领域,gpt-2,BERT等算法模型的出现,让语义理解取得了重大进展,但是由于专业性强、垂直语料库不足等原因,某些亟待落地的应用场景,例如高强度的客服对话,还深陷在开头出现的“人工智障”泥潭中。

最近,这个难题迎来了新进展。晓多科技(下称“晓多”)开发的基于上下文的语义识别项目,以深度学习的方式,让智能问答机器人能够像人类一样,结合语境去理解复杂场景下的对话,并且进行持续的自我学习,无需人工设置规则,也能不断扩展和覆盖更多的场景。

从一问一答到读懂语境

在这里插入图片描述

为什么人工智能会有这些“不智能”的表现?这是因为目前市面上主流的智能问答机器人,大部分都是根据单个句子来识别顾客的意图,从而进行一问一答的任务型对话。但在日常聊天对话中,我们习惯口语化表达,尤其在打字时,一般不会大段大段地发送,而会使用很多断句,这种零碎的表达使得机器人无法从单个句子中准确识别出你的真实意图,造成答非所问的情况。

这对于服务业来说是一个致命伤。

和普通的闲聊机器人不同,智能客服必须做到对各种场景的精准识别。因为智能客服面对的工作,是要及时地、明确地解决顾客的问题。

当你和闲聊机器人逗趣的时候,它答非所问的话并不会让你烦躁,反而觉得很有趣味;但当你只想赶紧退货或者得到赔偿时,智能客服的胡言乱语足够让烦躁的顾客给这家店铺打上0星,并在评论区洋洋洒洒好几百字,控诉店铺服务不到位。

在商品售前阶段也是这样,智能客服错误的回复或答非所问,都会影响顾客的体验度,平台商家竞争激烈的情况下,得不到满意答复的顾客可能会很快放弃,选择另外一家店铺,从而造成顾客的大量流失。

在这里插入图片描述
单句识别与上下文识别的差别

解决这一问题的关键,在于要让机器人像人一样,学会联系上下文,结合语境来对话,而不仅仅对单个句子作出反应。

目前市面上其他机器人都不支持上下文语义,他们是在靠规则和流程设置关键词。也就是说,这个情景中需要什么信息,就要设计出对应的问题,让机器人按照固定的顺序提问,顾客按照要求回答完所有问题,机器人才能根据所有信息来进行回应。

例如,顾客要购买飞机票,就要设定机器人首先询问顾客起点、终点、时间,再问顾客想要什么等级的座位等等,通过这些固定问题的答案,把需要的信息补充完整,最终给出推荐。

在这种情况下,每一个场景都需要人工去设定对应的规则,效率十分低下。尤其在电商领域,从售前到售中,再到售后,涉及到的问题是方方面面的,更别说还有购物品类的区别,场景的扩展是指数级的,靠人工设定规则去做到全覆盖,说是天方夜谭也不为过。

如果能够将目前人工智能领域大热的深度学习应用到这一问题的解决上,让机器人能够通过自己学习,掌握基于上下文的语义理解,并持续学习扩展到各个场景中,就可以大大地提高智能机器人面对复杂场景的精准应对能力,同时提高它覆盖各种场景的效率。怀着这样的想法,晓多开始了上下文语义项目。

让机器人自己“划重点”:记住重要信息,忘记不重要的

在这里插入图片描述
机器人自己学会理解上下文,困难在哪里?晓多算法工程师、本次上下文语义项目的负责人张翀向大数据文摘介绍,最关键的问题在于要让机器人像人一样记得上文的重要信息,并且知道这些信息和当前问句的关联。

在这个问题上,目前学术界和业界并没有现成的解决方案。对此,张翀介绍,晓多为新一代问答机器人创新设计了一个深度学习模型,包含四个模块:记忆与遗忘、提炼、融合、输出。

记忆与遗忘模块赋予机器人记住上文关键信息的能力。没有记忆能力的机器人,只会对最近的一句话作出反应,而晓多的模型可以帮助机器人把前后的诉求关联起来,及时作出准确的推荐。

在这里插入图片描述

在技术上,晓多做出了一个此前业界还没有实现过的创新应用,参照一个名叫长短期记忆网络(LSTM)的结构,设计实现会话级别的记忆和遗忘。

晓多的又一创新,是应用于提炼模块的注意力机制。它会自动对上文的每一条信息进行计算,算出这些信息与当前句子对应的重要程度,重要程度高的,就会被保留下来。

假如顾客得到了满意的产品推荐之后,又提出“什么时候发货”的问题,注意力机制通过计算,就会发现上文的重要程度并不高,这样,无用的信息就会被过滤,与当前对话有关联的上文信息被选取出来,进入下一个模块中。

在融合模块中,机器人会对提炼出的上文关键信息和当前聊天消息结合,来识别顾客的意图。晓多采用的方式是在向量空间做梳理,简单来说,可以理解为提取上文关键信息是在机器人大脑内部的一个操作,这之后,再在一个抽象的空间里,把提取出来的关键信息与当前的单句进行综合,最终输出一个结合上文信息和当前单句所做出的判断。

这个模型在实验中得到的数据令人惊喜。晓多从真实电商聊天⽇志中抽取了若⼲涉及上下⽂的问答样本,构造两份意图识别测试集,分别对应两个电商领域,对⽐发现结合上下⽂预测的模型效果远超只根据单句预测的模型:

在这里插入图片描述
recall(召回率)=机器人正确识别的问题数/问题总数
Precision(精确率)=机器人正确识别的问题数/机器人已识别的问题数
f1core=2precisionrecall/(precision + recall) ,表示综合考虑召回率和精确率的评分

这些工作并不是想到就可以做到的,对机器人的训练需要大量的数据,迁移学习能力是晓多能够实现这些创新的关键。

“人工智能的深度学习,突出的特点就是对数据的依赖非常大,”张翀说,“因为深度学习模型的参数非常多,你可以理解为它是一个更复杂的智能体,数据是它学习的依据,它要学习的东西越多,需要的数据就更多,而你给它的数据越多,它也越聪明。”

目前,晓多的标注团队从上百亿的数据中进行分析提取的价值样本,提供给机器学习进行数据训练。

如果每一步都需要人工设计,从发现场景、总结规律,到最后开发、测试、上线,可能需要至少两周的时间才能扩展一个场景,张翀介绍说,而使用这样的数据标注让机器进行深度学习,只需要几天的时间,就可以同时扩展几十个场景、几百个产品。

各个行业的电商客服需要应对的场景虽然有很多差异,但有一些数据却是通用的,包括关于快递物流的问答等。晓多对标注好的数据进行了模块拆分,区分出通用数据,当机器人需要对新行业进行学习时,可以直接使用这些标注好的通用数据,实现迅速的扩展学习。

谈到数据、算法和计算能力的关系,张翀认为,数据是基础,大数据为机器学习装上引擎;算法是核心,将人工智能带到全新高度;而计算能力是保障,为算法的实现提供坚实的后盾。

不止于此,顾客体验迎来后智能化时代

在这里插入图片描述

从售前的商品导购,到售中咨询运费、活动赠品等,目前,晓多的上下文语义项目已经投入使用,覆盖了多种电商服务场景。这仅仅只是这项技术投入应用的第一步,晓多的业务计划中,还涉及到更多的业务铺开。

在售前,顾客可能会要求客服进行商品推荐,他们的需求点信息包含在整个对话过程中。传统的客服机器人只能根据顾客最后的需求进行推荐,而晓多机器人会对顾客的会话信息进行分析,更加准确地识别到顾客的真实需求,推荐给顾客符合心意的产品。

在这里插入图片描述

另外,对于电商行业中热门的服装领域来说,售前的服装尺码推荐是客服经常会遇到的问题,店铺内大量商品的尺码各不相同,尺码问题会耗费客服大量的人力。通过上下文识别的手段,客服机器人可以获取顾客的尺码信息,准确地进行尺码推荐。

在这里插入图片描述

在销售过程中,顾客常常要询问运费问题,这就涉及到了首次购买和退换货两种场景。没有上文语境,机器人就只能解读出“运费”,而不能准确地判断顾客询问的是首次购物运费还是退换货运费,可能导致错误的回复。而在加入了上下文理解后,机器人能够准确判断顾客的实际问题,准确地回复此类问题。

在这里插入图片描述

另一个常见的售中场景是关于活动赠品的问题。当店铺进行活动优惠提供赠品时,顾客的提问可能不是针对商品,而是针对赠品,需要机器人通过语境来识别,防止混淆这两个方面的提问,给出张冠李戴的答案。

这项技术不但可以应用在智能对话上,智能营销、智能质检、情绪识别……客服行业中还存在着更多未被开发的可能性。

对于晓多来说,这意味着他们为顾客提供的服务,向超专家级更进了一步。“我们现在可能只是把它应用在语义识别上,但后续我们在其它业务线上还可以继续铺开。我们把它当成一个基础的能力,一个支撑我们整个公司的算法产品。”张翀说。

晓多也期待着,上下文语义识别可以作为技术基石应用到行业各个方面,通过推开这项技术的应用,机器人可以自动生成尺码表,自动获取个性化对话内容进行系统自动萃取对接等等,机器人行业一直以来由人工配置的时代可能走向终结,而迎来一个从数据中学习后智能化自动生成的时代。

这篇关于联系上下文,自行划重点!这只“高情商”AI能读懂对话语境,让客服问答丝般顺滑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/842032

相关文章

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti