【论文阅读】【基于方面的情感分析】Modelling Context and Syntactical Features for Aspect-based Sentiment Analysis

本文主要是介绍【论文阅读】【基于方面的情感分析】Modelling Context and Syntactical Features for Aspect-based Sentiment Analysis,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • Modelling Context and Syntactical Features for Aspect-based Sentiment Analysis
    • 一、该论文关注的是解决ABSA问题的哪个方面?驱动是什么?具体目标是解决什么问题?
    • 二、该论文采用的方法是什么,方法的核心原理是什么?
    • 三、该方法是如何提出的,是开创性的方法还是对已有方法进行的改进,创新点是什么?
    • 四、该论文展示的结果如何?使用的是什么数据集?
    • 五、该论文是否提出还有需要改进的地方,即future work?
    • 六、该论文的实际应用点在于什么?

Modelling Context and Syntactical Features for Aspect-based Sentiment Analysis

一、该论文关注的是解决ABSA问题的哪个方面?驱动是什么?具体目标是解决什么问题?

方面:统一两个子任务的架构+改进模型(将句法信息集成到上下文嵌入模型中)

驱动
①基于方面的情感分析(ABSA)包括两个概念任务,即AE(aspect extraction)和AOE(Aspect-oriented Opinion Extraction)。然而,报告的大多数工作只关注于这两个子任务中的一个,最近有研究试图开发一种综合解决方案,通过统一标记方案将两个子任务制定为单个序列标记,从而同时解决这两个任务,但是这种解决方式会带来开销和复杂度。

③NLU的最新进展引入了上下文嵌入语言模型(contextualized language models),即OpenAI GPT 、BERT和RoBERTa。这些模型可以捕捉单词使用的特征,并考虑单词出现的不同文本上下文。但是很明显,他们无法确定多字方面的边界。例如,提取器将“食品质量”的多词表达分解为“质量”和“食物”。这篇论文认为这一缺陷是由于上下文化嵌入无法编码丰富的语法信息造成的,之前的ABSA研究中没有充分利用句法信息。

具体目标
①构建一个端到端的ABSA解决方案,而不是单独考虑任务【端到端的ABSA:即输入一个上下文有关联的句子S,端到端的ABSA旨在提取由m个方面词组成的序列A,输出每一个方面词的情感极性。】
②将句法信息集成到上下文嵌入语言模型中。

二、该论文采用的方法是什么,方法的核心原理是什么?

方法的提出

  • ①一个由AE和AEC组成的ABSA解决方案:
    在这里插入图片描述

  • 其中的AE——命名为CSAE(contextualized syntax-based aspect extraction)

    • POS embeddings
    • dependency-based embeddings
    • RoBERTa layer
  • 其中的ASC——命名为LCFS-ASC(local context focus on syntax -ASC)

    • 在Zeng et al. (2019) 的工作的基础上做改进,采用依赖树中两个词之间的最短路径作为句法相对距离(SRD)

综上
首先对AE和ASC两个子任务分别地进行改进,提出了CSAE和LCFS-ASC,然后综合构建了一个端到端的ABSA解决方案。

核心原理

  1. CSAE
    CSAE的架构如下图所示,输入一个句子,然后分别进行三个处理:
  • 上下文嵌入contextualized embedding【预训练】
    使用的是RoBERTa (Liu et al., 2019)

  • POS(a part-of-speech) embedding【利用词法信息】
    首先通过一个词法分析的工具(Universal POS Tags)来得到句子对应的词性标签序列,然后通过一个嵌入矩阵将词性转化为向量,接着输入到自注意力层来建模词性之间的依赖关系。

  • dependency-based embedding【利用句法信息】
    使用的是(Levy and Goldberg, 2014) ,利用句法信息的核心仍是依赖树。
    得到句子的表示后,通过一个全连接层来预测相应的情感极性。

在这里插入图片描述

  1. LCFS-ASC
    这个架构与LCF-BERT的思路相同,实际是这个模型上的改进。

    LCF-BERT的核心是:称[CLS]+S+[SEP]+A+[SEP]为global context(全局文本),而[CLS]+S+[SEP]为local context(上下文文本)。如何确定上下文是否属于特定方面的局部语境是重要的问题之一为了在local context引入属性词的信息,LCF-BERT中提出了两种方法(CDM/CDW)进行Local Context Focus(LCF)。
    CDM即为context dynamic mask,是指根据与属性词之间的距离来屏蔽句子中的一些单词;而完全屏蔽某些单词可能过于绝对,因此CDW(context dynamic weighting)则是按照与属性词之间的距离为单词赋予一个0到1之间的权重。这里的“距离”就是通过位置计算的。

    LCFS-ASC与LCF-BERT的不同之处就在于,在进行CDM/CDW时所使用的单词之间的距离,不再是通过位置计算,而是两个单词在句法解析树中的距离。

三、该方法是如何提出的,是开创性的方法还是对已有方法进行的改进,创新点是什么?

参考的观点或模型

  • ①CSAE中:
    上下文嵌入部分:使用的是RoBERTa (Liu et al., 2019)
    POS部分:使用了词法分析的工具——Universal POS Tags
    依赖嵌入部分:使用的是(Levy and Goldberg, 2014)

  • ②LCFS-ASC是在Zeng et al. (2019) 的工作的基础上做改进,Zeng et al. (2019) 的工作中,利用local context focus(LCF)机制来降低远离本地上下文的单词的贡献。这篇论文就是在此基础上引入句法信息,形成的local context focus on syntax(LCFS)机制。

创新点
本文的模型拆解开来实际上都是一些过去提出的模型,这篇论文的创新点在于对这些模型进行了组合和局部的改进。其次是在消融实验中研究了SRD的重要性。
①提出了多通道CSAE模型,该模型将语法aspect分解为上下文特征,以改进顺序标注;
②改进LCF-BERT提出了LCFS-ASC(改进点在于,距离不再是通过位置计算,而是两个单词在句法解析树中的距离),它可以分析单词之间的句法联系,从而更好地理解与目标词相关的本地语境
③通过探究LCF层的注意分值(attention score)研究了SRD的重要性【一个可视化+分析】

四、该论文展示的结果如何?使用的是什么数据集?

使用的数据集
在这里插入图片描述

实验指标:F1
实验结果
①AE单个任务结果+消融实验

  • 使用了词法信息和句法信息后,f1值有了较大的提升(CSAE>RoBERTa-AE)
  • 句法信息带来的提升更加明显(RoBERTa-Dep>RoBERTa-POS)

②单个ASC任务+消融实验

  • 使用了LCFS的策略之后,模型性能有了很大的提高
  • CDW优于CDM(因为CDM可能会错误地忽略有用的信号,另一方面,CDW强调灵活性,并允许根据其句法依存树上future sign和方面术语的关系提供微小权重)
  • LCFS稍微优于LCF

五、该论文是否提出还有需要改进的地方,即future work?

我们提出了一个端到端的ABSA解决方案,将方面提取器和方面情感分类器串联起来。研究结果表明,利用句子的句法结构可使情境化模型在ASC和AE任务中提高现有的工作。我们提出的方面情感分类器优于训练后的ASC模型,并能够创建一个领域独立的解决方案。所提出的SRD允许方面情感分类器聚焦于关键情感词,通过基于依赖的结构修改目标方面词。实质性的改进突出了最近语境化嵌入模型在“理解”句法特征方面的性能不足,并提出了开发更多语法学习语境化嵌入的未来方向。

我们可以尝试通过应用统一的标记方案来将我们提出的CSAE体系结构用于集成方法;从而可以同时实现方面提取和情感分类。

六、该论文的实际应用点在于什么?

首先,这篇论文与其他论文的不同之处在于,其创建的并不是一个直接的模型,而是先独立地解决AE和ASC问题,然后统一架构。
其次,这篇论文虽然是许多已有模型的组合和局部改进,在引入“语境”(即在ABSA的问题解决中仍然关注上下文的信息)的基础上,关注句法信息(也是利用的依赖树的思想),是一种已有思想的新组合。
综上,通过这种组合和局部改进的思想,这篇论文提出的是一个端到端的ABSA解决方案,即输入一个上下文有关联的句子S,端到端的ABSA旨在提取由m个方面词组成的序列A,输出每一个方面词的情感极性,是一个很“自动化”的过程。

这篇关于【论文阅读】【基于方面的情感分析】Modelling Context and Syntactical Features for Aspect-based Sentiment Analysis的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/339236

相关文章

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

锐捷和腾达哪个好? 两个品牌路由器对比分析

《锐捷和腾达哪个好?两个品牌路由器对比分析》在选择路由器时,Tenda和锐捷都是备受关注的品牌,各自有独特的产品特点和市场定位,选择哪个品牌的路由器更合适,实际上取决于你的具体需求和使用场景,我们从... 在选购路由器时,锐捷和腾达都是市场上备受关注的品牌,但它们的定位和特点却有所不同。锐捷更偏向企业级和专

Spring中Bean有关NullPointerException异常的原因分析

《Spring中Bean有关NullPointerException异常的原因分析》在Spring中使用@Autowired注解注入的bean不能在静态上下文中访问,否则会导致NullPointerE... 目录Spring中Bean有关NullPointerException异常的原因问题描述解决方案总结

python中的与时间相关的模块应用场景分析

《python中的与时间相关的模块应用场景分析》本文介绍了Python中与时间相关的几个重要模块:`time`、`datetime`、`calendar`、`timeit`、`pytz`和`dateu... 目录1. time 模块2. datetime 模块3. calendar 模块4. timeit

python-nmap实现python利用nmap进行扫描分析

《python-nmap实现python利用nmap进行扫描分析》Nmap是一个非常用的网络/端口扫描工具,如果想将nmap集成进你的工具里,可以使用python-nmap这个python库,它提供了... 目录前言python-nmap的基本使用PortScanner扫描PortScannerAsync异

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学