Sarcasm detection论文解析 | 通过阅读进行讽刺推理-Reasoning with sarcasm by reading in-between

本文主要是介绍Sarcasm detection论文解析 | 通过阅读进行讽刺推理-Reasoning with sarcasm by reading in-between,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址 

论文地址:[1805.02856] Reasoning with Sarcasm by Reading In-between (arxiv.org) 

论文首页 

 笔记大纲

通过阅读进行讽刺推理论文笔记

📅出版年份:2018
📖出版期刊:
📈影响因子:
🧑文章作者:Tay Yi,Luu Anh Tuan,Hui Siu Cheung,Su Jian


🔎摘要:

讽刺是一种复杂的语言行为,常见于 Twitter 和 Reddit 等社交社区。由于讽刺不仅具有极性翻转的倾向,而且还使用了形象化的语言,因此在社交网络上盛行的讽刺对意见挖掘系统具有很大的破坏性。讽刺通常表现为正面-负面情绪或字面-具象场景之间的对比主题。在本文中,我们重新审视了对比建模的概念,以便对讽刺进行推理。更具体地说,我们提出了一种基于注意力的神经模型,该模型关注的是 "中间 "而不是 "对面",从而能够明确地对对比和不协调进行建模。我们在 Twitter、Reddit 和互联网论证语料库(Internet Argument Corpus)的六个基准数据集上进行了广泛的实验。我们提出的模型不仅在所有数据集上都达到了最先进的性能,而且还提高了可解释性。


🌐研究目的:

对讽刺进行推理

📰研究背景:

由于讽刺不仅具有极性翻转的倾向,而且还使用了形象化的语言,因此在社交网络上盛行的讽刺对意见挖掘系统具有很大的破坏性。讽刺通常表现为正面-负面情绪或字面-具象场景之间的对比主题。

🔬研究方法:

将内部注意力应用于讽刺语言检测

🔩模型架构:

输入编码层

每个单击编码向量对应词汇表中的一个单词。在输入编码层,每个单击向量被转换成低维向量表示(词嵌入)

多维内部注意力机制

  • 这一层背后的关键思想是对输入序列中每个单词之间的语义进行建模。我们首先对输入序列中每对词之间的关系进行建模。实现这一点的简单方法是使用线性(早期实验发现,在此处添加非线性可能会降低性能。)转换层,将每个词嵌入对的连接投射到一个标量分数中。
  • 为了学习注意力向量 a,我们在矩阵 s 上应用了行向最大池化算子
  • 值得注意的是,我们还屏蔽了 i = j 时的 s 值,这样就不会让单词与自身的关系得分影响整体注意力权重
  • 我们的网络可被视为神经注意的 "内部 "调整,可模拟原始单词表征之间的句内关系。
  • 多维度的内部关注机制。这里的关键思路是,在计算亲和度得分之前,先将每个词对向下投影为一个低维向量,这样不仅可以捕捉一个视图(一个标量),还可以捕捉多个视图。对等式 (1) 的修改构成了我们的多维内部关注变体。

长短期记忆编码器(LSTM)

  • 单独的组合编码器(即学习组合表征)
  • 采用了标准的长短期记忆(LSTM)编码器,LSTM 编码器由通过非线性变换学习到的门控机制参数化。

预测层

  • 其中多维内部注意力机制与LSTM编码器是并联关系
  • 该层使用非线性投影层ReLU学习这两个视图的联合表示。

🧪实验:

📏评估指标

采用了讽刺语言检测任务的标准评估指标,即宏观平均 F1准确率得分。此外,我们还报告了精确度召回分数

📇数据集:

Twitter、Red-dit 和 Debates 数据集

💻实验设备:

NVIDIA GTX1070 GPU

📋实验结果:

我们发现,我们提出的 SIARN 和 MIARN 模型在所有六个数据集上都取得了最佳结果。

  • 2014 TWeets:与最佳基线相比,MIARN 的 F1 和准确率得分提高了约 ≈ 2% - 2.2%
  • 2013TWeets:比大多数基线平均提高 3% - 5%。
  • Reddit 数据集:与最佳基线相比,平均差值提高了 ≈ 2%。
  • Debates 长文本数据集:在 IAC-V1 和 IAC-V2 上,MIARN 的性能比 GRNN 和 CNN-LSTM-DNN 高出≈8%-10%。

总体而言,MIARN 的性能通常略高于 SIARN(但也有例外,例如来自 (Riloff et al., 2013) 的 Tweets 数据集)

我们提出的模型在长文本上的表现也要好得多,这可以归因于注意内表征明确地模拟了长距离的依赖关系。

🚩研究结论:

基于句子内部相似性(即在句子之间寻找)的直觉,我们提出了一种新的讽刺检测神经网络架构。我们的网络包含一个多维注意内分量,可学习句子的注意内表征,使其能够检测对比情感、情况和不协调性。

在六个公共基准上进行的广泛实验证实了我们提出的模型的实证有效性。我们提出的 MIARN 模型优于 GRNN 和 CNN-LSTM-DNN 等最先进的基线模型。


📝总结

💡创新点:

  • 我们的网络可被视为神经注意力的 "内部 "调整,可模拟原始单词表征之间的句内关系。
  • 多维度的内部注意力机制
  • 提出的 MIARN 架构的高层概览
  • 多维内部注意力机制与LSTM编码器并联

局限性:

  • 在短文方面,我们还发现注意力(或 GRNN 的门控池机制)并没有真正帮助我们在普通 LSTM 模型的基础上取得任何显著的改进。
  • 标准神经注意没有帮助的原因,是因为注意机制学习的是选择最后一个表征(即 vanilla LSTM)。如果没有 LSTM 编码器,注意力权重就会集中在 "爱 "上,而不是 "忽略"。这就无法捕捉到任何对比或不协调的概念。

总的来说,我们发现 MIARN 能够识别句子中的对比和不协调,从而使我们的模型能够更好地检测讽刺。句子内部关系建模有助于实现这一点。值得注意的是,标准香草注意力无法解释或解释。

🖍️知识补充:

  • 在 NLP 的语境中,神经注意的关键理念是根据单词对当前任务的相对重要性来软性选择单词序列
  • 对于相对较短的文档(如推文)来说,直观地看,注意力通常会集中在最后一个隐藏表征上。
  • LSTM 编码器的输入是输入编码层之后的词嵌入,而不是注意内层的输出

💬讨论:

  • 我们提出的模型不仅在所有数据集上都达到了最先进的性能,而且还提高了可解释性。
  • 我们的工作不仅是第一项将内部注意力应用于讽刺语言检测的工作,也是第一项用于讽刺语言检测的注意力模型。

这篇关于Sarcasm detection论文解析 | 通过阅读进行讽刺推理-Reasoning with sarcasm by reading in-between的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/944841

相关文章

SpringSecurity6.0 如何通过JWTtoken进行认证授权

《SpringSecurity6.0如何通过JWTtoken进行认证授权》:本文主要介绍SpringSecurity6.0通过JWTtoken进行认证授权的过程,本文给大家介绍的非常详细,感兴趣... 目录项目依赖认证UserDetailService生成JWT token权限控制小结之前写过一个文章,从S

Java图片压缩三种高效压缩方案详细解析

《Java图片压缩三种高效压缩方案详细解析》图片压缩通常涉及减少图片的尺寸缩放、调整图片的质量(针对JPEG、PNG等)、使用特定的算法来减少图片的数据量等,:本文主要介绍Java图片压缩三种高效... 目录一、基于OpenCV的智能尺寸压缩技术亮点:适用场景:二、JPEG质量参数压缩关键技术:压缩效果对比

关于WebSocket协议状态码解析

《关于WebSocket协议状态码解析》:本文主要介绍关于WebSocket协议状态码的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录WebSocket协议状态码解析1. 引言2. WebSocket协议状态码概述3. WebSocket协议状态码详解3

CSS Padding 和 Margin 区别全解析

《CSSPadding和Margin区别全解析》CSS中的padding和margin是两个非常基础且重要的属性,它们用于控制元素周围的空白区域,本文将详细介绍padding和... 目录css Padding 和 Margin 全解析1. Padding: 内边距2. Margin: 外边距3. Padd

Oracle数据库常见字段类型大全以及超详细解析

《Oracle数据库常见字段类型大全以及超详细解析》在Oracle数据库中查询特定表的字段个数通常需要使用SQL语句来完成,:本文主要介绍Oracle数据库常见字段类型大全以及超详细解析,文中通过... 目录前言一、字符类型(Character)1、CHAR:定长字符数据类型2、VARCHAR2:变长字符数

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

Springboot @Autowired和@Resource的区别解析

《Springboot@Autowired和@Resource的区别解析》@Resource是JDK提供的注解,只是Spring在实现上提供了这个注解的功能支持,本文给大家介绍Springboot@... 目录【一】定义【1】@Autowired【2】@Resource【二】区别【1】包含的属性不同【2】@

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.