谣言检测文献阅读十一—Preventing rumor spread with deep learning

本文主要是介绍谣言检测文献阅读十一—Preventing rumor spread with deep learning,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

系列文章目录

  1. 谣言检测文献阅读一—A Review on Rumour Prediction and Veracity Assessment in Online Social Network
  2. 谣言检测文献阅读二—Earlier detection of rumors in online social networks using certainty‑factor‑based convolutional neural networks
  3. 谣言检测文献阅读三—The Future of False Information Detection on Social Media:New Perspectives and Trends
  4. 谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning
  5. 谣言检测文献阅读五—Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection
  6. 谣言检测文献阅读六—Tracing Fake-News Footprints: Characterizing Social Media Messages by How They Propagate
  7. 谣言检测文献阅读七—EANN: Event Adversarial Neural Networks for Multi-Modal Fake News Detection
  8. 谣言检测文献阅读八—Detecting breaking news rumors of emerging topics in social media
  9. 谣言检测文献阅读九—人工智能视角下的在线社交网络虚假信息 检测、传播与控制研究综述
  10. 谣言检测文献阅读十一—Preventing rumor spread with deep learning

文章目录

  • 系列文章目录
  • 前言
  • 2、相关工作
    • 2.1. 谣言传播分析
    • 2.2. 事实检查模型
  • 3. 方法论
    • 3.1. 事实核查模型
      • 3.1.1 整体架构
    • 3.1.2. 声明嵌入
    • 3.1.3.事实核查
    • 3.2.评估数据集
    • 3.3 实验设置


前言

文章:Preventing rumor spread with deep learning
发表会议:Expert Systems with Applications(C 类)
时间:2022年2月


  现在自动谣言检测模型主要依赖于人群反应(Kim et al., 2018; Ruchansky et al., 2017)或相关文章(Popat et al., 2016, 2017)采取的立场(即支持或拒绝)一个给定的谣言,它可以在广泛传播给人群后被捕获。
   本文介绍了一种基于深度学习的模型,该模型可以帮助确定给定谣言在传播之前的真实性。为此,我们开发了一个事实检查模型,该模型仅使用以书面形式描述谣言的声明句作为输入。
  验证表明本文所提出的模型可以高精度地识别虚假谣言,从而表明仅使用声明的事实检查模型确实可以准确地检测虚假谣言。此外,我们进一步研究了在缺少数据集的情况下是否以及如何改进所提出的模型。为此,我们设计了分类事实检查模型,每个模型都使用某个类别(例如政治或体育)中的谣言声明进行学习。分类模型的评估表明存在性能下降的分类模型。最后,表明这些类别的性能下降可以通过转移学习得到改善,转移学习使用来自一个类别的预构建模型的参数作为模型的初始状态,以识别另一个类别中的虚假谣言。
   本研究的贡献总结如下:

  • 仅使用声明的事实检查器: 本研究提出了一种基于深度学习的模型,该模型仅使用谣言声明,从而识别并防止虚假谣言传播开来。所提出的模型包括两个步骤:(i)声明嵌入和(ii)事实检查。对于声明嵌入,实现了 BERT 预训练模型以从声明中提取综合语言特征,然后将提取的特征输入到事实检查步骤以进行最终决策。我们基于收集到的数据集的评估表明,所提出的模型不仅提取了每个单词的含义,还提取了反映语言风格或声明中单词之间关系的复杂因素,从而改进了事实-检查性能。
  • 不同类别的事实核查: :假设缺乏一个数据集,其中只有一个类别中的声明可用,则针对单个类别(例如政治或娱乐)开发并评估了多个事实检查模型,揭示了政治、娱乐和商业中相对难以进行事实检查的谣言本研究还表明,迁移学习可以改善这些类别中模型性能下降的情况,迁移学习使用从一个类别中训练的模型参数作为另一个类别的模型初始状态。我们的分析表明,从一个类别中预训练的模型可以处理广泛的主题(例如,仿制品学-fauxtography),这是一个有用的来源,可以转移到其他类别(例如,娱乐)。

2、相关工作

2.1. 谣言传播分析

2.2. 事实检查模型

3. 方法论

3.1. 事实核查模型

3.1.1 整体架构

  所提出模型的目标是确定给定声明是真还是假。为此,我们提出了一个基于深度学习的模型,该模型由两个步骤组成:(i) 声明嵌入和 (ii) 事实检查,如图 1 所示。对于声明嵌入,我们首先调查和评估提取的各种模型语言特征,并决定使用 BERT 预训练模型,因为它可以从给定文本中提取综合特征(Devlin 等人,2019)。

在这里插入图片描述
图 1. 显示了所提出模型的整体架构。事实检查的过程包括两个步骤:(i)声明嵌入和(ii)事实检查。对于声明嵌入,使用了 BERT 预训练模型,该模型由多个双向变换层组成,每个变换层都采用了复杂的技术,包括层归一化、残差连接和多头注意力。然后在声明嵌入阶段提取的给定声明的嵌入在事实检查阶段被馈送到多个层中,以进行最终的真/假决策。
  然后,在事实检查阶段将从声明嵌入步骤中提取的声明特征向量馈送到多个层中,以进行最终的真/假决策。形式上,给定谣言声明 r r r 的预测值 y r y_r yr计算如下。
在这里插入图片描述  其中 X X X θ \theta θ 分别是谣言声明集和要训练的参数集。

  所提出模型的另一个关键特征是采用迁移学习,这是一个在执行任务时获取知识并将其应用于执行相关任务的概念。特别是,用于揭穿特定类别(例如,政治)的模型的参数被转移并用作另一个类别(例如,娱乐)的新事实检查模型的初始参数。因此,可以通过迁移学习使用相对较少的索赔数据快速可靠地学习新类别的模型。

3.1.2. 声明嵌入

  所提出模型中使用的 BERT 层与原始模型相同,我们排除了对 BERT 层架构的详尽描述。与其他基于 BERT 的分类模型类似,最后一层 [CLS] 的唯一嵌入特征最终被转发到事实检查步骤。

3.1.3.事实核查

  事实检查步骤使用在上一步中生成的声明特征作为输入来确定给定声明是真还是假。为此,在此步骤中使用了单个 dropout 层和单个全连接层。特征首先通过 dropout 层,通过在正向和反向传播过程中随机丢弃一些隐藏单元来防止隐藏单元的共同适应。请注意, dropout 率 § 设置为 0.1。然后,dropout 层的输出通过全连接层进行最终决策。形式上,给定谣言声明 r 的输出计算如下。
在这里插入图片描述  其中 F F F E r E_r Er分别代表全连接层和从上一步提取的声明特征
  为了获得所提出模型的最佳网络参数,应用了L2正则化。特别是, θ \theta θ是否满足以下表达式,也被确定。
在这里插入图片描述  其中 D 和 y 表示谣言声明集和实际标签(即,1 和 0 分别表示虚假和真实声明),分别表示为 one-hot 编码向量。
3.1.4 迁移学习
  所提出模型的一个关键特征是采用迁移学习 (Pan & Yang, 2010) 为新类别中的谣言建立事实检查模型,这在缺少数据集的情况下很有用。也就是说,假设一个典型类别(例如,商业)的谣言可以与另一个类别(例如,金融)的谣言相关联,那么一个类别中的谣言声明训练的所有模型参数都可以转移和使用作为另一个类别的模型的初始状态,其要学习的声明数量不足。
在这里插入图片描述图 3 显示了从类别 C i C_i Ci到另一个类别 C j C_j Cj的迁移学习过程。类别 C i C_i Ci的谣言声称用于训练 C j C_j Cj的事实检查模型的参数 θ C i \theta_{C_i} θCi。为了建立模型来揭穿 θ C j \theta_{C_j} θCj类别中的谣言声明,参数 θ C i \theta_{C_i} θCi被转移并用作类别 θ C j \theta_{C_j} θCj的模型的初始参数。类别 C i C_i Ci中的谣言声明,用于调整初始参数 θ C i \theta_{C_i} θCi ,最终得出类别 C j C_j Cj 的事实检查模型的参数(记为 θ C j \theta_{C_j} θCj)。

3.2.评估数据集

  我们从两个流行的事实核查网站 Snopes2 和 Politifact3 收集了谣言及其相应的说法

3.3 实验设置

  批量大小、序列长度、学习率和 epoch 计数分别设置为 32、128、1e-5 和 8。这些适用于所有模型,除了从“Fauxtography”到“Entertainment”的转移模型,其性能在表4中描述。我们只将模型的学习率更改为2e-5
在这里插入图片描述

这篇关于谣言检测文献阅读十一—Preventing rumor spread with deep learning的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/275598

相关文章

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

vue解决子组件样式覆盖问题scoped deep

《vue解决子组件样式覆盖问题scopeddeep》文章主要介绍了在Vue项目中处理全局样式和局部样式的方法,包括使用scoped属性和深度选择器(/deep/)来覆盖子组件的样式,作者建议所有组件... 目录前言scoped分析deep分析使用总结所有组件必须加scoped父组件覆盖子组件使用deep前言

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

STM32(十一):ADC数模转换器实验

AD单通道: 1.RCC开启GPIO和ADC时钟。配置ADCCLK分频器。 2.配置GPIO,把GPIO配置成模拟输入的模式。 3.配置多路开关,把左面通道接入到右面规则组列表里。 4.配置ADC转换器, 包括AD转换器和AD数据寄存器。单次转换,连续转换;扫描、非扫描;有几个通道,触发源是什么,数据对齐是左对齐还是右对齐。 5.ADC_CMD 开启ADC。 void RCC_AD