基于BERT和双向LSTM的微博评论倾向性分析研究-笔记

2023-11-08 21:20

本文主要是介绍基于BERT和双向LSTM的微博评论倾向性分析研究-笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

14天阅读挑战赛
努力是为了不平庸~

基于BERT和双向LSTM的微博评论倾向性分析研究-笔记

一、模型介绍

针对传统语言模型在词向量表示中无法解决词语 多义性的问题,提出采用BERT模型来提取微博评论文本的语义特征表示,然后将获取的词语语义特征输入到双向LSTM模型中进行倾向性分类。
选取新浪微博评论数据进行了对比实验。实验结果表明,提出的基于BERT和双向LSTM的微博评论倾向性分类模型的F1值达到91.45%,优于其他主流的倾向性分析模型,证明了方法的有效性。
[局限] 双向 LSTM 模型训练的计算复杂度较高,BERT模型只能依赖于谷歌发布的预训练模型。
文本语义表示方法从最初的 One-Hot 表示法发展到当 前主流的 Word2Vec、Glove 等基于神经网络的方法,虽然在一定程度上解决了词语上下文关系的问题,但还没有解 决词语在不同语境下具有不同含义这个多义词问题。本文提出利用BERT作为语言特征提取与表示方法,既能获取 微博评论文本的丰富的语法、语义特征,又能解决传统基 于神经网络结构的语言特征表示方法忽略词语多义性的问题。
在这里插入图片描述
BERT在预训练目标函数时采用遮蔽语言模型(Masked Language Model,MLM),随机遮蔽一些词语,再在预训练过程中对其进行预测,这样可以学习到能够融合两个不同方向文本的表征。对于BERT模型的输入,每一个词语的表示都有词语向量(Token E吗beddings)、段向量(Segment Embeddings)和位置向量(Positional Embeddings)相加产生。
在这里插入图片描述
首先对数据进行预处理,完成数据集的预处理。 接着将训练集和验证集数据使用 BERT 模型进行预训练, 预训练过程中会在输入词序列中随机遮蔽 15% 的词,然 后再对被遮蔽的词进行预测,而被遮蔽的词 80% 的时间 用 [MASK] 替换,10% 的时间用随机词替换,10% 的时 间让选择的词不变,这样更能偏向实际观察到的词。除此 之外,预训练时还会进行下一句预测任务。在完成预训练 任务之后,便可以获取 BERT 模型对输入句子的表示,即 获取 BERT 模型的最后一层作为双向 LSTM 模型的特征输 入,并在双向 LSTM 后接上一个全连接层,并对全连接层 采用 Softmax 函数实现分类。在建模完成后,利用测试集 数据进行文本倾向性分析预测,最后采用 F1 值评价模型的性能。

二、实验介绍

作者将BERT-BLSTM模型与
1.baseline:利用BERT模型在语料库上预训练得到文本特征后,通过一个全连接层直接输入到 Softmax 分类器中;
2.Word2Vec-BLSTM: 将输入句子采用 Word2Vec 训练出词向量表示,并将其作为特征输入到 BLSTM 中进行分类;
3.EC-BLSTM: 利用注意力机制改进输入词向量来增强倾向性信息的学习,再输入到 BLSTM中进行语义信息的学习,最后实现分类;
4.ELMo-BLSTM: 将输入句子采用ELMo训练出词语特征向量后,将其输入到BLSTM 中进行分类;
5.GPT-BLSTM: 采用 OpenAI GPT 对输入句子进 行训练得到新的表示后,输入到 BLSTM 中进行分类;
6.BERT-SVM: 利用BERT预训练得到文本特征表示 之后输入到 SVM 中进行分类;7.BERT-RNN: 利用BERT预训练得到文本特征表示 之后输入到RNN 中完成特征训练及分类;
8.BERT-CNN: 利用BERT预训练得到文本特征表示 之后输入到CNN 中完成特征训练及分类。
这八类模型进行详细的对比,最终BERT-BLSTM模型获得最高的准确率、召回率和F1值。在这里插入图片描述

三、缺陷和局限

本文方法也存在一 定的问题,一个是双向 LSTM 模型训练的计算复杂度较高,另一个是BERT模型复现比较困难,只能依赖于谷歌团队发布的预训练模型。在今后的工作中将针对这些问题 进行改进,以期获得更高效的倾向性分析模型。

这篇关于基于BERT和双向LSTM的微博评论倾向性分析研究-笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/372582

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

csu1329(双向链表)

题意:给n个盒子,编号为1到n,四个操作:1、将x盒子移到y的左边;2、将x盒子移到y的右边;3、交换x和y盒子的位置;4、将所有的盒子反过来放。 思路分析:用双向链表解决。每个操作的时间复杂度为O(1),用数组来模拟链表,下面的代码是参考刘老师的标程写的。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2