【数据应用案例】知乎瓦力机器人识别“阴阳怪气”回复

2024-09-06 04:18

文章标签 数据应用机器人案例识别回复知乎瓦力阴阳怪气

本文主要是介绍【数据应用案例】知乎瓦力机器人识别“阴阳怪气”回复，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

案例来源：@AI科技评论

案例地址：https://mp.weixin.qq.com/s/eVbRkwQu0BQKTblKMZAsfA

1. 目标：知乎中有“你可真是棒棒的”、“你开心就好”等评论，识别并过滤这些评论有助于提高社区讨论质量

2. 数据获取：

1）根据“举报”和“踩”，得到“阴阳怪气”样本

2）通过同义词替换，扩大样本量

3）根据提取的阴阳怪气样本，随机构造评论做数据增强，提高模型泛化能力

3. 特征工程

1）文本特征：加入阴阳怪气词库后，进行分词，保留标点、表情

2）数值特征：句子长度，句号数量，感叹号数量

3）embedding特征：利用知乎全量文本数据训练word2vec模型，

4. 分类器：

1）采用CNN做分类器，原因是可以捕获字词的位置关系

2）对评论上文和评论本身分别训练CNN模型，训练各自参数

3）然后评论上文的卷积输出进行 dot-attention 目的是获取评论上文与评论不同的权重

4）最后将特征数据全连接层以 softmax 方式进行分类

5. 效果示例

6. 缺陷：

1）样本不足

2）出现过拟合，如“哈哈哈”容易错分为阴阳怪气样本

7. 改进点

1）通过主动学习（Active Learning）提高标注样本量

2）加入语义分析信息

3）背景知识：对于体育、明星等领域单独建模

这篇关于【数据应用案例】知乎瓦力机器人识别“阴阳怪气”回复的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1140980。 23002807@qq.com

相关文章

mysql_mcp_server部署及应用实践案例

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

阅读更多...

mybatis-plus分表实现案例(附示例代码)

mybatis-plus分表实现案例(附示例代码)

《mybatis-plus分表实现案例(附示例代码)》MyBatis-Plus是一个MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,为简化开发、提高效率而生,：本文主要介绍my... 目录文档说明数据库水平分表思路1. 为什么要水平分表2. 核心设计要点3.基于数据库水平分表注意事项示例

阅读更多...

SpringBoot整合AOP及使用案例实战

SpringBoot整合AOP及使用案例实战

《SpringBoot整合AOP及使用案例实战》本文详细介绍了SpringAOP中的切入点表达式,重点讲解了execution表达式的语法和用法,通过案例实战,展示了AOP的基本使用、结合自定义注解以... 目录一、引入依赖二、切入点表达式详解三、案例实战1. AOP基本使用2. AOP结合自定义注解3.

阅读更多...

MySQL数据目录迁移的完整过程

MySQL数据目录迁移的完整过程

《MySQL数据目录迁移的完整过程》文章详细介绍了将MySQL数据目录迁移到新硬盘的整个过程,包括新硬盘挂载、创建新的数据目录、迁移数据（推荐使用两遍rsync方案）、修改MySQL配置文件和重启验证... 目录1，新硬盘挂载（如果有的话）2，创建新的 mysql 数据目录3，迁移 MySQL 数据（推荐两

阅读更多...

Python数据验证神器Pydantic库的使用和实践中的避坑指南

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻：当你的API接口又双叒崩了！2️⃣ 神兵天降：3行代码解决验证难题3️⃣ 深度

阅读更多...

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表（结构+数据）的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表（1... 目录一、mysql 复制表（结构+数据）的 4 种核心方法（面试结构化回答）方法 1：CREATE

阅读更多...

详解C++ 存储二进制数据容器的几种方法

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>（最常用）特点：适用场景：示例：2.std::arra

阅读更多...

Springboot3 ResponseEntity 完全使用案例

Springboot3 ResponseEntity 完全使用案例

《Springboot3ResponseEntity完全使用案例》ResponseEntity是SpringBoot中控制HTTP响应的核心工具——它能让你精准定义响应状态码、响应头、响应体,相比... 目录Spring Boot 3 ResponseEntity 完全使用教程前置准备1. 项目基础依赖（M

阅读更多...

Java使用Spire.Barcode for Java实现条形码生成与识别

Java使用Spire.Barcode for Java实现条形码生成与识别

《Java使用Spire.BarcodeforJava实现条形码生成与识别》在现代商业和技术领域,条形码无处不在,本教程将引导您深入了解如何在您的Java项目中利用Spire.Barcodefor... 目录1. Spire.Barcode for Java 简介与环境配置2. 使用 Spire.Barco

阅读更多...

C++11中的包装器实战案例

C++11中的包装器实战案例

《C++11中的包装器实战案例》本文给大家介绍C++11中的包装器实战案例,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录引言1.std::function1.1.什么是std::function1.2.核心用法1.2.1.包装普通函数1.2.

阅读更多...