TextCNN文本分类快速上手

2024-02-19 02:20
文章标签 快速 分类 文本 textcnn

本文主要是介绍TextCNN文本分类快速上手,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里写目录标题

  • TextCNN介绍:
  • Docker从0安装
  • Docker基于镜像安装
    • 容器打包操作(生成镜像时使用的命令)
    • 安装时命令
  • 页面访问
  • 模型训练
  • API访问
  • 性能测试
  • 其他
    • 查看显卡信息

TextCNN介绍:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

  1. 平均单条推理速度在0.2秒。

  2. 单个模型占用GPU约1.2G,不使用GPU也可以。

Docker从0安装

 docker run --name textcnn_chat --gpus=all --ipc=host --ulimit memlock=-1 \-itd -p 6007:6007 -p 8501:8501 -p 8502:8000 \-v /etc/localtime:/etc/localtime:ro -v ./textcnn-server:/textcnn-server \-d jackyqs/textcnn-server:1.3 

特点:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

4.支持GPU训练,支持异步训练,支持sbert计算分类特征相似度,支持模型训练后重载,支持test/acc, test/recall, test/precision, test/F1输出。(http://localhost:8502)

5.支持类ChatGPT 1-3论对话 streamlit run app.py (http://localhost:8501)

Docker基于镜像安装

容器打包操作(生成镜像时使用的命令)

  • 将安装好、启动好的容器打包成镜像

    docker commit -m='textCNN-server commit' -a='zhangzh' textcnn_chat zzh/textcnn:1.0
    
  • 将镜像,打成可以传到其他地方的tar包

    docker save -o textcnn.tar zzh/textcnn:1.0
    

安装时命令

  • 网盘地址

    ​ 这里因为网盘上传文件有大小限制,所以使用了分卷压缩的方式进行了上传,全部下载下来就可以。

    链接:https://pan.baidu.com/s/1X4vBM8xaoVzrMOKIJVxGRw?pwd=70v8 
    提取码:70v8
    

在这里插入图片描述

  • 将下载好的镜像文件和代码模型文件上传到服务器上,并进行解压,然后在该目录进行操作。

  • 在其他的docker服务器加载镜像

    docker load -i textcnn.tar
    
  • 启动

 docker run --name textcnn_chat --gpus=all --ipc=host --ulimit memlock=-1 \
-itd -p 6007:6007 -p 8501:8501 -p 8502:8000 \-v /etc/localtime:/etc/localtime:ro -v ./textcnn-server:/textcnn-server \-d zzh/textcnn:1.0

特点:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

4.支持GPU训练,支持异步训练,支持sbert计算分类特征相似度,支持模型训练后重载,支持test/acc, test/recall, test/precision, test/F1输出。(http://localhost:8502)

5.支持类ChatGPT 1-3论对话 streamlit run app.py (http://localhost:8501)

页面访问

http://ip:8502/

在这里插入图片描述

模型训练

准备好的训练数据如下:

在这里插入图片描述
tsv文件内容:

微信百万保障	3.285-6.575:您好您是陈国庆本人吗||8.790-15.400:陈先生您好我是微信百万保障中心的话务员给您致电是智能
虚假博彩	3.065-5.055:喂你好||5.060-21.560:您好打扰您一下什么这边是p气的电话客服现在给你致电呢谢谢通知您我们p即将的对应放上限了现在是您费要注册可以领取到平安彩金方便注册领取一下吗||21.560-22.705:l||23.710-25.881:喂能听到吗||25.935-30.176:喂能听到吗

其中,开头表示标签(类型),然后使用\t制表符进行分割,后边跟的是推理出该标签的内容。

每条数据使用\n换行符进行分割。

在这里插入图片描述

API访问

http://ip:8502/predict/ 

在这里插入图片描述

性能测试

6.2/s

在这里插入图片描述

其他

查看显卡信息

lspci | grep -i nvidia

在这里插入图片描述

然后,在该网站搜索版本型号

https://admin.pci-ids.ucw.cz/

在这里插入图片描述

在这里插入图片描述

这篇关于TextCNN文本分类快速上手的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/723209

相关文章

Python自动化提取多个Word文档的文本

《Python自动化提取多个Word文档的文本》在日常工作和学习中,我们经常需要处理大量的Word文档,本文将深入探讨如何利用Python批量提取Word文档中的文本内容,帮助你解放生产力,感兴趣的小... 目录为什么需要批量提取Word文档文本批量提取Word文本的核心技术与工具安装 Spire.Doc

Python实现快速扫描目标主机的开放端口和服务

《Python实现快速扫描目标主机的开放端口和服务》这篇文章主要为大家详细介绍了如何使用Python编写一个功能强大的端口扫描器脚本,实现快速扫描目标主机的开放端口和服务,感兴趣的小伙伴可以了解下... 目录功能介绍场景应用1. 网络安全审计2. 系统管理维护3. 网络故障排查4. 合规性检查报错处理1.

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

SpringCloud Stream 快速入门实例教程

《SpringCloudStream快速入门实例教程》本文介绍了SpringCloudStream(SCS)组件在分布式系统中的作用,以及如何集成到SpringBoot项目中,通过SCS,可... 目录1.SCS 组件的出现的背景和作用2.SCS 集成srping Boot项目3.Yml 配置4.Sprin

SpringBoot集成iText快速生成PDF教程

《SpringBoot集成iText快速生成PDF教程》本文介绍了如何在SpringBoot项目中集成iText9.4.0生成PDF文档,包括新特性的介绍、环境准备、Service层实现、Contro... 目录SpringBoot集成iText 9.4.0生成PDF一、iText 9新特性与架构变革二、环

MySQL 批量插入的原理和实战方法(快速提升大数据导入效率)

《MySQL批量插入的原理和实战方法(快速提升大数据导入效率)》在日常开发中,我们经常需要将大量数据批量插入到MySQL数据库中,本文将介绍批量插入的原理、实现方法,并结合Python和PyMySQ... 目录一、批量插入的优势二、mysql 表的创建示例三、python 实现批量插入1. 安装 PyMyS

使用EasyPoi快速导出Word文档功能的实现步骤

《使用EasyPoi快速导出Word文档功能的实现步骤》EasyPoi是一个基于ApachePOI的开源Java工具库,旨在简化Excel和Word文档的操作,本文将详细介绍如何使用EasyPoi快速... 目录一、准备工作1、引入依赖二、准备好一个word模版文件三、编写导出方法的工具类四、在Export

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

Python文本相似度计算的方法大全

《Python文本相似度计算的方法大全》文本相似度是指两个文本在内容、结构或语义上的相近程度,通常用0到1之间的数值表示,0表示完全不同,1表示完全相同,本文将深入解析多种文本相似度计算方法,帮助您选... 目录前言什么是文本相似度?1. Levenshtein 距离(编辑距离)核心公式实现示例2. Jac