公众号:数据挖掘与机器学习笔记 1.TextCNN基本原理 主要看第二张图: 第一层为输入层,输入是一个 n × k n \times k n×k的矩阵,图中为 7 × 5 7 \times 5 7×5。其中 n n n为句子中的单词数, k k k为词向量维度。词向量可以是预训练好的,也可以在网络中重新开始训练。第一张图中输入有两个矩阵,其中一个使用的预训练好的向量,另一个则作为训
Task4 基于深度学习的文本分类2.2-Word2Vec+TextCNN+BiLSTM+Attention分类 完整代码见:NLP-hands-on/天池-零基础入门NLP at main · ifwind/NLP-hands-on (github.com) 模型架构 模型结构如下图所示,主要包括WordCNNEncoder、SentEncoder、SentAttention和FC模块。