本文主要是介绍论文笔记|DOC: Deep Open Classification of Text Documents,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
作者:徐甘霖
单位:燕山大学
概述
关于文本分类(Text Classification)及开放领域文本分类(Open-set Text Classification)的介绍,请见5月4日的文章Overcoming the challenge for text classification in the open world,里面简单介绍了文本分类(包括开放领域文本分类)的概念及常用方法,在此不再赘述。作者的主要方法是在具有m个训练类别的数据上构建一个m+1个输出结果的分类器,其中“+1”的情况代表未知类别(unknow),使用改进的CNN构建分类器,结构如下所示:
Overview
本文中的CNN通过最大池化得到一个h维的特征向量,然后经过两个全连接层及其中间的ReLU激活函数将k维的特征向量h降维得到m维的特征向量d(m是已知类别的个数),公式如下:
这篇关于论文笔记|DOC: Deep Open Classification of Text Documents的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!