OHW系列之一《Stroke Sequence-Dependent DCNN for Online Handwritten Chinese Character Recognition 》

本文主要是介绍OHW系列之一《Stroke Sequence-Dependent DCNN for Online Handwritten Chinese Character Recognition 》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、论文摘要
  • 二、论文的国内外现状
      • 传统方法流程:
  • 三、论文算法模型
      • 模型概述:
      • 模型细节:
  • 四、论文实验结果
  • 五、论文创新点
  • 六、论文链接

一、论文摘要

本文提出一种名为Stroke Sequence-dependent Deep Convolutional Neural Network(SSDCNN)的模型,模型将Stroke sequence information 和八方向特征结合,用于在线手写中文字符识别。

首先,SSDCNN将Stroke Sequence依据其书写顺序转换为堆栈的特征图作为模型输入,接着经过深度卷积网络提取特征与八方向特征结合作为手写轨迹的最终特征表示。

模型训练策略:“we design a two stages algorithm to train SSDCNN. Firstly, we use
the data to pre-train the whole framework. In order to merge the two representation efficiently, we further train the fullly-connected multiple layer perceptron with a softmax
layer by fixing the parameter of the DCNN.”

二、论文的国内外现状

本文主要是解决在线手写的单字符识别,论文国内外现状从传统方法和现代方法进行了分析。

传统方法流程:

在这里插入图片描述
1. 数据预处理

  1. Data Normalization: 将Strokes正则化到一个固定的大小中以便特征提取,但如何恢复手写字符的外型的形变是关键!常用的方法如:Line Density-based Normalization, Curve-fitting-based normalization and Pseudo 2D Normalization. (“The NLN based on line density equalization has been proven very efficient [16]. In
    order to use line density-based method to OLHCC, Phan[17] convert an OLHCC to a 2D image. For Curve-fitting-based normalization methods, three algorithm are often used such as bi-moment normalization(BMN) [18], centroid-boundary alignment (CBA), and modified CBA (MCBA) [19]. They can be used to OLHCC after
    slightly modified [2, 17]. Pseudo two-dimensional normalization is popularly used for off-line HCCR[15]”).
  2. Interpolation: Linear Interpolation, Bezier Interpolation, B-spline Interpolation.

2. 特征提取

  1. Directional features
  2. Gradient features

三、论文算法模型

模型概述:

  1. The DCNN is used to learn the high-quality representation of OLHCCs, which is stroke sequence-dependent and can learn the stroke sequence information and structural shape of OLHCCs from large scale instances.
  2. The statistical feature is integrated into SSDCNN via a deep fully-connected neural network. Specifically, the eight-directional features are used, which has been proven efficient in OLHCCR. Hence, SSDCNN can preserve the strength of statistical features.

模型细节:

在这里插入图片描述
上分支:模型依据单个字的笔画,将每一笔笔画作为输入,对于不同的字笔画数量一般不同则pad到该batch中最多的笔画的数量。将所有的笔画作为输入送到深度神经网络中提取特征图。
下分支:下面的分支采用传统的方法进行八方向特征提取,八方向特征通过数学统计的方法分析该点及周围点的来表示笔画的形状及方向,缺点在于它不能体现除了该笔画以外的信息,“, because it only extracts the direction feature between the ending point of one stroke and the starting point in its following stroke regardless of the positional relationship between other points in different strokes.”

对于两个分支分别输入到不同的全链接层,原因在于两种特征表示图分别采用不同的方法来提取,卷积网络中经过relu函数激活后,特征中数值从0-inf, 而八方向特征中数值范围仍然为[0,1]。

四、论文实验结果

模型的实验结果感觉意义不大,主要是做的单文字识别。

五、论文创新点

模型主要提供了一种思路如何结合传统的特征提取方法,如:八方向特征、signature of path, 与现有的深度卷积神经网络结合,但是该文的局限在于仅对单字符识别而且将字符拆解为一个个固定size的笔画作为输入,数据冗余较大。

六、论文链接

论文链接:https://arxiv.org/pdf/1610.04057.pdf

这篇关于OHW系列之一《Stroke Sequence-Dependent DCNN for Online Handwritten Chinese Character Recognition 》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/660294

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

GPT系列之:GPT-1,GPT-2,GPT-3详细解读

一、GPT1 论文:Improving Language Understanding by Generative Pre-Training 链接:https://cdn.openai.com/research-covers/languageunsupervised/language_understanding_paper.pdf 启发点:生成loss和微调loss同时作用,让下游任务来适应预训

Java基础回顾系列-第七天-高级编程之IO

Java基础回顾系列-第七天-高级编程之IO 文件操作字节流与字符流OutputStream字节输出流FileOutputStream InputStream字节输入流FileInputStream Writer字符输出流FileWriter Reader字符输入流字节流与字符流的区别转换流InputStreamReaderOutputStreamWriter 文件复制 字符编码内存操作流(

Java基础回顾系列-第五天-高级编程之API类库

Java基础回顾系列-第五天-高级编程之API类库 Java基础类库StringBufferStringBuilderStringCharSequence接口AutoCloseable接口RuntimeSystemCleaner对象克隆 数字操作类Math数学计算类Random随机数生成类BigInteger/BigDecimal大数字操作类 日期操作类DateSimpleDateForma

Java基础回顾系列-第三天-Lambda表达式

Java基础回顾系列-第三天-Lambda表达式 Lambda表达式方法引用引用静态方法引用实例化对象的方法引用特定类型的方法引用构造方法 内建函数式接口Function基础接口DoubleToIntFunction 类型转换接口Consumer消费型函数式接口Supplier供给型函数式接口Predicate断言型函数式接口 Stream API 该篇博文需重点了解:内建函数式

Java基础回顾系列-第二天-面向对象编程

面向对象编程 Java类核心开发结构面向对象封装继承多态 抽象类abstract接口interface抽象类与接口的区别深入分析类与对象内存分析 继承extends重写(Override)与重载(Overload)重写(Override)重载(Overload)重写与重载之间的区别总结 this关键字static关键字static变量static方法static代码块 代码块String类特

Java基础回顾系列-第六天-Java集合

Java基础回顾系列-第六天-Java集合 集合概述数组的弊端集合框架的优点Java集合关系图集合框架体系图java.util.Collection接口 List集合java.util.List接口java.util.ArrayListjava.util.LinkedListjava.util.Vector Set集合java.util.Set接口java.util.HashSetjava