基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别

本文主要是介绍基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

转发来源：https://swift.ctolib.com/ooooverflow-chinese-ocr.html

chinese-ocr

基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别

环境部署

sh setup.sh  使用环境： python 3.6 + tensorflow 1.10 +pytorch 0.4.1

注：CPU环境执行前需注释掉for gpu部分，并解开for cpu部分的注释

Demo

python demo.py

下载预训练模型

CRNN

将pytorch-crnn.pth放入/train/models中

CTPN

将checkpoints.zip解压后的内容放入/ctpn/checkpoints中

模型训练

warp-ctc安装pytorch版

详见 warp-ctc.pytorch

CTPN训练

详见 tensorflow-ctpn

CRNN训练

1.数据准备

下载训练集

共约364万张图片，按照99:1划分成训练集和验证集
数据利用中文语料库（新闻 + 文言文），通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
包含汉字、英文字母、数字和标点共5990个字符
每个样本固定10个字符，字符随机截取自语料库中的句子
图片分辨率统一为280x32

修改/train/config.py中train_data_root，validation_data_root以及image_path

2.训练

cd train  
python train.py

3.训练结果

效果展示

CTPN

OCR

参考

warp-ctc-pytorch
chinese_ocr-(tensorflow+keras)
CTPN-tensorflow
crnn-pytorch

这篇关于基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别

转发来源：https://swift.ctolib.com/ooooverflow-chinese-ocr.html

chinese-ocr

环境部署

Demo

CRNN

CTPN

模型训练

warp-ctc安装pytorch版

CTPN训练

CRNN训练

效果展示

CTPN

OCR

参考

相关文章

pytorch自动求梯度autograd的实现

C#TextBox设置提示文本方式(SetHintText)

在PyCharm中安装PyTorch、torchvision和OpenCV详解

pytorch之torch.flatten()和torch.nn.Flatten()的用法

使用Python实现文本转语音(TTS)并播放音频

使用PyTorch实现手写数字识别功能

Python实现常用文本内容提取

Pytorch微调BERT实现命名实体识别

Java实现将Markdown转换为纯文本

pytorch+torchvision+python版本对应及环境安装