只需半小时,搭建paddlepaddle-OCR识别服务(识别身份证、资格证等)

本文主要是介绍只需半小时,搭建paddlepaddle-OCR识别服务(识别身份证、资格证等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

简单尝试了下paddleOCR的最新版(2021),只需要几行命令就可以很快地在本地部署一个OCR识别系统

WX20210202-192125

如果不想看下文,依次执行以下命令即可搭建(注意:仅在linux系统中测试,其他系统也可参照):

# 有anaconda系统可以跳过
sh Anaconda3-2020.03-Linux-x86_64.sh
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda create --name python37 python=3.7
# 激活虚拟环境
source activate python37
pip3 install --upgrade pip
python3 -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple
pip install paddlehub==2.0.0rc0
hub install chinese_ocr_db_crnn_server==1.1.1
hub serving start -m chinese_ocr_db_crnn_server

只需要半小时,执行几个比较简单的命令,就可以搭建一个简单的自然场景ocr识别系统。

输入图像输出ocr文本:
ocr_res

如果上述遇到问题或者有疑问,可以看具体操作:

开始搭建

首先建立好anaconda环境:

anaconda常用命令配置信息及更换源

然后开始安装paddle需要的库:

python -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple

这里我安装的是GPU版本的,cpu版本的执行pip install paddlepaddle==2.0.0rc即可。

没想到一开始安装就遇到了空间不足的问题。

WX20210201-171013@2x

ERROR: Could not install packages due to an EnvironmentError: [Errno 28] No space left on device

这个问题很说白了是缓冲空间不足的问题。

如果有root权限,直接执行:

rm -fr /tmp/tmp*

如果没有root权限,自己创建一个tmp文件夹即可:

mkdir tmp
chmod 1777 tmp/
export TMPDIR=path/to/tmp

解决这个问题后,顺利安装。

继续安装paddlehub,执行:

pip install paddlehub==2.0.0rc0

安装完执行下判断hub服务功能正不正常:

import paddlehub
paddlehub.server_check()

测试正常后,可以执行简单测试一张图片:

import paddlehub as hub
import cv2ocr = hub.Module(name="chinese_ocr_db_crnn_server")
result = ocr.recognize_text(images=[cv2.imread('/PATH/TO/IMAGE')])

没有什么问题,不过就是运行太慢了,这种方式运行每次都需要重新加载模型权重,如果需要实时则搭建为服务器的格式。

服务器推理

首先在命令行开启服务命令:

hub serving start -m chinese_ocr_db_crnn_server

默认端口8866。

推理官方的例子就可以直接使用:

import requests
import json
import cv2
import base64def cv2_to_base64(image):data = cv2.imencode('.jpg', image)[1]return base64.b64encode(data.tostring()).decode('utf8')# 发送HTTP请求
data = {'images':[cv2_to_base64(cv2.imread("/PATH/TO/IMAGE"))]}
headers = {"Content-type": "application/json"}
url = "http://127.0.0.1:8866/predict/chinese_ocr_db_crnn_server"
r = requests.post(url=url, headers=headers, data=json.dumps(data))# 打印预测结果
print(r.json()["results"])

如果发现结果和官方提供的demo结果略有不同,建议可以调整下输入图像的尺寸,输入尺寸不同会影响输出的结果:

long_size = 1024     
height, width = img.shape[0:2]
max_part = max(height, width)
if max_part > long_size:scale_own = long_size / max_partimg = cv2.resize(img, dsize=None, fx=scale_own, fy=scale_own)

错误分析

如果运行GPU的paddle-GPU服务提示这个错误:

Cannot load cudnn shared library. Cannot invoke method cudnnGetVersion.\n  [Hint: cudnn_dso_handle should not be null.

一般是没有在当前路径中找到cuda和cudnn的路径,在环境变量中设置一下就OK了:

export LD_LIBRARY_PATH=/urs/local/cuda/lib64:$LD_LIBRARY_PATH
export /urs/local/cuda/bin/:$PATH

如果服务正常,则会返回:

[INFO 2021-02-01 20:35:05,635 _internal.py:113] 172.30.12.15 - - [01/Feb/2021 20:35:05] "POST /predict/chinese_ocr_db_crnn_server HTTP/1.1" 200 -
[INFO 2021-02-01 20:35:10,554 _internal.py:113] 172.30.12.15 - - [01/Feb/2021 20:35:10] "POST /predict/chinese_ocr_db_crnn_server HTTP/1.1" 200 -
[INFO 2021-02-01 20:35:13,807 _internal.py:113] 172.30.12.15 - - [01/Feb/2021 20:35:13] "POST /predict/chinese_ocr_db_crnn_server HTTP/1.1" 200 -
[INFO 2021-02-01 20:35:26,604 _internal.py:113] 172.30.12.15 - - [01/Feb/2021 20:35:26] "POST /predict/chinese_ocr_db_crnn_server HTTP/1.1" 200 -

实在搞不定环境配置的可以直接运行docker,拉下来在docker环境中跑:

sudo docker run --name ppocr -v $PWD:/paddle --network=host -it  paddlepaddle/paddle:latest-dev-cuda10.1-cudnn7-gcc82  /bin/bash

进入镜像后,执行的命令和上述的一致。

这就是简易的paddlepaddle-OCR系统搭建过程~

参考链接

https://github.com/PaddlePaddle/PaddleHub/blob/release/v2.0.0-rc/docs/docs_en/installation_en.md
https://github.com/PaddlePaddle/PaddleOCR


WX20210128-000633@2x
微信扫码关注我哦

这篇关于只需半小时,搭建paddlepaddle-OCR识别服务(识别身份证、资格证等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/205338

相关文章

Mycat搭建分库分表方式

《Mycat搭建分库分表方式》文章介绍了如何使用分库分表架构来解决单表数据量过大带来的性能和存储容量限制的问题,通过在一对主从复制节点上配置数据源,并使用分片算法将数据分配到不同的数据库表中,可以有效... 目录分库分表解决的问题分库分表架构添加数据验证结果 总结分库分表解决的问题单表数据量过大带来的性能

Java汇编源码如何查看环境搭建

《Java汇编源码如何查看环境搭建》:本文主要介绍如何在IntelliJIDEA开发环境中搭建字节码和汇编环境,以便更好地进行代码调优和JVM学习,首先,介绍了如何配置IntelliJIDEA以方... 目录一、简介二、在IDEA开发环境中搭建汇编环境2.1 在IDEA中搭建字节码查看环境2.1.1 搭建步

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

鸿蒙开发搭建flutter适配的开发环境

《鸿蒙开发搭建flutter适配的开发环境》文章详细介绍了在Windows系统上如何创建和运行鸿蒙Flutter项目,包括使用flutterdoctor检测环境、创建项目、编译HAP包以及在真机上运... 目录环境搭建创建运行项目打包项目总结环境搭建1.安装 DevEco Studio NEXT IDE

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

搭建Kafka+zookeeper集群调度

前言 硬件环境 172.18.0.5        kafkazk1        Kafka+zookeeper                Kafka Broker集群 172.18.0.6        kafkazk2        Kafka+zookeeper                Kafka Broker集群 172.18.0.7        kafkazk3

【IPV6从入门到起飞】5-1 IPV6+Home Assistant(搭建基本环境)

【IPV6从入门到起飞】5-1 IPV6+Home Assistant #搭建基本环境 1 背景2 docker下载 hass3 创建容器4 浏览器访问 hass5 手机APP远程访问hass6 更多玩法 1 背景 既然电脑可以IPV6入站,手机流量可以访问IPV6网络的服务,为什么不在电脑搭建Home Assistant(hass),来控制你的设备呢?@智能家居 @万物互联

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。

pico2 开发环境搭建-基于ubuntu

pico2 开发环境搭建-基于ubuntu 安装编译工具链下载sdk 和example编译example 安装编译工具链 sudo apt install cmake gcc-arm-none-eabi libnewlib-arm-none-eabi libstdc++-arm-none-eabi-newlib 注意cmake的版本,需要在3.17 以上 下载sdk 和ex