openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读

本文主要是介绍openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🧡💛💚💙💜OpenCV实战系列总目录

有任何问题欢迎在下面留言
本篇文章的代码运行界面均在Pycharm中进行
本篇文章配套的代码资源已经上传

上篇内容:
openCV实战-系列教程11:文档扫描OCR识别上(图像轮廓/模版匹配)项目实战、源码解读
中篇内容:
openCV实战-系列教程13:文档扫描OCR识别中(图像轮廓/模版匹配)项目实战、源码解读

7、pytesseract文字识别

7.1 安装python工具包

上篇内容中,我们是安装了tesseract.exe,我们需要在代码中实现这个效果,那么就需要在命令行中安装pytesseract,

pip install pytesseract

没有任何要求

7.2 代码解读

preprocess = 'blur' #thresh
image = cv2.imread('scan.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  1. 指定是滤波还是二值
  2. 读入图像
  3. 灰度
if preprocess == "thresh":gray = cv2.threshold(gray, 0, 255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
if preprocess == "blur":gray = cv2.medianBlur(gray, 3)

这段代码包含两个if语句,但是只会执行一个
是判断选择二值处理还是滤波处理,然后执行语句分别对应的是各自的操作

filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)
  1. os.getpid(),此方法返回一个整数值,该整数值表示当前进程的进程ID。此方法的返回类型为“ int”类,不需要参数,os.getpid()的返回值,充当占位符,filename最后保存了文件名的字符串
  2. 使用filename作为文件名,gray作为图像数据保存图像
text = pytesseract.image_to_string(Image.open(filename))
print(text)
os.remove(filename)
cv2.imshow("Image", image)
cv2.imshow("Output", gray)
cv2.waitKey(0)    
  1. 使用
  2. 打印文本
  3. 打印原始图像
  4. 打印输出图像
  5. 关闭窗口

打印结果:

x x ee eR OK OK Oe KR OK KK

WHOLE FOODS MARKET - WESTPORT, CT 06880 399 POST RD WEST - (203)
227-6858

6b $65 365

365

F

BACUN LS BACON LS BACON LS BACUN LS BROTH CHIL LOUR ALMUND

CHKN BRST BNLSS SK

HEAVY CREAM

BALSMC REDUCT

BEEF

GRND 85/15

JUICE COF CASHEW -. DOCS PINT ORGAWEL HNY ALMOND BUTTER

eunene TAX

.00 BAL

NP hiP NP NP NP NP NP NP

nm

8、bug记录

C:\Users\18333\anaconda3\envs\pytorch\python.exe A:\2_gupao\ocr\test.py
Traceback (most recent call last):
  File"
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py", line 255, in run_tesseract
    proc = subprocess.Popen(cmd_args, **subprocess_args())
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\subprocess.py”, line 858, in init
    self._execute_child(args, executable, preexec_fn, close_fds,
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\subprocess.py”, line 1327, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File “
A:\2_gupao\ocr\test.py”, line 27, in module
    text = pytesseract.image_to_string(Image.open(filename))
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 423, in image_to_string
    return {
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 426, in lambda
    Output.STRING: lambda: run_and_get_output(*args),
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 288, in run_and_get_output
    run_tesseract(**kwargs)
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 260, in run_tesseract
    raise TesseractNotFoundError()
pytesseract. pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH. See README file for more information.

进程已结束,退出代码为 1

运行的时候出现这个bug,打开以下文件目录:

你的anaconda安装目录\anaconda3\envs\pytorch\Lib\site-packages\pytesseract

注意这里,第一每个人的anaconda安装目录不一样,第二,每个人的python环境也不一样,这里

anaconda3\envs\pytorch\Lib\site-packages\pytesseract

如果实在base环境中就是直接是

anaconda3\Lib\site-packages\pytesseract

我的是安装在了一个名为pytorch的python环境中
打开pytesseract.py文件,将这行代码:

tesseract_cmd = 'tesseract'

改为:

tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'

你直接复制过来的地址是这个斜杠\,应该改成这个/
这里每个人的tesseract的安装地址也不同,解决完这些应该就能运行了😇😇😇
如果还是不能运行,有可能是你的环境变量出错了,检查一下,一共有四处
如果还是不能运行!!!!!
建议更换tesseract.exe的版本,下载地址,推荐选择5.0.1版本,之前干的再干一遍。
还是不行的话😭😭😭
来加v找我给你debug:yzy-416

上篇内容:
openCV实战-系列教程11:文档扫描OCR识别上(图像轮廓/模版匹配)项目实战、源码解读
中篇内容:
openCV实战-系列教程13:文档扫描OCR识别中(图像轮廓/模版匹配)项目实战、源码解读

这篇关于openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/627066

相关文章

Java JDK1.8 安装和环境配置教程详解

《JavaJDK1.8安装和环境配置教程详解》文章简要介绍了JDK1.8的安装流程,包括官网下载对应系统版本、安装时选择非系统盘路径、配置JAVA_HOME、CLASSPATH和Path环境变量,... 目录1.下载JDK2.安装JDK3.配置环境变量4.检验JDK官网下载地址:Java Downloads

MySQL 多列 IN 查询之语法、性能与实战技巧(最新整理)

《MySQL多列IN查询之语法、性能与实战技巧(最新整理)》本文详解MySQL多列IN查询,对比传统OR写法,强调其简洁高效,适合批量匹配复合键,通过联合索引、分批次优化提升性能,兼容多种数据库... 目录一、基础语法:多列 IN 的两种写法1. 直接值列表2. 子查询二、对比传统 OR 的写法三、性能分析

Linux系统性能检测命令详解

《Linux系统性能检测命令详解》本文介绍了Linux系统常用的监控命令(如top、vmstat、iostat、htop等)及其参数功能,涵盖进程状态、内存使用、磁盘I/O、系统负载等多维度资源监控,... 目录toppsuptimevmstatIOStatiotopslabtophtopdstatnmon

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

解读GC日志中的各项指标用法

《解读GC日志中的各项指标用法》:本文主要介绍GC日志中的各项指标用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基础 GC 日志格式(以 G1 为例)1. Minor GC 日志2. Full GC 日志二、关键指标解析1. GC 类型与触发原因2. 堆

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一