openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读

本文主要是介绍openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🧡💛💚💙💜OpenCV实战系列总目录

有任何问题欢迎在下面留言
本篇文章的代码运行界面均在Pycharm中进行
本篇文章配套的代码资源已经上传

上篇内容:
openCV实战-系列教程11:文档扫描OCR识别上(图像轮廓/模版匹配)项目实战、源码解读
中篇内容:
openCV实战-系列教程13:文档扫描OCR识别中(图像轮廓/模版匹配)项目实战、源码解读

7、pytesseract文字识别

7.1 安装python工具包

上篇内容中,我们是安装了tesseract.exe,我们需要在代码中实现这个效果,那么就需要在命令行中安装pytesseract,

pip install pytesseract

没有任何要求

7.2 代码解读

preprocess = 'blur' #thresh
image = cv2.imread('scan.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  1. 指定是滤波还是二值
  2. 读入图像
  3. 灰度
if preprocess == "thresh":gray = cv2.threshold(gray, 0, 255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
if preprocess == "blur":gray = cv2.medianBlur(gray, 3)

这段代码包含两个if语句,但是只会执行一个
是判断选择二值处理还是滤波处理,然后执行语句分别对应的是各自的操作

filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)
  1. os.getpid(),此方法返回一个整数值,该整数值表示当前进程的进程ID。此方法的返回类型为“ int”类,不需要参数,os.getpid()的返回值,充当占位符,filename最后保存了文件名的字符串
  2. 使用filename作为文件名,gray作为图像数据保存图像
text = pytesseract.image_to_string(Image.open(filename))
print(text)
os.remove(filename)
cv2.imshow("Image", image)
cv2.imshow("Output", gray)
cv2.waitKey(0)    
  1. 使用
  2. 打印文本
  3. 打印原始图像
  4. 打印输出图像
  5. 关闭窗口

打印结果:

x x ee eR OK OK Oe KR OK KK

WHOLE FOODS MARKET - WESTPORT, CT 06880 399 POST RD WEST - (203)
227-6858

6b $65 365

365

F

BACUN LS BACON LS BACON LS BACUN LS BROTH CHIL LOUR ALMUND

CHKN BRST BNLSS SK

HEAVY CREAM

BALSMC REDUCT

BEEF

GRND 85/15

JUICE COF CASHEW -. DOCS PINT ORGAWEL HNY ALMOND BUTTER

eunene TAX

.00 BAL

NP hiP NP NP NP NP NP NP

nm

8、bug记录

C:\Users\18333\anaconda3\envs\pytorch\python.exe A:\2_gupao\ocr\test.py
Traceback (most recent call last):
  File"
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py", line 255, in run_tesseract
    proc = subprocess.Popen(cmd_args, **subprocess_args())
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\subprocess.py”, line 858, in init
    self._execute_child(args, executable, preexec_fn, close_fds,
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\subprocess.py”, line 1327, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File “
A:\2_gupao\ocr\test.py”, line 27, in module
    text = pytesseract.image_to_string(Image.open(filename))
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 423, in image_to_string
    return {
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 426, in lambda
    Output.STRING: lambda: run_and_get_output(*args),
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 288, in run_and_get_output
    run_tesseract(**kwargs)
  File “
C:\Users\18333\anaconda3\envs\pytorch\lib\site-packages\pytesseract\pytesseract.py”, line 260, in run_tesseract
    raise TesseractNotFoundError()
pytesseract. pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH. See README file for more information.

进程已结束,退出代码为 1

运行的时候出现这个bug,打开以下文件目录:

你的anaconda安装目录\anaconda3\envs\pytorch\Lib\site-packages\pytesseract

注意这里,第一每个人的anaconda安装目录不一样,第二,每个人的python环境也不一样,这里

anaconda3\envs\pytorch\Lib\site-packages\pytesseract

如果实在base环境中就是直接是

anaconda3\Lib\site-packages\pytesseract

我的是安装在了一个名为pytorch的python环境中
打开pytesseract.py文件,将这行代码:

tesseract_cmd = 'tesseract'

改为:

tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'

你直接复制过来的地址是这个斜杠\,应该改成这个/
这里每个人的tesseract的安装地址也不同,解决完这些应该就能运行了😇😇😇
如果还是不能运行,有可能是你的环境变量出错了,检查一下,一共有四处
如果还是不能运行!!!!!
建议更换tesseract.exe的版本,下载地址,推荐选择5.0.1版本,之前干的再干一遍。
还是不行的话😭😭😭
来加v找我给你debug:yzy-416

上篇内容:
openCV实战-系列教程11:文档扫描OCR识别上(图像轮廓/模版匹配)项目实战、源码解读
中篇内容:
openCV实战-系列教程13:文档扫描OCR识别中(图像轮廓/模版匹配)项目实战、源码解读

这篇关于openCV实战-系列教程14:文档扫描OCR识别下(灰度/高斯滤波/边缘检测/轮廓检测/透视变换/tesseract OCR/pytesseract/OCR文字识别)项目实战、源码解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/627066

相关文章

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

MyBatis分页查询实战案例完整流程

《MyBatis分页查询实战案例完整流程》MyBatis是一个强大的Java持久层框架,支持自定义SQL和高级映射,本案例以员工工资信息管理为例,详细讲解如何在IDEA中使用MyBatis结合Page... 目录1. MyBATis框架简介2. 分页查询原理与应用场景2.1 分页查询的基本原理2.1.1 分

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

使用Python实现Word文档的自动化对比方案

《使用Python实现Word文档的自动化对比方案》我们经常需要比较两个Word文档的版本差异,无论是合同修订、论文修改还是代码文档更新,人工比对不仅效率低下,还容易遗漏关键改动,下面通过一个实际案例... 目录引言一、使用python-docx库解析文档结构二、使用difflib进行差异比对三、高级对比方

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

基于C#实现PDF转图片的详细教程

《基于C#实现PDF转图片的详细教程》在数字化办公场景中,PDF文件的可视化处理需求日益增长,本文将围绕Spire.PDFfor.NET这一工具,详解如何通过C#将PDF转换为JPG、PNG等主流图片... 目录引言一、组件部署二、快速入门:PDF 转图片的核心 C# 代码三、分辨率设置 - 清晰度的决定因