win7 selenium python 验证码识别 pytesser使用 安装Pillow、pytesser、tesseract-ocr

本文主要是介绍win7 selenium python 验证码识别 pytesser使用 安装Pillow、pytesser、tesseract-ocr,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. win7 Python 2.7.13 安装Pillow

Pillow‑4.2.1‑cp27‑cp27m‑win_amd64.whl下载地址
这里写图片描述

2. 安装Pillow
切换到下载目录
pip install Pillow-4.2.1-cp27-cp27m-win_amd64.whl

这里写图片描述

导入模块没有报错
>>> from PIL import Image
3. pytesser 安装使用

pytesser python2.7 验证码识别下载
在Python27\Lib\site-packages目录下新建pytesser,解压到这个目录,新建pytesser.pth,写入内容pytesser
这里写图片描述

修改pytesser\pytesser.py第行

#import Image
from PIL import Image
3.1 安装依赖tesseract-ocr

tesseract-1.03.tar.gz下载

解压tesseract-1.03.tar.gz 把tessdata目录复制到pytesser目录,替换\pytesser\tessdata目录

4. 测试验证
#coding:utf-8
from pytesser import *
im = Image.open(r"E:\tmp_photo\test2.png")
print image_to_string(im)
会报错,需要切换路径# coding:utf-8
# coding:cp936
from pytesser import *
import os
os.chdir(r'D:\Python27\Lib\site-packages\pytesser')             # 切换路径到pytesser 不然报错
im = Image.open(r'D:\Python27\Lib\site-packages\pytesser\fnord.tif')
# 测试图片,windows路径需要加r
print image_to_string(im)
5. 安装pytesseract
C:\Users\Administrator>pip install pytesseract
6.测试2

test.py在\Python27\Lib\site-packages\pytesser\路径下

#coding:utf-8
from PIL import Image
import pytesseract 
im = Image.open(r"E:\tmp_photo\test2.png")
vcode = pytesseract.image_to_string(im)
print (vcode)

结果不是很准确

参考:
1.Win7下安装Python图像处理库PIL、pytesser、tesseract进行验证码识别
2.python验证码识别

这篇关于win7 selenium python 验证码识别 pytesser使用 安装Pillow、pytesser、tesseract-ocr的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1003581

相关文章

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Maven如何手动安装依赖到本地仓库

《Maven如何手动安装依赖到本地仓库》:本文主要介绍Maven如何手动安装依赖到本地仓库问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、下载依赖二、安装 JAR 文件到本地仓库三、验证安装四、在项目中使用该依赖1、注意事项2、额外提示总结一、下载依赖登

一文带你搞懂Python中__init__.py到底是什么

《一文带你搞懂Python中__init__.py到底是什么》朋友们,今天我们来聊聊Python里一个低调却至关重要的文件——__init__.py,有些人可能听说过它是“包的标志”,也有人觉得它“没... 目录先搞懂 python 模块(module)Python 包(package)是啥?那么 __in

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》:本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么,可以干什么?3、Spr

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

《SpringBoot集成Quartz并使用Cron表达式实现定时任务》本篇文章介绍了如何在SpringBoot中集成Quartz进行定时任务调度,并通过Cron表达式控制任务... 目录前言1. 添加 Quartz 依赖2. 创建 Quartz 任务3. 配置 Quartz 任务调度4. 启动 Sprin

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文