PIL + pytesseract 玩转验证码图片识别

2024-05-23 21:32

本文主要是介绍PIL + pytesseract 玩转验证码图片识别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

有时候我们在模拟登陆的时候会遇到图片验证码,如果是简单的数字字母验证码,可以通过图片识别的方法识别验证码,再发送post请求模拟登陆。

验证码图片的爬取可以通过找到某验证码的url,通过python的requests模块get图片资源,这里不做过多介绍。

我们在本地尝试完成验证码图片的识别。本地已经安装Anaconda3,使用Python3。其下均在Anaconda环境进行操作。

1.安装PIL模块和pytesseract模块

PIL是python的一个图像处理标准库,pytesseract是免费的ocr识别库。在Anaconda Prompt中安装两个模块。

pip install PIL
pip install pytesseract

2.安装识别引擎tesseract-ocr

tesseract-ocr是OCR文字识别引擎,需要在本机进行安装。

下载后傻瓜式安装即可,这里可以将tesseract.exe加入环境变量,如不加入,后面需要修改Anaconda安装目录D:\Anaconda3\Lib\site-packages\pytesseract\pytesseract.py中的tesseract_cmd路径。

tesseract_cmd = 'D:/Tesseract-OCR/tesseract.exe'
3.图片识别
import pytesseract
from PIL import Image
import numpy as nppath='D:/vc_code.png'
imageObject = Image.open(path) # 传入保存的图片路径
print(imageObject)
imageObject = np.array(imageObject.convert('L'), 'f')  #图片灰度处理
result = pytesseract.image_to_string(imageObject)
print("验证码识别结果:", result)
4.中文识别

在’D:\Tesseract-OCR’路径下运行cmd,输入命令tesseract --list-langs查看支持的语言,未安装有chi_sim中文数据包,需要手动安装。下载解压后’D:\Tesseract-OCR\tessdata’目录下即可。
在这里插入图片描述
使用方法:

result = pytesseract.image_to_string(imageObject, lang='chi_sim')

这篇关于PIL + pytesseract 玩转验证码图片识别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/996464

相关文章

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标了,所以就需要看下mtk的camera2的相关横屏保存图片功能, 如何实现实现横屏保存图片功能 如图所示: 2.mtk

Spring 验证码(kaptcha)

首先引入需要的jar包: <dependency><groupId>com.github.axet</groupId><artifactId>kaptcha</artifactId><version>0.0.9</version></dependency> 配置验证码相关设置: <bean id="captchaProducer" class="com.

Spring MVC 图片上传

引入需要的包 <dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.1</version></dependency><dependency><groupId>commons-io</groupId><artifactId>commons-

Prompt - 将图片的表格转换成Markdown

Prompt - 将图片的表格转换成Markdown 0. 引言1. 提示词2. 原始版本 0. 引言 最近尝试将图片中的表格转换成Markdown格式,需要不断条件和优化提示词。记录一下调整好的提示词,以后在继续优化迭代。 1. 提示词 英文版本: You are an AI assistant tasked with extracting the content of

研究人员在RSA大会上演示利用恶意JPEG图片入侵企业内网

安全研究人员Marcus Murray在正在旧金山举行的RSA大会上公布了一种利用恶意JPEG图片入侵企业网络内部Windows服务器的新方法。  攻击流程及漏洞分析 最近,安全专家兼渗透测试员Marcus Murray发现了一种利用恶意JPEG图片来攻击Windows服务器的新方法,利用该方法还可以在目标网络中进行特权提升。几天前,在旧金山举行的RSA大会上,该Marcus现场展示了攻击流程,

恶意PNG:隐藏在图片中的“恶魔”

&lt;img src=&quot;https://i-blog.csdnimg.cn/blog_migrate/bffb187dc3546c6c5c6b8aa18b34b962.jpeg&quot; title=&quot;214201hhuuhubsuyuukbfy_meitu_1_meitu_2.jpg&quot;/&gt;&lt;/strong&gt;&lt;/span&gt;&lt;

秒变高手:玩转CentOS 7软件更换的方法大全

在 CentOS 7 中更换软件源可以通过以下步骤完成。更换源可以加快软件包的下载速度,特别是当默认源速度较慢时。以下是详细步骤: 前言 为了帮助您解决在使用CentOS 7安装不了软件速度慢的问题,我们推出了这份由浪浪云赞助的教程——“CentOS7如何更换软件源加快下载速度”。 浪浪云,以他们卓越的弹性计算、云存储和网络服务受到广泛好评,他们的支持和帮助使得我们可以将最前沿的技术知识分

PHP抓取网站图片脚本

方法一: <?phpheader("Content-type:image/jpeg"); class download_image{function read_url($str) { $file=fopen($str,"r");$result = ''; while(!feof($file)) { $result.=fgets($file,9999); } fclose($file); re