本文主要是介绍使用Tesseract-ocr识别验证码,暴力破解某高校学生登录系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
使用Tesseract-ocr识别验证码,暴力破解某高校学生登录系统
声明:本文章仅限于技术交流,严禁用于非法途径,转载需联系我
文章用到的工具、还有项目放在百度云盘,地址在文章最后面
使用到了技术点:
1.Tesseract-ocr本地安装(用于后面的字库训练)
2.Tesseract-ocr对应java开源的tess4j使用
3.使用jTessBoxEditor训练字库(提高验证码识别率)
4.模拟登录,随机密码进行尝试破解。
一、Tesseract-ocr本地安装(用于后面的字库训练)
介绍:Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为3.02.
项目地址为:https://github.com/tesseract-ocr
1、下载安装Tesseract-OCR引擎(3.0版本+才支持中文识别)
tesseract-ocr-setup-3.02.exe
下载完后进行安装,默认情况下安装程序会给你配置系统环境变量,以指向安装目录(之后可以通过DOS界面在任意目录运行tesseract)。安装完成后目录如下:
附录:
tessdata 目录存放的是语言字库文件,和在命令行界面中可能用到的参数所对应的文件. 这个安装程序默认包含了英文字库。
如果想能识别中文,可以到http://code.google.com/p/tesseract-ocr/downloads/list下载对应的语言的字库文件.
简体中文字库文件下载地址为:http://tesseract-ocr.googlecode.com/files/chi_sim.traineddata.gz 下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。
注意:语言字库文件很大,而且图片的识别率是很低的,要提高破解率的话只能进行针对性的字库训练(后面会讲到的)
2.使用Tesseract-ocr识别
打开Dos命令输入tesseract -v,如下图:
这篇关于使用Tesseract-ocr识别验证码,暴力破解某高校学生登录系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!