本文主要是介绍windows下安装tesserocr报错及解决办法——下载whl安装包,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一开始参考《Python3网络爬虫开发实战教程》进行安装,后来遇到一些小问题,现在将安装过程,遇到的问题以及解决方法总结一下:
在Windows下安装tessocr,首先需要下载tesseract,它为tesserocr提供了支持。
tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/
进入下载页面,可以看到有各种.exe文件的下载列表,这里可以选择下载3.0版本。示例为3.05版本。
其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本,例如可以选择下载tesseract-ocr-setup-3.05.01.exe。
下载完成后双击,此时会出现如图1-25所示的页面。
此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言。然后一路点击Next按钮即可。
接下来,再安装tesserocr即可,此时直接使用pip安装:
1 | pip3 install tesserocr pillow |
参考以上步骤,在安装tesseract时顺利,但是注意,要将tesseract的安装路径添加至两个环境变量,一个是path,一个是新建和环境变量TESSDATA_PREFIX,这样在cmd下运行tesseract -v可以查看到版本,证明安装成功。
坑:
安装tesserocr是一开始报错“缺少Microsoft visual studio 14.0”于是进行安装
继续pip,又报错,“缺少cl.exe”,发现是VS不会默认安装C++,于是又把C++装上
继续pip,有报错“cl.exe” failed with exit status 2,继续查找原因,好像还有另一种安装方法,下载tesserocr的whl文件,然后再pip
成功方法:
whl安装包下载链接:https://github.com/simonflueckiger/tesserocr-windows_build/releases
选择合适的版本下载 运行pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
终于成功安装tesserocr。
注意:cp36是指python的版本号,python要用3.6,不要用3.7,否则这种方法也报错,不要问我是怎么知道的o(╥﹏╥)o
备注:tesserocr和pilloww分开安装的,pip3 install pillow一次成功,主要在解决tesserocr的问题。
参考文章:《Python3网络爬虫开发实战教程》
这篇关于windows下安装tesserocr报错及解决办法——下载whl安装包的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!