本文主要是介绍msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。
思源笔记 > 使用指南 > 资源文件 中有一些说明。
msys2安装的话:pacman -S ***tesseract***
, 包括:软件本体&语言支持包
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng
设置环境变量:
- PATH: tesseract.exe所在文件夹,比如
C:\softwares\msys2\msys64\ucrt64\bin
- TESSDATA_PREFIX:语言包所在文件夹,比如
C:\softwares\msys2\ucrt64\share\tessdata
不设置这个可能导致ocr乱码
存在的问题:
- 有时ocr不准
- 有时不对某些图片执行ocr
这篇关于msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!