本文主要是介绍java实现ocr功能(Tesseract OCR),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、pom文件中引入依赖
<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version>
</dependency>
2、下载语言库文件(不要放到resources下,可以放到项目所在目录下,在博主的主页资源菜单下可下载,也可自行在网上找资源下载)
参考目录结构(也可以放其他位置,只要代码能找到就行):
3、代码:
@PostMapping("/ocr2")
@ApiOperationSupport(order = 3)
@ApiOperation(value = "识别图像2", notes = "上传图像")
public R<String> ocr2(@RequestBody MultipartFile file) throws Exception {Tesseract instance = new Tesseract();// 设置Tesseract的语言库路径ClassPathResource classPathResource = new ClassPathResource("/tessdata");String tessDataPath = classPathResource.getPath();instance.setDatapath(tessDataPath);instance.setLanguage("chi_sim");String ocrResult = "";File tfile = File.createTempFile("tempfile", file.getOriginalFilename());file.transferTo(tfile);ocrResult = instance.doOCR(tfile);return R.data(ocrResult);
}
4、测试接口(只能上传jpg文件)
测试时使用的图片
这篇关于java实现ocr功能(Tesseract OCR)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!