让你能专题

OCRmyPDF让你能搜索扫描版PDF文档

什么是 OCRmyPDF ? PDF 是存储和交换扫描文档的最佳格式。不幸的是,PDF 可能很难修改。OCRmyPDF 是一个 Python 应用程序和库,可以轻松地将图像处理和 OCR(可识别、可搜索的文本)应用于现有 PDF,通过向扫描的 PDF 文件添加 OCR 文本层,使你可以搜索或复制粘贴它们。 镜像下载 在群晖上以 Docker 方式安装。 在注册表中搜索 ocrmy