VBA调用Office的MODI组件识别图片中的文字

2024-08-23 09:04

本文主要是介绍VBA调用Office的MODI组件识别图片中的文字,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

      Microsoft Office Document Imaging (MODI)是Office 2003-2007版本中的一个利用OCR(Optical Character Recognition 光学字符识别)技术识别图像中的文字并转换为文本的一个组件。在VBA中使用该组件需要在“工具-引用”中将其设置为“可使用的引用”,如下图:

VBA识别代码如下:

Private Sub Select_JPG_File()SelectedFilePath="D:\1.jpg"OCRImageFile (SelectedFilePath)MsgBox "识别成功!", vbOKOnly, "提示"
End Sub' 利用微软MODI控件,实现OCR文字识别。
' 1. 需要安装微软MODI控件,可以通过Office原装安装光盘添加工具里面OCR组件。
' 2. 点击“开发工具->Visual Basic->工具->引用->Microsoft Office Document Imaging 12.0 Type Library”Function OCRImageFile(ByVal ImageFile As String)Dim objDocument As New MODI.DocumentDim objImage As New MODI.ImageobjDocument.Create ImageFileSet objImage = objDocument.Images.Item(0)On Error Resume NextobjImage.OCR miLANG_CHINESE_SIMPLIFIED, False, False    ' 以中文模式识别,并禁止自动检测If Err.Number = 0 Then'MsgBox objImage.Layout.Text  ' 显示识别的文本Sheets("Sheet1").Cells(1, 1) = objImage.Layout.text    ' 将识别结果写入单元格ElseMsgBox Err.DescriptionEnd IfobjDocument.Close FalseSet objDocument = Nothing
End Function

       虽然有高手提取了该组件的独立安装包,并设法部署在Office2010版本中使用,但经过笔者反复试验,其成功率非常低,仅在Office2010精简版中部署成功过,在Office2010正版安装环境中从未成功过,总是会造成Office应用软件直接崩溃,并提示错误信息如下:

问题签名:
  问题事件名称:    APPCRASH
  应用程序名:    EXCEL.EXE
  应用程序版本:    14.0.4756.1000
  应用程序时间戳:    4b9c08e8
  故障模块名称:    KERNELBASE.dll
  故障模块版本:    6.1.7601.24545
  故障模块时间戳:    5e0eb7d0
  异常代码:    c06d007f
  异常偏移:    0000845d
  OS 版本:    6.1.7601.2.1.0.256.48
  区域设置 ID:    2052

有关该问题的其他信息:
  LCID:    2052
  skulcid:    2052

        由于MODI组件很难在Office2010以上版本中成功部署,且其对图片文字的识别能力较差,准确率又不高,建议改用OneNote组件来代替它。OneNote是Office中的一个电子笔记本软件,它支持使用触笔、声音或视频创建笔记,且能够直接识别和复制图片中的文字,并粘贴到其他文档中进行编辑,非常方便,且识别率高,如下图:

这篇关于VBA调用Office的MODI组件识别图片中的文字的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098945

相关文章

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

利用Python脚本实现批量将图片转换为WebP格式

《利用Python脚本实现批量将图片转换为WebP格式》Python语言的简洁语法和库支持使其成为图像处理的理想选择,本文将介绍如何利用Python实现批量将图片转换为WebP格式的脚本,WebP作为... 目录简介1. python在图像处理中的应用2. WebP格式的原理和优势2.1 WebP格式与传统

python如何调用java的jar包

《python如何调用java的jar包》这篇文章主要为大家详细介绍了python如何调用java的jar包,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录一、安装包二、使用步骤三、代码演示四、自己写一个jar包五、打包步骤六、方法补充一、安装包pip3 install

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个