对公转账上传凭证OCR测试

2023-10-30 02:10

本文主要是介绍对公转账上传凭证OCR测试,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、什么是OCR

OCR(Optical Character Recognition光学字符识别)是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字,简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。

  • OCR的一般过程为图像预处理特征提取文字区域检测文本识别与输出

  • OCR技术从文字类型的角度可分为印刷文字识别手写文字识别,从识别目的的角度可分为通用OCR专用OCR

  • 通用OCR是指对图片中所有文字和字符进行识别,并可返回文字对应位置信息。

  • 专用OCR是指对图片中的特定位置、特定信息进行识别提取,通常是针对票据、证件、牌照等制式票证图片。

二、什么是OCR测试

OCR模型是OCR功能的核心,经过大量图片及标注数据学习训练而成,在此基础上封装为OCR服务对外提供服务,通常以联机接口形式实现供其他系统调用。

OCR测试可分为两部分,一是对OCR模型识别的效果进行测试,判断其是否满足业务应用场景的要求,二是对OCR服务进行测试,包括功能测试性能测试以及安全测试等。

三、OCR测试案例分享

做B2B电商项目时涉及到对公转账,买家需上传支付凭证(银行转账电子回单)。未实现OCR功能前,买家不仅需要手动填写转账的相关信息还需上传凭证,操作起来容易出错且效率低,为了提质增效客户提出了增加OCR识别票据的需求,基于此测试人员需要测试该功能。

3.1 OCR测试步骤

  1. 收集大量支付凭证的样本。可以从现有的数据集中获取,也可以自己制作。要尽可能涵盖不同类型和格式的支付凭证,以提高OCR的鲁棒性。

  1. 选择OCR技术和工具。OCR技术包括传统的基于规则和模板的方法,以及基于深度学习的方法。你可以根据需求选择适合的技术和工具。常用的OCR工具包括Tesseract、OCRopus、Adobe Acrobat、ABBYY FineReader等。

  1. 对样本进行预处理。由于支付凭证的图片质量可能不一,需要进行预处理,例如去除噪声、调整亮度和对比度、裁剪、旋转等。

  1. 进行OCR测试。将样本图片输入到OCR工具中,让工具自动识别文本信息。可以通过手动校对OCR结果的方式来评估OCR的准确率。

  1. 优化OCR结果。根据测试结果,分析OCR错误的原因,进一步优化OCR模型和参数,以提高准确率。

需要注意的是,OCR技术虽然可以提高处理效率,但并不是100%准确,可能会出现识别错误的情况。因此,在使用OCR技术处理重要数据时,一定要进行人工审核和确认,确保数据的准确性。

3.2 OCR测试方案

支付凭证OCR功能测试的目标是确保OCR系统可以准确地识别支付凭证中的信息,包括付款人、收款人、付款金额等,并将识别结果转换为可编辑的文本格式。以下是一些可以考虑的测试方案:

  1. OCR准确性测试:收集包含不同类型和格式的支付凭证图片样本,例如PDF、JPG、PNG等,分别进行OCR测试,并将OCR结果与手动输入的正确数据进行比较,验证OCR识别准确率是否达到预期要求。

  1. 数据格式测试:测试系统是否能够正确地将识别结果转换为可编辑的文本格式,例如txt、doc等。

  1. 图像质量测试:测试系统是否能够正确地处理各种图像质量的支付凭证图片,包括模糊、倾斜、噪声等。

  1. 多语言支持测试:测试系统是否能够正确地识别不同语言的支付凭证信息,例如中文、英文、日文等。

  1. 性能测试:测试系统处理多个支付凭证的性能,包括处理时间、系统稳定性等。

  1. 异常处理测试:测试系统是否能够正确地处理各种异常情况,例如无法识别的字符、缺失信息、重复信息等。

测试完成后,需要对测试结果进行分析,确定系统的准确性、稳定性和性能是否符合预期要求,并及时修复和优化系统中存在的问题。同时,还需要对测试过程中发现的问题进行记录和归档,以便后续追溯和改进。

这篇关于对公转账上传凭证OCR测试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/304906

相关文章

SpringBoot中整合RabbitMQ(测试+部署上线最新完整)的过程

《SpringBoot中整合RabbitMQ(测试+部署上线最新完整)的过程》本文详细介绍了如何在虚拟机和宝塔面板中安装RabbitMQ,并使用Java代码实现消息的发送和接收,通过异步通讯,可以优化... 目录一、RabbitMQ安装二、启动RabbitMQ三、javascript编写Java代码1、引入

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

Java文件上传的多种实现方式

《Java文件上传的多种实现方式》文章主要介绍了文件上传接收接口的使用方法,包括获取文件信息、创建文件夹、保存文件到本地的两种方法,以及如何使用Postman进行接口调用... 目录Java文件上传的多方式1.文件上传接收文件接口2.接口主要内容部分3.postman接口调用总结Java文件上传的多方式1

使用Python实现大文件切片上传及断点续传的方法

《使用Python实现大文件切片上传及断点续传的方法》本文介绍了使用Python实现大文件切片上传及断点续传的方法,包括功能模块划分(获取上传文件接口状态、临时文件夹状态信息、切片上传、切片合并)、整... 目录概要整体架构流程技术细节获取上传文件状态接口获取临时文件夹状态信息接口切片上传功能文件合并功能小

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

Spring MVC 图片上传

引入需要的包 <dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.1</version></dependency><dependency><groupId>commons-io</groupId><artifactId>commons-