各类卡证矫正

2024-08-22 05:28
文章标签 矫正 各类 卡证

本文主要是介绍各类卡证矫正,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

卡证矫正

      • 卡证矫正和文档矫正
      • 写在前面
      • 环境安装
      • torch模型转成openvino
      • 模型测试
          • 使用pytorch测试
          • 使用openvino测试
          • 速度对比
      • 模型训练
          • 数据准备
          • 模型训练
      • 模型效果
      • 参考文献

卡证矫正和文档矫正

写在前面

模型和思路来源: 读光-票证检测矫正模型,试了下效果不错,但是因为没开源训练模块,索性自己撸了下,数据加载dataload模块其实还是有优化空间的,比如我没对训练图片做光照,加噪等数据扩增操作。

环境安装

python环境: 3.8.5及以上

pip install -r requirements.txt

torch模型转成openvino

配置好config.py文件,如下所示:
在这里插入图片描述

运行:

python infer.py

模型测试

使用pytorch测试

配置好config.py文件,如下:
在这里插入图片描述

运行:

python infer.py
使用openvino测试

配置好config.py文件,如下:
在这里插入图片描述

运行:

python infer.py
速度对比

测试环境:V100(16G), 18CPU

在CPU上跑,openvino的加速还是比较明显的, 尤其是在linux上,加速特别明显。时间对比如下:

方法时间(s)
pytorch(GPU)0.04027719497680664
pytorch(CPU)0.5020792007446289
openvino0.13443317413330078

模型训练

数据准备

按如下结构准备数据集

images
│   1.jpg
│   2.jpg   
│		...
labels
│   1.txt
│   2.txt
│		...

label的标注格式是:

x1, y1, x2, y2, px1, py1, px2, py2, px3, py3, px4, py4, angle_class, type

x1,y1,x2,y2 是目标的矩形框的左上角点和右下角点坐标。
px1, py1, px2, py2, px3, py3, px4, py4是目标的四个角点。
angle_class是四个角度的分类,表示将图片顺时针旋转(0, 90, 180, 270),值分别为 0,1,2,3。
type表示文件的类别,比如读光-票证检测矫正模型中将文件分为2类,复印件和非复印件,你也可以根据自己的需要设置分类。

模型训练

配置好config.py文件:
在这里插入图片描述

其他参数可根据需要自己调整

运行

python train.py

模型效果

每张图第一张为原图,右边为矫正的结果,这里直接加载的读光的模型,具体也可以去读光-票证检测矫正模型自己去试试,效果还是很不错的。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考文献

https://modelscope.cn/models/iic/cv_resnet18_card_correction
https://github.com/modelscope/modelscope
https://github.com/xingyizhou/CenterNet

这篇关于各类卡证矫正的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095359

相关文章

菲律宾诈骗,请各位华人朋友警惕各类诈骗。

骗子招聘类型:程序开发、客服、财务、销售总管、打字员等 如果有人用高薪、好的工作环境来你出国工作。要小心注意!因为这些骗子是成群结伴的! 只要你进入一个菲律宾的群,不管什么类型的群都有这些骗子团伙。基本上是他们控制的! 天天在群里有工作的信息,工作信息都是非常诱惑人的。例如招“打字员”、“客服”、“程序员”……各种信息都有。只要你提交简历了,他会根据你的简历判断你这个人如何。所谓的心理战嘛!

Android开发中遇到的各类问题汇总

Q1: Error:The number of method references in a .dex file cannot exceed 64K.Learn how to resolve this issue at https://developer.android.com/tools/building/multidex.html 应用中的Dex 文件方法数超过了最大值65536的上限

168套Android项目源码和120多套各类别小程序模板源码

Android项目源码168套 各行各业android源码 大学生毕业设计android项目源码 资源目录如下: [开源项目]Android_炫酷的3D音乐播放器_各种特效OpenGL.exe 【eoeAndroid特刊】第15期: Android多媒体.exe 【eoeAndroid特刊】第18期: Android音视频的编解码.exe ActivityGroup + GridView

各类AI工具编程能力测试对比

各类AI工具编程能力对比 现在各类AI工具火爆,擅长各类问题解决,闲来无事,验证下各类AI工具的编程能力如何。问题:c++ 实现杨辉三角,并main函数测试 kimi 对话窗口输入问题,得到了c++的完整程序: #include <iostream>#include <vector>// 函数用于生成杨辉三角的前n行void generatePascalTriangle(int n)

图像处理:基于直方图矫正的图像色彩均衡

from itertools import chainimport cv2import osimport numpy as npimport datetimeclass BrightnessBalance:def __init__(self):passdef arrayToHist(self,gray):'''计算灰度直方图,并归一化:param gray_path::return:'''

广泛运用于各类恶劣环境的三防平板

乐凡信息三防平板R08R,拥有8英寸屏幕,10:16宽屏大视野,1200*1920高分辨率,带来还原画面本真的清晰度。内置Rockchip 3588处理器操作系统可选配安卓、银河麒麟、元心、开源鸿蒙。适合在现今复杂的工作环境中进行所需的多任务作业。128GB/256GB存储为多应用切换运行提供更多可行空间。 在现代工作环境中,稳定的通讯是确保工作顺利进行的关键。乐凡信息R08R三防平板拥有覆

Pyqt5高级技巧2:Tab顺序、伙伴快捷键、各类常用控件的事件(含基础Demo)

一、编辑Tab顺序         点击下面这个按钮后,按控件调整tab的顺序,设置好后,鼠标聚焦在输入框1中,按一下tab鼠标聚焦会跳到下一个输入框中         编辑tab结束后,按下面这个按钮重新返回页面布局   二、编辑伙伴  (删除伙伴的方法:框选-右键选择全部-删除) 三、设置快捷键(仅MainWindow可用)         例如我菜单(MainWind

JS中常用的各类正则表达式以及使用方式收录

效果上建议查看下面第二部分,如果自定义多变情况,建议使用第一部分;     选择合适自己的加入自己的js中 第一部分: 适用于更适合自己需求的自定义校验方式  特殊字符判断正则表达式         var regEn = /[`~!@#$%^&*()_+<>?:"{},.\/;'[\]]/im;         var regCn = /[·!#¥():;“”‘、,|《。》?、

dubbo:巧用dubbo的SPI机制实现各类定制功能(六)

文章目录 0. 引言1. dubbo SPI机制1.1 什么是SPI1.2 java的SPI机制1.3 dubbo的SPI机制1.4 dubbo的SPI使用 2. 基于SPI实现定制功能2.1 dubbo的上下文参数2.2 实现权限校验、参数日志等功能2.3 dubbo spi条件激活机制@Activate 3. dubbo的SPI与java的SPI有什么区别4. 总结 0. 引言

本地生活推广攻略!各类本地推软件使用效果全曝光!

随着本地生活下半场的到来,各类入局者之间流量竞争逐渐进入“白热化”阶段,以本地生活本地推为首的各种推广工具的作用日益显现,并成为了本地生活服务商和本地生活商家等入局者获得流量的重要法宝,本地生活本地推软件有哪些等相关问题更是因此成为了他们的重点关注对象。 本期,我们将详细介绍当前市面上本地生活本地推软件的种类和使用效果,以帮助大家有针对性地选择和使用这些推广工具,实现降低使用成本的同时,获得提高