python视觉-特例仪表识别案例

2023-10-17 00:48

本文主要是介绍python视觉-特例仪表识别案例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

项目文件下载地址

一、逻辑流程

1.使用检测模型提取图中的仪表
2.使用分割模型对仪表的刻度进行语义分割
3.使用检测模型提取仪表的指针
4.对各个模型的结果进行计算

二、步骤

1.提取仪表
(1)使用yolo5s进行训练200 epochs
(2)使用模型的结果对原图进行裁剪,得到仪表
2.语义分割
(1)使用deeplab对仪表的刻度条进行分割训练,训练结果在100 epoch时最佳
(2)对模型的结果进行点拟合
a.对mask图进行27* 27膨胀
b.对膨胀图进行fitEllipse椭圆拟合
c.得到椭圆的圆心(XC, YC)和长轴(R )
d.制作拟椭圆的边mask图
e.将边的mask图与膨胀图进行交运算,得到刻度的拟合曲线
f.根据卷积原理,定义3*3的卷积核遍历上一步得到的图,找到曲线的两个端点(corner_1, corner_2)
g.计算拟合曲线的长度 (length)
h.返回拟合曲线上的所有点坐标(point_axis)和XC, YC, R, corner_1, corner_2, length
在这里插入图片描述
3.提取指针
(1)采用yolo5x进行训练,最佳结果出现在90-100 epoch
(2)根据模型返回的结果在仪表图上进行掩膜处理,只保留指针部分
(3)对mask图进行OTSU二值处理并使用Canny算子检测边缘
(4)对边缘图进行HoughLine检测,以像素为长度单位、Π/360为弧度单位, 得到最长线段的端点(pt1, pt2)
在这里插入图片描述
5. 计算
(1)定位指针指向的刻度位置
a.遍历point_axis,找到min(dis(pt, pt1), dis(pt, pt2)),pt即为指针指向刻度的点 corner
(2)计算读数比例
a.圆心角计算法
i.计算刻度拟合线的圆心(XC, YC)与拟合曲线端点(corner_1, corner_2)、交点 corner的线段长度:line_C_1, line_C_2, line_C_c, line_c_1, line_c_2
ii.根据余弦定理计算出三个圆心角夹角:theta_1_C_c, theta_2_C_c, theta_1_C_2
iii.找到theta_1_C_c, theta_2_C_c的最小值设为theta_s, 最大值设为theta_m
iv.计算对应的theta_s, theta_m两边的偏移量bias_s, bias_m
v.计算规则:(2 * pi - theta_s - theta_1_C_2 - bias_s) / (2 * pi - theta_1_C_2 - bias_s - bias_m)

在这里插入图片描述
b.边计算法
i.计算圆心(XC,YC)与pt1、pt2的斜率k_1_C、k_2_C
ii.定义两点式直线方程(x-x1)/(x2-x1) = (y-y1)/(y2-y1)
iii.采用二乘法原理,判定点在直线的上方还是下方
iv.当k_1_C、k_2_C < 0时,取直线下方的点;反之取上方的点。得到points_1_C、 points_2_C【点集合】
v.对与圆心与corner的直线,全部取直线下方的点points_c_C【点集合】
vi.计算规则 1 - len(points_1_C & points_2_C & points_c_C) / length
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

如果上述a、b两种方法计算结果误差在0.02之间,则取两者的平均值做为最终结果;反之,取最大值作为最终结果

三、问题总结

1.Deeplab给的官方文档说该网络结果适用于小目标的分割,但是实际在语义分割中对指针进行分割时,分割结果几乎为0原因:
A、该次仪表的指针非常规的指针,属于及其特例的情况,指针与表盘中间的空洞在分割特征上比较类似
B、Deeplab卷积尺度比较深,在遇到这种情况的时候,特征直接被卷积掉了,如果是常规指针,是可以分割的
C、拟合很慢,分割出现空洞和边缘不精确问题。从网络层面上,需要添加空间注意力和通道注意力机制。但是本次项目,我采用的是对结果层面的处理机制,没引入注意力机制。
相较于Unet、Segnet、FCN等网络,Deeplab对个体进行区域分割效果更好,前三者适合对单体进行分割。对于常规的仪表指针,使用Unet即可进行精确分割

2.指针提取时,由于分割模型无法分割,所有就使用yolo提取,yolo的双注意力机制比较先进,因此可以准确进行目标识别。
然后对提取的目标区域进行光学处理。最开始采用的方法是对二值图进行点的直线拟合,通过拟合线代表指针,经过测试发现实际情况中,光线、污渍都会影响二值图,从而会影响拟合的趋势走向。
所有舍弃了拟合的方法,对二值图进行轮廓检测,通过Hough变换去寻找接近的线段,经过测试组图像测试,指针定位正常

3.刻度拟合模型分割出来的mask图无法直接用于计算,需要得到每个刻度的位置信息才可进行计算。而且,一些mask图无法分割出详细刻度,只能得到一个整体的刻度mask,所以不能用刻度计算。最好的办法就是将mask图用一条曲线替代了,将这条曲线作为刻度。
一开始采用的方法是 最小二乘法进行圆拟合,通过拟合一个圆,用一段圆弧代替刻度,经过测试,实际很多图是倾斜的、畸变的,计算出来的结果误差都比较高,最大的误差能超过3个小刻度。
所以采用了弥补方案:在计算开始之前,对检测出的仪表图进行透视变换矫正,使用矫正的图去计算。测试过程中发现,图的畸变率不一样,透视变换过程中的转置矩阵和平移矩阵需要不停的调整,适用性太低。
最终就选择了比较粗暴的办法,直接对mask图进行椭圆拟合,为了防止拟合出现偏差,对mask采用比较夸张的内核进行膨胀,即27*27。这样也就填补了空洞。用拟合出来的椭圆,可以理解成也是一个mask图,和模型结果的这个mask图进行交运算,就得到了一段弧,这段弧即可比较理想的代替刻度线。

4.定位对端点、交点进行点定位,需要使用角点检测算子。尝试过了opencv自带的Harris、sobel算子,检测的结果太杂,做筛选太复杂。因此此处针对本项目做了个特例的角点检测,通过3*3卷积核进行遍历,我的目标角点特征只有一种:在这里插入图片描述
5.即便使用了过量膨胀,有时候拟合的曲线还是会存在不连续的情况,是由空洞、边缘毛凸产生,这种情况还是会导致出现多个角点,针对角点的过滤规则,目前是将角点的检测区域固定在图像下方(场景图都是正向的),然后通过仪表的物理信息设定过滤规则
由于边缘毛凸产生的拟合不连续:在这里插入图片描述
这个问题还在持续解决中!!!
6.Mask被过量膨胀过,因此需要对最终结果减去误差。误差主要就来自膨胀这块,最终选定的控制规则是使用圆心与曲线端点的距离作为等腰三角形的两腰,卷积核/2作为底,三角形的顶角就是偏移量。对边计算法,偏移量则直接减去卷积核/2

这篇关于python视觉-特例仪表识别案例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/221818

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学