基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了)

本文主要是介绍基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 摘要
  • 0 引言
  • 1 瓷砖图像处理
    • 1.1 图像采集
    • 1.2 图像处理
  • 2 基于深度学习的瓷砖色差分类算法设计
    • 2.1 数据预处理
    • 2.2 卷积神经网络的设计
    • 2.3 实验设计
  • 3 瓷砖色差分类平台的设计与实现

在这里插入图片描述

摘要

瓷砖是人类建筑不可或缺的一种材料,而瓷砖品质最重要的指标之一就是色差,一批瓷砖中色差越小,品级越高。目前企业主要是由熟练工人在特定的光照及距离条件下进行筛查,劳动强度大并且效率低,没有固定的判断标准。因此提出利用基于深度学习算法的视觉检测系统代替人工进行瓷砖色差分类,**首先,经过数字图像处理算法对采集的瓷砖图像进行预处理,将瓷砖本体从背景中分割出来 ;然后,利用卷积神经网络分别提取具有色差的两类瓷砖特征,通过监督学习实现瓷砖的色差分类 ;最后,设计了图形用户界面将上述所有图像处理算法及分类算法进行实现,开发可视化人机交互式操作和分类结果显示系统。**实验结果表明 :基于深度学习的视觉检测系统能够在瓷砖色差分类任务上实现准确分类,且分类效率高、分类结果可视化,具有重要的应用价值

0 引言

在这里插入图片描述
瓷砖的色差指瓷砖间的色泽差异,包含颜色与光泽间的总体差别。传统瓷砖色差分类工作主要通过熟练工人用肉眼对同一批烧制的同类瓷砖来进行差异化区分 [1],且工人们需在特定光线环境下和一定距离内进行观察与对比,从而确定瓷砖的等级与色号 [2]。这种检测工作对检测人员的经验要求高,且工作强度大。与此同时传统瓷砖行业通过人工对瓷砖进行分色,其精度与效率已不能满足愈发增长的生产规模和对瓷砖品级区分精度的要求。因此可以采取基于机器视觉的方法,以机器代替人眼来进行瓷砖色差分类工作。

基于深度学习 [3] 的机器视觉系统首先在生产线采集数字瓷砖图像,然后用数字图像处理算法对原始数据进行预处理 [4] 与图像分割,进而采用基于深度学习的卷积神经网络算法 [5] 实现对具有色差的瓷砖图像间的分类分色,最后通过图形用户界面将瓷砖图像预处理及图像分割结果以及分类结果可视化。最后,将该系统应用于实际的瓷砖生产线下的色差分类任务,证明算法的有效性。

1 瓷砖图像处理

1.1 图像采集

在这里插入图片描述

1.2 图像处理

在这里插入图片描述
在这里插入图片描述
降噪处理 :对于实地采集的瓷砖图像来说,一般图像尺寸巨大,噪声鲜有肉眼能直接看到的,但这些噪声都是实实在在存在的。常见的图像噪声包括高斯噪声 [7]、瑞利噪声、伽马噪声以及椒盐(脉冲)噪声,其中椒盐噪声其与图像信号强度对比明显,对图像
污染较大,因而在原始图像中较为明显 [8]。本文采用中值滤波算法去除数字瓷砖图像中的椒盐噪声,如图3(a) 所示。
在这里插入图片描述
灰度化处理 [9] :为了方便计算机程序对数字图像的操作,并且简化图像分割时的计算量,本文在图像分割前对降噪后的数字图像做灰度化处理,灰度化处理后如图 3(b) 所示。二值化处理 :为了更好地让瓷砖与原始图像的背景相区分,对瓷砖的灰度图做进一步的二值化处理。本文采用基于阈值的二值化方法,即设置一个阈值 n,将输入的灰度图像中灰度值 f(x,y) ≥ n的点的灰度值设置为 255,并将这些点称为对象点 [10] ;其他的点之灰度值则设置为 0,这些点称为背景点。该算法的计算公式如(1)所示 :
在这里插入图片描述
式中 f(x,y) 为灰度图像素值,g(x,y) 为二值化后的新图像像素值 [11]。由于原始图像的前景与背景对比较为强烈,本文选用双峰法确定阈值。首先计算出灰度化后的图像的灰度直方图,如图 3© 所示。将两个主要的波峰之间的最低谷作为前景与后景之间的分界线,由于摄像头位于同一位置,所有瓷砖的背景相同,且此处阈值的选取精度要求不高,还需要后续处理,因此选取 100 作为二值化处理时的阈值。二值化处理后的瓷砖图像如图3(d),可以看出图中的噪声明显减少,并且瓷砖整体更加清晰突出。

形态学操作 :利用形态学的开操作去除流水线背景中的支架结构对二值图中瓷砖图像的污染以及其他一些微小的噪声 [12]。实验效果如图 4 所示,此时的二值图中基本上只存在形状接近矩形的残缺瓷砖。

基于透视变换的图像分割 :将形态学运算后的图像用轮廓检测算法得到轮廓集,并求出其中面积最大一个轮廓作为瓷砖轮廓,之后求出瓷砖轮廓最小外接矩形作为最终需要从原始图像中分割出来的瓷砖图像本身。这里使用的最小外接矩形算法为用主成分分析法(PCA)求出轮廓的主方向向量,进而得到轮廓的长宽,最小外接矩形的轮廓(绿色)如图 5。
在这里插入图片描述

已求出瓷砖最小外接矩形,由这个矩形的四个角点坐标进行透视变换,使瓷砖图像投影为规整的矩形并平行于转换后完整图像的长宽,最后将此新矩形按角点坐标从转换后完整图像中裁剪出来,如图 6 所示。
在这里插入图片描述

2 基于深度学习的瓷砖色差分类算法设计

2.1 数据预处理

在这里插入图片描述
为了减小输入卷积神经网络的数据量,将分割好的图像的尺寸缩小为 227×227 的标准尺寸,并且由于数据集本身样本数量不多,需对数据集进行扩充,从而使训练出的模型具有更好的泛化能力,防止神经网络算法可能产生的过拟合现象,本文使用旋转和水平翻转作为数据增广的方法 [13]。为了训练神经网络模型并测试其分类精度,本文将数据集划分为训练集和测试集。并为了保证数据集中不同种类分布的均一性,从两个色号中分别选取 80% 作为训练集,用于网络的特征学习,将两种色号分别剩下的 20% 作为测试集用于测试每次训练完成之后的模型分类效果。

2.2 卷积神经网络的设计

在这里插入图片描述
ResNet[14] 的提出就是为了解决深度学习网络随着层数的加深而导致的梯度消失使得网络学习停滞的问题,其巧妙地运用恒等映射并通过快捷连接将其赋予上一模块的输入,从而使得每一层梯度不可能为零,使得每一层的参数可以不断地更新学习下去而不会停滞,使得超深层网络可以实现更加深入的学习 [15]

文 献 中 介 绍 了 18/34/50/101/152 等 多 种 层 数的 ResNet 模 型, 实 验 使 用 的 是 具 有 18 层 结 构 的ResNet18 模型 [16]。对网络进行训练的损失函数选择交叉熵函数,优化算法选择 Adam 算法,并在网络中间引入 Batch Normalization 层防止网络的过拟合 [16]。

2.3 实验设计

在这里插入图片描述
超参数是指与数据集无关,只与模型结构相关需在训练之前设定好的参数,主要包括数据集训练周期(epoch)、批量大小(batch size)、优化器的学习率(learning rate)[17]。在上述瓷砖数据集上设定训练周期为 50,批量大小恒定为 64,再分别设定大小为 0.01、0.001、0.0001 的初始学习率进行训练。

如图 7 至图 9 所示,在训练前期,前两者验证模型时准确率波动更大,分析认为这是由于样本数据集不够庞大,两种色差数据较为相似,较高的学习率导致网络的权值与偏置在优化过程中变化过大,导致输出的预测分布无法稳定,但随着损失值逐渐减小,训练集与测试集最终准确率都达到 100% 而实现收敛。

在这里插入图片描述

3 瓷砖色差分类平台的设计与实现

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
之后我会持续更新,如果喜欢我的文章,请记得一键三连哦,点赞关注收藏,你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力 !!!↖(▔▽▔)↗感谢支持!

这篇关于基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/535370

相关文章

linux生产者,消费者问题

pthread_cond_wait() :用于阻塞当前线程,等待别的线程使用pthread_cond_signal()或pthread_cond_broadcast来唤醒它。 pthread_cond_wait() 必须与pthread_mutex 配套使用。pthread_cond_wait()函数一进入wait状态就会自动release mutex。当其他线程通过pthread

51单片机学习记录———定时器

文章目录 前言一、定时器介绍二、STC89C52定时器资源三、定时器框图四、定时器模式五、定时器相关寄存器六、定时器练习 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、定时器介绍 定时器介绍:51单片机的定时器属于单片机的内部资源,其电路的连接和运转均在单片机内部完成。 定时器作用: 1.用于计数系统,可

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

2024.6.24 IDEA中文乱码问题(服务器 控制台 TOMcat)实测已解决

1.问题产生原因: 1.文件编码不一致:如果文件的编码方式与IDEA设置的编码方式不一致,就会产生乱码。确保文件和IDEA使用相同的编码,通常是UTF-8。2.IDEA设置问题:检查IDEA的全局编码设置和项目编码设置是否正确。3.终端或控制台编码问题:如果你在终端或控制台看到乱码,可能是终端的编码设置问题。确保终端使用的是支持你的文件的编码方式。 2.解决方案: 1.File -> S

电脑不小心删除的文件怎么恢复?4个必备恢复方法!

“刚刚在对电脑里的某些垃圾文件进行清理时,我一不小心误删了比较重要的数据。这些误删的数据还有机会恢复吗?希望大家帮帮我,非常感谢!” 在这个数字化飞速发展的时代,电脑早已成为我们日常生活和工作中不可或缺的一部分。然而,就像生活中的小插曲一样,有时我们可能会在不经意间犯下一些小错误,比如不小心删除了重要的文件。 当那份文件消失在眼前,仿佛被时间吞噬,我们不禁会心生焦虑。但别担心,就像每个问题