图片识别为什么大部分都将彩色图像灰度化

2024-06-19 09:38

本文主要是介绍图片识别为什么大部分都将彩色图像灰度化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

对于图片识别灰度化的原因这里根据自己的理解和网上看到的一些自己觉得合理的解释这里做个大概总结,如有错误欢迎大神们打脸指正


最直接的原因:减少计算量

包含色彩的图片,特征量,计算量会成指数倍数增加
比如一个点,灰度的话,就256个维度而已,但是如果算上RGB色彩的话,那就是1600万以上维度。然后再相互组合,或者说找梯度,可以想象看计算量有多大

但是好在就算是全色盲也可以分辨物体,对于一般的物体识别灰度图就够了,于是就先降维(灰度)来计算

不过一直觉得不是每个应用都需要把彩色变成灰度,毕竟颜色是一个比较有用的特征

首先 灰度化之后失去了什么,又得到了什么

  • 灰度化之后颜色信息丢失,所以一般基于color-based算法就不能灰度化
  • 但是很多简单的识别算法对于颜色的依赖性不强,hand-craft特征更多关注边缘梯度信息
    灰度化之后矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留
  • 工程中很多应用加上color信息之后鲁棒性会下降

怎么选择就是在performance和efficiency之间做一个权衡罢了


是否选择灰度图主要需要权衡以下几点:

1. 梯度

我们识别物体,最关键的因素是梯度(现在很多的特征提取HOG,LBP,SIFT等等本质都是梯度的统计信息),梯度意味着边缘,这是最本质的部分,而计算梯度,最常用就是灰度图。颜色本身,非常容易受到光照等因素的影响,同类的物体颜色有很多变化,所以颜色本身难以提供关键信息

2.计算量

灰度化其实就是将图片降维,这样就能大大降低计算量

对于设备的计算能力和识别速度的需求是你取舍的一个关键点

有时候灰度图还是过大,再次降维使用二值化图像

3.颜色信息

现在大部分的彩色图像都是采用RGB颜色模式,处理图像的时候,要分别知对RGB三种分量进行处理,实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配

对于一些场景,颜色所能提供的信息并不多
比如大多数的医学图像RGB提供的信息量很少(几乎没有),所以可以直接灰度图来进行后续计算

但是也并不绝对,颜色有时候提供的信息也很重要
比如分辨红绿灯的话,是绝对不能直接只用灰度图的

这篇关于图片识别为什么大部分都将彩色图像灰度化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1074669

相关文章

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

Python利用PIL进行图片压缩

《Python利用PIL进行图片压缩》有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所以本文为大家介绍了Python中图片压缩的方法,需要的可以参考下... 有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图

java获取图片的大小、宽度、高度方式

《java获取图片的大小、宽度、高度方式》文章介绍了如何将File对象转换为MultipartFile对象的过程,并分享了个人经验,希望能为读者提供参考... 目China编程录Java获取图片的大小、宽度、高度File对象(该对象里面是图片)MultipartFile对象(该对象里面是图片)总结java获取图片

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前

使用Python实现图片和base64转换工具

《使用Python实现图片和base64转换工具》这篇文章主要为大家详细介绍了如何使用Python中的base64模块编写一个工具,可以实现图片和Base64编码之间的转换,感兴趣的小伙伴可以了解下... 简介使用python的base64模块来实现图片和Base64编码之间的转换。可以将图片转换为Bas

css实现图片旋转功能

《css实现图片旋转功能》:本文主要介绍了四种CSS变换效果:图片旋转90度、水平翻转、垂直翻转,并附带了相应的代码示例,详细内容请阅读本文,希望能对你有所帮助... 一 css实现图片旋转90度.icon{ -moz-transform:rotate(-90deg); -webkit-transfo

C#实现添加/替换/提取或删除Excel中的图片

《C#实现添加/替换/提取或删除Excel中的图片》在Excel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更加美观,下面我们来看看如何在C#中实现添加/替换/提取或删除E... 在Excandroidel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更

C#中图片如何自适应pictureBox大小

《C#中图片如何自适应pictureBox大小》文章描述了如何在C#中实现图片自适应pictureBox大小,并展示修改前后的效果,修改步骤包括两步,作者分享了个人经验,希望对大家有所帮助... 目录C#图片自适应pictureBox大小编程修改步骤总结C#图片自适应pictureBox大小上图中“z轴

使用Python将长图片分割为若干张小图片

《使用Python将长图片分割为若干张小图片》这篇文章主要为大家详细介绍了如何使用Python将长图片分割为若干张小图片,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果1. Python需求

使用 Python 和 LabelMe 实现图片验证码的自动标注功能

《使用Python和LabelMe实现图片验证码的自动标注功能》文章介绍了如何使用Python和LabelMe自动标注图片验证码,主要步骤包括图像预处理、OCR识别和生成标注文件,通过结合Pa... 目录使用 python 和 LabelMe 实现图片验证码的自动标注环境准备必备工具安装依赖实现自动标注核心