图片识别为什么大部分都将彩色图像灰度化

2024-06-19 09:38

本文主要是介绍图片识别为什么大部分都将彩色图像灰度化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

对于图片识别灰度化的原因这里根据自己的理解和网上看到的一些自己觉得合理的解释这里做个大概总结,如有错误欢迎大神们打脸指正


最直接的原因:减少计算量

包含色彩的图片,特征量,计算量会成指数倍数增加
比如一个点,灰度的话,就256个维度而已,但是如果算上RGB色彩的话,那就是1600万以上维度。然后再相互组合,或者说找梯度,可以想象看计算量有多大

但是好在就算是全色盲也可以分辨物体,对于一般的物体识别灰度图就够了,于是就先降维(灰度)来计算

不过一直觉得不是每个应用都需要把彩色变成灰度,毕竟颜色是一个比较有用的特征

首先 灰度化之后失去了什么,又得到了什么

  • 灰度化之后颜色信息丢失,所以一般基于color-based算法就不能灰度化
  • 但是很多简单的识别算法对于颜色的依赖性不强,hand-craft特征更多关注边缘梯度信息
    灰度化之后矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留
  • 工程中很多应用加上color信息之后鲁棒性会下降

怎么选择就是在performance和efficiency之间做一个权衡罢了


是否选择灰度图主要需要权衡以下几点:

1. 梯度

我们识别物体,最关键的因素是梯度(现在很多的特征提取HOG,LBP,SIFT等等本质都是梯度的统计信息),梯度意味着边缘,这是最本质的部分,而计算梯度,最常用就是灰度图。颜色本身,非常容易受到光照等因素的影响,同类的物体颜色有很多变化,所以颜色本身难以提供关键信息

2.计算量

灰度化其实就是将图片降维,这样就能大大降低计算量

对于设备的计算能力和识别速度的需求是你取舍的一个关键点

有时候灰度图还是过大,再次降维使用二值化图像

3.颜色信息

现在大部分的彩色图像都是采用RGB颜色模式,处理图像的时候,要分别知对RGB三种分量进行处理,实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配

对于一些场景,颜色所能提供的信息并不多
比如大多数的医学图像RGB提供的信息量很少(几乎没有),所以可以直接灰度图来进行后续计算

但是也并不绝对,颜色有时候提供的信息也很重要
比如分辨红绿灯的话,是绝对不能直接只用灰度图的

这篇关于图片识别为什么大部分都将彩色图像灰度化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1074669

相关文章

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

Pytorch微调BERT实现命名实体识别

《Pytorch微调BERT实现命名实体识别》命名实体识别(NER)是自然语言处理(NLP)中的一项关键任务,它涉及识别和分类文本中的关键实体,BERT是一种强大的语言表示模型,在各种NLP任务中显著... 目录环境准备加载预训练BERT模型准备数据集标记与对齐微调 BERT最后总结环境准备在继续之前,确

基于Python开发批量提取Excel图片的小工具

《基于Python开发批量提取Excel图片的小工具》这篇文章主要为大家详细介绍了如何使用Python中的openpyxl库开发一个小工具,可以实现批量提取Excel图片,有需要的小伙伴可以参考一下... 目前有一个需求,就是批量读取当前目录下所有文件夹里的Excel文件,去获取出Excel文件中的图片,并

Java实现数据库图片上传与存储功能

《Java实现数据库图片上传与存储功能》在现代的Web开发中,上传图片并将其存储在数据库中是常见的需求之一,本文将介绍如何通过Java实现图片上传,存储到数据库的完整过程,希望对大家有所帮助... 目录1. 项目结构2. 数据库表设计3. 实现图片上传功能3.1 文件上传控制器3.2 图片上传服务4. 实现

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》:本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

Java实现数据库图片上传功能详解

《Java实现数据库图片上传功能详解》这篇文章主要为大家详细介绍了如何使用Java实现数据库图片上传功能,包含从数据库拿图片传递前端渲染,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、前言2、数据库搭建&nbsChina编程p; 3、后端实现将图片存储进数据库4、后端实现从数据库取出图片给前端5、前端拿到

Nginx实现前端灰度发布

《Nginx实现前端灰度发布》灰度发布是一种重要的策略,它允许我们在不影响所有用户的情况下,逐步推出新功能或更新,通过灰度发布,我们可以测试新版本的稳定性和性能,下面就来介绍一下前端灰度发布的使用,感... 目录前言一、基于权重的流量分配二、基于 Cookie 的分流三、基于请求头的分流四、基于请求参数的分

Python使用PIL库将PNG图片转换为ICO图标的示例代码

《Python使用PIL库将PNG图片转换为ICO图标的示例代码》在软件开发和网站设计中,ICO图标是一种常用的图像格式,特别适用于应用程序图标、网页收藏夹图标等场景,本文将介绍如何使用Python的... 目录引言准备工作代码解析实践操作结果展示结语引言在软件开发和网站设计中,ICO图标是一种常用的图像

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

SpringBoot集成图片验证码框架easy-captcha的详细过程

《SpringBoot集成图片验证码框架easy-captcha的详细过程》本文介绍了如何将Easy-Captcha框架集成到SpringBoot项目中,实现图片验证码功能,Easy-Captcha是... 目录SpringBoot集成图片验证码框架easy-captcha一、引言二、依赖三、代码1. Ea