OpenCV实践(1)-怎样扫描图像、查找表和运行效率的测定

2023-12-01 17:08

本文主要是介绍OpenCV实践(1)-怎样扫描图像、查找表和运行效率的测定,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、目标

在本文中我们要回答下面这4个问题:
(1)怎样遍历图像中的每一个像素;
(2)OpenCV中矩阵值怎样存储;
(3)怎样测试我们的算法的效率;
(4)什么是查找表,我们为什么要是用它?

2 关于测试demo

这里,我们考虑一种非常简单的色彩降低方法。我们已经知道,使用了unsigned char类型的矩阵项最高可以拥有256种不同的值。那么对于3通道图像来说,那就有16,000,000种值。处理这么多的像素差,对于我们的算法性能是个很大的考验。但是,有时候,只处理其中的一部分就能得到相同的最终结果。
在这些情况中,常用的方法就是色彩空间压缩。这意味着,我们通过将现在的色彩空间值除以一个我们新给定的值,得到更少的色彩。在demo中,我们将0-9取为新值0,10-19取值为10,以此类推。
当你把一个uchar类型的值除以整数值,结果还是char形,利用这个特点,上面的操作满足于下面这个表达式:

Inew = (Iold / 10) * 10;

那么,上面提到的简单的色彩空间压缩算法就是把图像矩阵的每一个像素都应用该公式,就可以了。值得注意是,我们这里使用了乘除操作。这些操作对系统的开销比较大。如果可能的话,尽量避免使用这些操作,取而代之的是,使用加减操作,更好的情况就是直接使用简单的赋值操作。进一步注意到,对于上面的操作,我们只需要有限的输入值就可以了。假设使用uchar类型,这个有限的值就是256。
因此,对于更大的图像,明智的做法就是,预先计算所有的可能值,在赋值阶段只需通过查找表进行赋值。查找表是简单的数组(1维或者多维都可以),每一个输入变量都对应这个表中的某个值,最为输出值。
我们的测试deme程序将会实现下面这些功能:从命令行读入图像(彩色或者灰度图都可以,这由另一个命令行参数控制),以及从命令行指定要压缩使用的整数值。OpenCV,现在有三种实现图像像素点的遍历方法。为了使这个测试更为有趣,这三种方法我们都将使用,且打印出它最终花费了多长时间。
基本的使用方法是:

how_to_scan_images imageName.jpg intValueToReduce [G]

最后的参数是可选的。如果使用,图像将会以灰度格式载入,否则就会使用RGB格式。首先要做的就是计算查找表。

    int divideWith = 0; // 转换输入字符串为数字-C++风格stringstream s;s << argv[2];s >> divideWith;if (!s || !divideWith){cout << "Invalid number entered for dividing. " << endl;return -1;}uchar table[256];for (int i = 0; i < 256; ++i)table[i] = (uchar)(divideWith * (i/divideWith));

另一个问题就是我们如何计算算法运行的时间?好在OpenCV提供了两个函数getTickCount()和getTickFrequency()。getTickCount返回从某一个时间点你的系统CPU发生的Tick数,例如,从你的系统开始计数。getTickFrequency返回的是,在1s内你的CPU经过了多少个Ticks。所以,可以测量两个操作之间经过了多长时间,如下所示:

double t = (double)getTickCount();
// do something ...
t = ((double)getTickCount() - t)/getTickFrequency();
cout << "Times passed in seconds: " << t << endl;

3 图像矩阵在内存中怎样存储?

这一段我们就不多做介绍了,因为我们在介绍Mat类的时候已经介绍过了。
需要注意的是,Mat类矩阵的保存方式是BGR,而不是我们常用的RGB格式。因为,大多数情况下,内存足以用连续的方式存储所有的行,即一行接一行,从而创建一个长的单行矩阵。这种在内存中的存储方式,可以加速我们对图像矩阵的扫描处理。在内存中是不是以这样方式存储的,可以使用isConstinous()函数进行判断。在后面的例子中,我们会使用这个函数。

4 最有效的方法

使用典型C风格的操作符[] (pointer)访问是非常有效率的。因此,对于赋值操作,我们推荐最有效的方式就是[] (pointer):

Mat& ScanImageAndReduceC(Mat& I, const uchar* const table)
{// 只接受 uchar 类型的矩阵CV_Assert(I.depth() != sizeof(uchar));int channels = I.channels();int nRows = I.rows;int nCols = I.cols * channels;if (I.isContinuous()){nCols *= nRows;nRows = 1;}int i,j;uchar *p;for( i = 0; i < nRows; ++i){p = I.ptr<uchar>(i);for ( j = 0; j < nCols; ++j){p[j] = table[p[j]];}}return I;
}

在这儿,我们基本上仅仅获取每行的起始指针,然后遍历这行直到结束。如果矩阵在内存中的存储是连续的,那么我们只需请求一次指针,然后就可以一路遍历到底。我们需要留意彩色图像:它有3通道,所以对于每一行,我们需要遍历3次。
这还有另外一种方法。Mat对象的data成员返回的是它第一行,第一列的指针。如果该指针是null,说明对象中的data输入是不合法的。检查这个,是检查你的图像是否载入成功最简单的方法。假设在内存中的存储是连续的,我们可以使用这个指针遍历整个数据成员。对于灰度图像,应该像下面这样:

uchar *p = I.data;for( unsigned int i = 0; i < ncol * nrows; ++i)*p++ = table[*p];

你将会得到相同的结果。但是,这段代码的可读性比较差。重要的是,从demo的实现效果来看,你将会得到相同的性能结果。(大多数现在的编译器,都会自动地为你做一下优化)。
5 迭代器方法(比较安全)
使用指针访问,虽然非常高效,但是要保证传递的数据的安全性。使用迭代器这些问题就不会存在了。你所需要做的就是找出矩阵的开头和结尾。

Mat& ScanImageAndReduceIterator(Mat& I, const uchar* const table)
{// accept only char type matricesCV_Assert(I.depth() != sizeof(uchar));const int channels = I.channels();switch(channels){case 1:{MatIterator_<uchar> it, end;for( it = I.begin<uchar>(), end = I.end<uchar>(); it != end; ++it)*it = table[*it];break;}case 3:{MatIterator_<Vec3b> it, end;for( it = I.begin<Vec3b>(), end = I.end<Vec3b>(); it != end; ++it){(*it)[0] = table[(*it)[0]];(*it)[1] = table[(*it)[1]];(*it)[2] = table[(*it)[2]];}}}return I;
}

在彩色图像中,每通道有三个uchar值。OpenCV提供了一个Vec3b矢量表示。因为OpenCV迭代器遍历完一列后会自动跳到下一行,所以如果我们还使用uchar类型迭代器,只能访问到蓝色通道的值。所以,在这里,我们使用[]访问每个通道的子列值。
6 On-the-fly address calculation with reference returning
对于遍历图像,本段描述的这一方法,并不推荐使用。它被用来获取或修改图像中某一个随机的元素。它的基本使用方法是,指定你想访问的项的行号或列号。在介绍前面的扫描图像方法的时候,你可以观察到,图像的类型是非常重要的。在这里,没有什么不同,你也需要手动指定类型。看下面的灰度图的扫描,使用at()函数进行遍历。

Mat& ScanImageAndReduceRandomAccess(Mat& I, const uchar* const table)
{// accept only char type matricesCV_Assert(I.depth() != sizeof(uchar));const int channels = I.channels();switch(channels){case 1:{for( int i = 0; i < I.rows; ++i)for( int j = 0; j < I.cols; ++j )I.at<uchar>(i,j) = table[I.at<uchar>(i,j)];break;}case 3:{Mat_<Vec3b> _I = I;for( int i = 0; i < I.rows; ++i)for( int j = 0; j < I.cols; ++j ){_I(i,j)[0] = table[_I(i,j)[0]];_I(i,j)[1] = table[_I(i,j)[1]];_I(i,j)[2] = table[_I(i,j)[2]];} I = _I;break;}}return I;
}

函数根据你的输入类型和坐标,计算运行时想要查询的项的地址。然后返回一个引用。当你取值时,这可能是一个constant常数,当你设置值时,这可能是non-constant值。与使用指针进行访问的方法相比,唯一的不同就是,对于图像中的每一个元素,你都需要重新得到一个新的row指针,然后配合[]操作符,对列进行访问。
如果扫描多通道的时候,使用这个方法是比较麻烦的,传递类型和对每一个元素使用at关键字进行访问也是比较花费时间的。为了解决这些问题,OpenCV又提供了一个新类Mat_,它仅仅是对Mat类的再封装,并没有实现什么新的特性。在使用的时候也和Mat类没有什么不一样,只是在定义的时候需要指定数据类型,最为回报就是,你可以使用()操作符快速的访问项。它和Mat类的数据转换也是非常方便的。

7 使用Core模块提供的函数

这是一个额外的查表修改图像值的方法。因为在图像处理中,常用的就是,把图像给定的值取代为其它值,OpenCV有一个函数,LUT(),该函数可以让你无需在图像的遍历过程中查表作出修改。
首先,我们构建一个Mat类型的查询表:

    Mat lookUpTable(1, 256, CV_8U);uchar *p = lookUpTable.data;for( int i = 0; i < 256; ++i)p[i] = table[i];

最后,调用这个函数(I是我们输入的图像,J是输出的图像):

    LUT(I, lookUpTable, J);

8 性能差异
编译运行程序,图像500x375;使用彩色图像;为了更准确,我对函数调用100次,取其平均值。
图像如下:
这里写图片描述
(1)最有效方法:1.61256 ms
(2)迭代器方法:5.99329 ms
(3)On-the-Fly RA: 6.52525 ms
(4)LUT函数:0.640021 ms
结论:
(1)尽可能的使用OpenCV已经存在的函数,代替使用重构的函数;
(2)最快的方法是LUT函数。这是因为OpenCV库通过Intel Threading Building Blocks使能了多线程。
(3)迭代器方法比较安全,但是效率比较低。at函数处理可读性比较高以外,不建议使用。
完整代码如下:

#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <iostream>
#include <sstream>using namespace std;
using namespace cv;static void help()
{cout<< "\n--------------------------------------------------------------------------" << endl<< "This program shows how to scan image objects in OpenCV (cv::Mat). As use case"<< " we take an input image and divide the native color palette (255) with the "  << endl<< "input. Shows C operator[] method, iterators and at function for on-the-fly item address calculation."<< endl<< "Usage:"                                                                       << endl<< "./howToScanImages imageNameToUse divideWith [G]"                              << endl<< "if you add a G parameter the image is processed in gray scale"                << endl<< "--------------------------------------------------------------------------"   << endl<< endl;
}Mat& ScanImageAndReduceC(Mat& I, const uchar* table);
Mat& ScanImageAndReduceIterator(Mat& I, const uchar* table);
Mat& ScanImageAndReduceRandomAccess(Mat& I, const uchar * table);int main( int argc, char* argv[])
{help();if (argc < 3){cout << "Not enough parameters" << endl;return -1;}Mat I, J;if( argc == 4 && !strcmp(argv[3],"G") )I = imread(argv[1], CV_LOAD_IMAGE_GRAYSCALE);elseI = imread(argv[1], CV_LOAD_IMAGE_COLOR);if (!I.data){cout << "The image" << argv[1] << " could not be loaded." << endl;return -1;}int divideWith = 0; // convert our input string to number - C++ stylestringstream s;s << argv[2];s >> divideWith;if (!s || !divideWith){cout << "Invalid number entered for dividing. " << endl;return -1;}uchar table[256];for (int i = 0; i < 256; ++i)table[i] = (uchar)(divideWith * (i/divideWith));const int times = 100;double t;t = (double)getTickCount();for (int i = 0; i < times; ++i){cv::Mat clone_i = I.clone();J = ScanImageAndReduceC(clone_i, table);}t = 1000*((double)getTickCount() - t)/getTickFrequency();t /= times;cout << "Time of reducing with the C operator [] (averaged for "<< times << " runs): " << t << " milliseconds."<< endl;t = (double)getTickCount();for (int i = 0; i < times; ++i){cv::Mat clone_i = I.clone();J = ScanImageAndReduceIterator(clone_i, table);}t = 1000*((double)getTickCount() - t)/getTickFrequency();t /= times;cout << "Time of reducing with the iterator (averaged for "<< times << " runs): " << t << " milliseconds."<< endl;t = (double)getTickCount();for (int i = 0; i < times; ++i){cv::Mat clone_i = I.clone();ScanImageAndReduceRandomAccess(clone_i, table);}t = 1000*((double)getTickCount() - t)/getTickFrequency();t /= times;cout << "Time of reducing with the on-the-fly address generation - at function (averaged for "<< times << " runs): " << t << " milliseconds."<< endl;Mat lookUpTable(1, 256, CV_8U);uchar* p = lookUpTable.data;for( int i = 0; i < 256; ++i)p[i] = table[i];t = (double)getTickCount();for (int i = 0; i < times; ++i)LUT(I, lookUpTable, J);t = 1000*((double)getTickCount() - t)/getTickFrequency();t /= times;cout << "Time of reducing with the LUT function (averaged for "<< times << " runs): " << t << " milliseconds."<< endl;return 0;
}Mat& ScanImageAndReduceC(Mat& I, const uchar* const table)
{// accept only char type matricesCV_Assert(I.depth() != sizeof(uchar));int channels = I.channels();int nRows = I.rows;int nCols = I.cols * channels;if (I.isContinuous()){nCols *= nRows;nRows = 1;}int i,j;uchar* p;for( i = 0; i < nRows; ++i){p = I.ptr<uchar>(i);for ( j = 0; j < nCols; ++j){p[j] = table[p[j]];}}return I;
}Mat& ScanImageAndReduceIterator(Mat& I, const uchar* const table)
{// accept only char type matricesCV_Assert(I.depth() != sizeof(uchar));const int channels = I.channels();switch(channels){case 1:{MatIterator_<uchar> it, end;for( it = I.begin<uchar>(), end = I.end<uchar>(); it != end; ++it)*it = table[*it];break;}case 3:{MatIterator_<Vec3b> it, end;for( it = I.begin<Vec3b>(), end = I.end<Vec3b>(); it != end; ++it){(*it)[0] = table[(*it)[0]];(*it)[1] = table[(*it)[1]];(*it)[2] = table[(*it)[2]];}}}return I;
}Mat& ScanImageAndReduceRandomAccess(Mat& I, const uchar* const table)
{// accept only char type matricesCV_Assert(I.depth() != sizeof(uchar));const int channels = I.channels();switch(channels){case 1:{for( int i = 0; i < I.rows; ++i)for( int j = 0; j < I.cols; ++j )I.at<uchar>(i,j) = table[I.at<uchar>(i,j)];break;}case 3:{Mat_<Vec3b> _I = I;for( int i = 0; i < I.rows; ++i)for( int j = 0; j < I.cols; ++j ){_I(i,j)[0] = table[_I(i,j)[0]];_I(i,j)[1] = table[_I(i,j)[1]];_I(i,j)[2] = table[_I(i,j)[2]];}I = _I;break;}}return I;
}

这篇关于OpenCV实践(1)-怎样扫描图像、查找表和运行效率的测定的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/441965

相关文章

Linux使用nohup命令在后台运行脚本

《Linux使用nohup命令在后台运行脚本》在Linux或类Unix系统中,后台运行脚本是一项非常实用的技能,尤其适用于需要长时间运行的任务或服务,本文我们来看看如何使用nohup命令在后台... 目录nohup 命令简介基本用法输出重定向& 符号的作用后台进程的特点注意事项实际应用场景长时间运行的任务服

Docker集成CI/CD的项目实践

《Docker集成CI/CD的项目实践》本文主要介绍了Docker集成CI/CD的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、引言1.1 什么是 CI/CD?1.2 docker 在 CI/CD 中的作用二、Docke

如何在一台服务器上使用docker运行kafka集群

《如何在一台服务器上使用docker运行kafka集群》文章详细介绍了如何在一台服务器上使用Docker运行Kafka集群,包括拉取镜像、创建网络、启动Kafka容器、检查运行状态、编写启动和关闭脚本... 目录1.拉取镜像2.创建集群之间通信的网络3.将zookeeper加入到网络中4.启动kafka集群

opencv实现像素统计的示例代码

《opencv实现像素统计的示例代码》本文介绍了OpenCV中统计图像像素信息的常用方法和函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 统计像素值的基本信息2. 统计像素值的直方图3. 统计像素值的总和4. 统计非零像素的数量

IDEA常用插件之代码扫描SonarLint详解

《IDEA常用插件之代码扫描SonarLint详解》SonarLint是一款用于代码扫描的插件,可以帮助查找隐藏的bug,下载并安装插件后,右键点击项目并选择“Analyze”、“Analyzewit... 目录SonajavascriptrLint 查找隐藏的bug下载安装插件扫描代码查看结果总结Sona

python-nmap实现python利用nmap进行扫描分析

《python-nmap实现python利用nmap进行扫描分析》Nmap是一个非常用的网络/端口扫描工具,如果想将nmap集成进你的工具里,可以使用python-nmap这个python库,它提供了... 目录前言python-nmap的基本使用PortScanner扫描PortScannerAsync异

PostgreSQL如何用psql运行SQL文件

《PostgreSQL如何用psql运行SQL文件》文章介绍了两种运行预写好的SQL文件的方式:首先连接数据库后执行,或者直接通过psql命令执行,需要注意的是,文件路径在Linux系统中应使用斜杠/... 目录PostgreSQ编程L用psql运行SQL文件方式一方式二总结PostgreSQL用psql运

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p