C++开发人脸性别识别教程(6)——通过SVM实现性别识别

2024-08-28 18:18

本文主要是介绍C++开发人脸性别识别教程(6)——通过SVM实现性别识别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  上一篇教程中我们介绍了如何使用OpenCv封装的FaceRecognizer类实现简单的人脸性别识别,这里我们为大家提供另外一种基本的性别识别手段——支持向量机(SVM)。

  支持向量机在解决二分类问题方面有着强大的威力(当然也可以解决多分类问题),性别识别是典型的二分类模式识别问题,因此很适合用SVM进行处理,同时OpenCv又对SVM进行了很好的封装,调用非常方便,因此我们在这个性别识别程序中考虑加入SVM方法。

  在这里我们采用了HOG+SVM的模式来进行,即先提取图像的HOG特征,然后将这些HOG特征输入SVM中进行训练。

  一、SVM概述

  SVM的数学原理十分复杂,我们不在这里过多讨论,有关OpenCv中SVM的用法,这里为大家提供两篇博客以供参考:OpenCV的SVM用法以及OpenCV 2.4+ C++ SVM介绍。

  二、HOG特征概述

  HOG特征是图像的梯度特征,具体参见:目标检测的图像特征提取之(一)HOG特征

  三、建立训练集

  这里继续沿用上一篇博文中提到的性别识别训练集,400张男性人脸样本400张女性人脸样本,下载地址:性别识别数据集。

  四、算法的训练与测试

  1、建立控制台工程,配置OpenCv环境

  这里将工程命名为:GenderSVM。

  2、编写批量读取函数read_csv()

  只要涉及到训练,都需要批量读取训练样本的操作,SVM也不例外,因此需要先编写批量读取函数read_csv()。考虑到之前的批量读取函数必须一次性将所有训练样本读入内存中,内存消耗较大,在这里做一个小小的改进:

void read_csv(String& csvPath,Vector<String>& trainPath,Vector<int>& label,char separator = ';')
{string line,path,classLabel;ifstream file(csvPath.c_str(),ifstream::in);while (getline(file,line)){stringstream lines(line);getline(lines,path,separator);getline(lines,classLabel);if (!path.empty()&&!classLabel.empty()){trainPath.push_back(path);label.push_back(atoi(classLabel.c_str()));}}
}

  可见这里我们将输入参数由vector<Mat>改为vector<String>,然后返回装有训练样本的所有路径的容器,需要时在根据其中的路径进行读取,降低了内存占用量。

  3、读入训练样本路径

    string trainCsvPath = "E:\\性别识别数据库—CAS-PEAL\\at.txt";vector<String> vecTrainPath;vector<int> vecTrainLabel;read_csv(trainCsvPath,vecTrainPath,vecTrainLabel);

  顺利批量读入路径:

  4、训练初始化

  在提取HOG特征之前,需要初始化训练数据矩阵:

    /**********初始化训练数据矩阵**********/int iNumTrain = 800;Mat trainDataHog;Mat trainLabel = Mat::zeros(iNumTrain,1,CV_32FC1);

  需要强调的是SVM的训练数据必须都是CV_32FC1格式,因此这里显式的将标签矩阵trainLabel初始化为CV_32FC1格式,trainDataHog稍后进行初始化。

  5、提取图像HOG特征

  接下来循环读入所有的训练样本,提取HOG特征,放在训练数据矩阵中。考虑嵌套代码的复杂性,这里先给出整体代码,稍后解释:

    /**********提取HOG特征,放入训练数据矩阵中**********/Mat imageSrc;for (int i = 0; i < iNumTrain; i++){imageSrc = imread(vecTrainPath[i].c_str(),1);resize(imageSrc,imageSrc,Size(64,64));HOGDescriptor *hog = new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9); vector<float> descriptor;hog->compute(imageSrc,descriptor,Size(1,1),Size(0,0));if (i == 0){trainDataHog = Mat::zeros(iNumTrain,descriptor.size(),CV_32FC1);}int n = 0;for (vector<float>::iterator iter = descriptor.begin();iter != descriptor.end();iter++){trainDataHog.at<float>(i,n) = *iter;n++;}trainLabel.at<float>(i,0) = vecTrainLabel[i];}

  接下来我们对这段代码进行详细解释。

  (1)循环读入训练样本

  从vecTrainPath容器中逐条取出训练样本路径,然后读取:

        imageSrc = imread(vecTrainPath[i].c_str(),1);

  (2)尺寸归一化

  我们这里将图像尺寸归一化为64*64,这是因为当时在写程序时参考了一篇关于HOG特征的博客。这里的尺寸大家可以随意设定,当然也会影响最终的识别效率,64*64可能并不是一个最优的尺寸:

        imageSrc = imread(vecTrainPath[i].c_str(),1);resize(imageSrc,imageSrc,Size(64,64));

  (3)计算HOG特征

  OpenCv给出的HOG特征计算接口非常简洁,三句话即完成:

        HOGDescriptor *hog = new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9); vector<float> descriptor;hog->compute(imageSrc,descriptor,Size(1,1),Size(0,0));

  提取的特征以容器的数据 结构形式给出。至于计算时的参数设定,参见我之前提供的那两篇博客即可。

  (4)初始化数据矩阵trainDataHog

  前面提到,SVM中用到的训练数据矩阵必须是CV_32FLOAT形式的,因此需要对数据矩阵显示的指定其尺寸和类型。然后由于trainDataHog行数为训练样本个数,而列数为图片HOG特征的维数,因此无法在进行HOG特征提取之前确定其尺寸,因此这里选择在进行完第一张样本的HOG特征、得到对应维数之后,在进行初始化:

        if (i == 0){trainDataHog = Mat::zeros(iNumTrain,descriptor.size(),CV_32FC1);}

  (5)将得到的HOG特征存入数据矩阵

  得到的HOG特征是浮点数容器的形式,我们需要将其转换成矩阵的形式以便于训练SVM,这就涉及到了vector和Mat两个数据结构的遍历。vector遍历这里推荐使用迭代器的方式,而Mat遍历这里则选择了相对耗时但是最简单的方式——直接使用at函数:

        int n = 0;for (vector<float>::iterator iter = descriptor.begin();iter != descriptor.end();iter++){trainDataHog.at<float>(i,n) = *iter;n++;}trainLabel.at<float>(i,0) = vecTrainLabel[i];

  训练得到的HOG特征如图所示:

  可见在当前的参数设定下,提取到的HOG特征为1764维,共800张训练样本,每一行代表一个图片的HOG特征向量。通过“ctrl+鼠标滚轮”放大观察特征向量的具体参数:

  6、训练SVM分类器

  有关OpenCv中SVM分类器的使用可以参见以下博客:OpenCV 2.4+ C++ SVM介绍。

  首先,初始化相关参数:

    /**********初始化SVM分类器**********/CvSVM svm;  CvSVMParams param;    CvTermCriteria criteria;      criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );      param = CvSVMParams(CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );  

  开始训练、训练完成后保存分类器:

    /**********训练并保存SVM**********/svm.train(trainDataHog,trainLabel,Mat(),Mat(),param);svm.save("E:\\性别识别数据库—CAS-PEAL\\SVM_SEX_Model.txt");

  注意我们这里选择将分类器保存为txt形式:

  当然,我们可以打开这个txt文件,查看里面的参数:

  7、测试分类效果

  测试过程和训练过程基本相同,读取图片、尺寸归一化、提取HOG特征、预测:

    /**********测试SVM分类性能**********/Mat testImage = imread("E:\\性别识别数据库—CAS-PEAL\\测试样本\\女性测试样本\\face_35.bmp");resize(testImage,testImage,Size(64,64));HOGDescriptor *hog = new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9); vector<float> descriptor;hog->compute(testImage,descriptor,Size(1,1),Size(0,0));Mat testHog = Mat::zeros(1,descriptor.size(),CV_32FC1);int n = 0;for (vector<float>::iterator iter = descriptor.begin();iter != descriptor.end();iter++){testHog.at<float>(0,n) = *iter;n++;}int predictResult = svm.predict(testHog);

  8、完整代码

 这里给出HOG+SVM进行性别识别的完整代码:

// GenderSVM.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include <opencv2\opencv.hpp>
#include <iostream>
#include <sstream>
#include <fstream>using namespace std;
using namespace cv;void read_csv(String& csvPath,vector<String>& trainPath,vector<int>& label,char separator = ';')
{string line,path,classLabel;ifstream file(csvPath.c_str(),ifstream::in);while (getline(file,line)){stringstream lines(line);getline(lines,path,separator);getline(lines,classLabel);if (!path.empty()&&!classLabel.empty()){trainPath.push_back(path);label.push_back(atoi(classLabel.c_str()));}}
}int _tmain(int argc, _TCHAR* argv[])
{/**********批量读入训练样本路径**********/string trainCsvPath = "E:\\性别识别数据库—CAS-PEAL\\at.txt";vector<String> vecTrainPath;vector<int> vecTrainLabel;read_csv(trainCsvPath,vecTrainPath,vecTrainLabel);/**********初始化训练数据矩阵**********/int iNumTrain = 800;Mat trainDataHog;Mat trainLabel = Mat::zeros(iNumTrain,1,CV_32FC1);/**********提取HOG特征,放入训练数据矩阵中**********/Mat imageSrc;for (int i = 0; i < iNumTrain; i++){imageSrc = imread(vecTrainPath[i].c_str(),1);resize(imageSrc,imageSrc,Size(64,64));HOGDescriptor *hog = new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9); vector<float> descriptor;hog->compute(imageSrc,descriptor,Size(1,1),Size(0,0));if (i == 0){trainDataHog = Mat::zeros(iNumTrain,descriptor.size(),CV_32FC1);}int n = 0;for (vector<float>::iterator iter = descriptor.begin();iter != descriptor.end();iter++){trainDataHog.at<float>(i,n) = *iter;n++;}trainLabel.at<float>(i,0) = vecTrainLabel[i];}/**********初始化SVM分类器**********/CvSVM svm;  CvSVMParams param;    CvTermCriteria criteria;      criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );      param = CvSVMParams(CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );     /**********训练并保存SVM**********/svm.train(trainDataHog,trainLabel,Mat(),Mat(),param);svm.save("E:\\性别识别数据库—CAS-PEAL\\SVM_SEX_Model.txt");/**********测试SVM分类性能**********/Mat testImage = imread("E:\\性别识别数据库—CAS-PEAL\\测试样本\\女性测试样本\\face_35.bmp");resize(testImage,testImage,Size(64,64));HOGDescriptor *hog = new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9); vector<float> descriptor;hog->compute(testImage,descriptor,Size(1,1),Size(0,0));Mat testHog = Mat::zeros(1,descriptor.size(),CV_32FC1);int n = 0;for (vector<float>::iterator iter = descriptor.begin();iter != descriptor.end();iter++){testHog.at<float>(0,n) = *iter;n++;}int predictResult = svm.predict(testHog);return 0;
}

  五、总结

  以上就是通过HOG特征+SVM进行性别识别的完整代码,在编写代码的过程中遇到了一些有趣的问题,这里稍作总结。

  1、变量命名格式

  当代码量很大的时候,变量的命名格式就显得十分重要,相信大家早已不用那种a、b、m、n这种简单的无意义的命名方法了。在C++中推荐大家使用匈牙利命名法,即“类型缩写+变量名缩写”的命名格式。例如vecTrainPath这个变量名,前缀“vec”表明这个变量是一个vector格式的变量,而“TrainPath”则表明这个容器中存放的是训练样本的路径。这种命名方式在大型工程中非常重要,还有一点需要注意的是当变量名中出现多个缩略短语时,推荐第一个短语小写,其他短语的首字母大写。

  2、为何选择HOG特征

  通过实验发现,直接将图像向量化后输入SVM(不经过特征提取)的方式的正确率将不理想。虽然本质上像素本身最能代表图像的语义信息,但由于SVM并不具备特征提取能力,因此效果不佳。确切的说,特征提取是模式分类的必要过程,即便是深度学习也不例外,因为深度学习(DeepLearning)本质上也是一种特征提取的手段,只不过提取得到的特征更深层,更抽象,表现力更强。为此我之前曾专门写过一篇博客进行阐述:浅谈模式识别中的特征提取

  当然这里大家可以尝试提取其他特征之后再进行分类,甚至可以考虑通过提起深度特征来进行分类,这里只是以HOG特征为例而已。

  4、有关vector的一些使用(为什么不用int型数组)

  在这段代码中我们大量用到了vector结构,这是C++11的新特性。仔细观察,其实vector结构的最明显的一个优势就是能够动态分配大小,实时添加/删除元素,这点是数组所不能实现的。虽然可以通过new操作符来实现数组的动态分配,但我们仍推荐大家在需要使用可动态变化的数组的场合,使用vector。

  5、Vectot和vector

  在编写代码是仔细留心编译器给出的拼写提示,会发现这样一现象:

  那么vector和Vector有什么区别呢?一句话,Vector是OpenCv中的vector,类似的还有String和string等。Vector和String这类结构是隶属于OpenCv的:

  OK,以上就是这次博文的所有内容,在接下来的博文中我们将开始进入MFC编程阶段,欢迎大家讨论:http://blog.csdn.net/u013088062。

这篇关于C++开发人脸性别识别教程(6)——通过SVM实现性别识别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115524

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�