基于svm的水果识别

2024-05-13 11:44

文章标签 识别 svm 水果

本文主要是介绍基于svm的水果识别，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1、程序界面介绍

该程序GUI界面包括待检测水果图片加载、检测结果输出、清空可视化框等。其中包括训练模型、加载图片、重置、识别检测按钮。

程序GUI界面


识别玉米	识别西瓜

分类器识别水果基本原理：

由于每种水果的外形存在很大差异，比如西瓜与玉米，分别为圆形与杆状形状，因此使用HOG算子算子提取图片特征。HOG特征是一种图像局部特征，其基本思路是对图像局部的梯度幅值和方向进行投票统计，形成基于梯度特性的直方图，然后将局部特征拼接起来作为总特征。局部特征在这里指的是将图像划分为多个子块（Block)，每个Block内的特征进行联合以形成最终的特征。

在使用HOG算子识别图像特征后，训练基于SVM多分类模型，得到模型参数，最终实现水果分类。

2、程序的使用

2.1 程序打开

在窗口命令行中输入“guide”，在弹出对话框中，选择"fruitrecog.fig"，再单击绿色三角即可运行程序。

命令行窗口输入

打开对话框

运行示意图

2.2 训练样本介绍

本程序基于支持向量机SVM进行水果识别，需要事先制作不同水果的样本数据。本次实验制作了15类水果，每一类水果包含10张训练样本，如下图所示。

15类水果文件夹示意图

玉米文件夹下示意图

西红柿文件夹下示意图

土豆文件夹下示意图

在收集训练样本数据后，还需要制作一个包含训练样本图片的txt文本，其具体包含了每张样本数据存放的路径。因此，若下载到自己电脑上，需要在txt文本中修改图片路径。

traindata.txt文本中图片路径采用相对路径方式

m文件与训练数据、traindata.txt在文件夹中位置关系示意图（在同一层文件夹）

******需要注意的是，下载到自己电脑上后，一定要将traindata.txt中内容，改成图片实际在你电脑上存放的绝对位置，或者不要动，保持上图截图中相对位置。********

2.3 训练模型

在制作好训练数据后，便可以训练模型。点击“训练模型”按钮，打开traindata.txt文件，确定后开始训练模型，模型训练结束后，会弹出“模型训练完成！”的提示，如下图所示。
打开训练样本文件训练完成提示

选取训练数据

训练结束提示

2.4 识别水果

选择“加载图片”按钮，加载需要识别的水果，如选择草莓图片，再点击“识别检测”按钮，识别出该水果。

水果识别示意图

4、说明（若训练自己数据）

理论上样本制作的越多，训练的模型精度会更高。若自己想制作更多的训练样本数字训练模型，需要在traindata文件夹下，放入更多的待识别水果图片，进行训练。或者其他想要识别的水果，但是需要在以下方面进行修改

（1）traindata.txt中内容

traindata.txt是存放每个训练样本图片的路径，因此，需要根据最终制作样本图片进行修改。具体来说，将你制作多的训练样本图片路径，全部添加进来即可。

图片路径添加示意图

（2）m文件修改

在fruitrecog.fig文件中，选择“训练模型”按钮，右击，在弹出选项中选择“callback”。

对train_label进行修改，主要修改每类水果样本数量、水果数量。其中用1-15表示每一个水果种类。若要识别的水果种类位20种，则数字位1-20。若每种水果训练样本数量为20，则每个数字出现20次，即有20个1,20个2,20个3......

最后输出显示需要修改：

修改predict_label 值与对应的水果名，这需要根据你自己实际情况进行修改。

这篇关于基于svm的水果识别的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/985613。 23002807@qq.com

相关文章

使用PyTorch实现手写数字识别功能

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

阅读更多...

Pytorch微调BERT实现命名实体识别

Pytorch微调BERT实现命名实体识别

《Pytorch微调BERT实现命名实体识别》命名实体识别（NER）是自然语言处理（NLP）中的一项关键任务,它涉及识别和分类文本中的关键实体,BERT是一种强大的语言表示模型,在各种NLP任务中显著... 目录环境准备加载预训练BERT模型准备数据集标记与对齐微调 BERT最后总结环境准备在继续之前，确

阅读更多...

讯飞webapi语音识别接口调用示例代码(python)

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》：本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

阅读更多...

使用Python开发一个图像标注与OCR识别工具

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》：本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

阅读更多...

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

阅读更多...

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》：本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

阅读更多...

阿里开源语音识别SenseVoiceWindows环境部署

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别：采用超过 40 万小时数据训练，支持超过 50 种语言，识别效果上优于 Whisper 模型。富文本识别：具备优秀的情感识别，能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力，支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

阅读更多...

904.水果成篮

904.水果成篮

题目链接：leetcode链接思路分析（滑动窗口）读完题目，很明显，这个题目需要我们寻找一个最长子数组，使得这个子数组里面最多存在两种不同的数字，很容易联想到使用滑动窗口。另外，需要使用hash表来记录区间内的不同种水果的个数首先还是left，right = 0；进窗口：right进哈希表判断：哈希表的size > 2，就需要出窗口出窗口：hash[left]–的同时，

阅读更多...

Clion不识别C代码或者无法跳转C语言项目怎么办？

Clion不识别C代码或者无法跳转C语言项目怎么办？

如果是中文会显示：此时只需要右击项目，或者你的源代码目录，将这个项目或者源码目录标记为项目源和头文件即可。英文如下：

阅读更多...

BERN2（生物医学领域）命名实体识别与命名规范化工具

BERN2（生物医学领域）命名实体识别与命名规范化工具

BERN2: an advanced neural biomedical named entity recognition and normalization tool 《Bioinformatics》2022 1 摘要 NER和NEN：在生物医学自然语言处理中，NER和NEN是关键任务，它们使得从生物医学文献中自动提取实体（如疾病和药物）成为可能。 BERN2：BERN2是一个工具，

阅读更多...