基于 YOLOv8n-pose 模型的图像特征提取,可用于识别特定的姿态

2024-08-23 14:44

本文主要是介绍基于 YOLOv8n-pose 模型的图像特征提取,可用于识别特定的姿态,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1. __init__ 方法:初始化类的实例

2. save_pose_feat 方法:

3. load_db_pose_feat 方法:

4. cal_similarity 方法:


实现了一个基于 YOLOv8n-pose 模型的图像特征提取和相似性比较系统。它可以从图像中提取人体关键点信息,并将其保存为特征文件。然后,通过计算输入图像与数据库中图像特征的相似度,确定输入图像的类别。

1. __init__ 方法:初始化类的实例

加载 YOLOv8n-pose 模型并加载数据库中的姿态特征。
load_model 方法:加载 YOLOv8n-pose 模型。

 def load_model(self):model=YOLO('yolov8n-pose.pt')return model


extract_fact 方法:从输入图像中提取特征,包括目标框的坐标和人体关键点的归一化坐标。相当于是17个点相对于特定的框的位置做了归一化

    def extract_fact(self,img_path):list=[]result=self.model(img_path)x1,y1,x2,y2,conf,cls=result[0].boxes.data[0]x1,y1,x2,y2=x1.item(),y1.item(),x2.item(),y2.item()for x_y in result[0].keypoints.xy[0]:x,y=x_yx=x.item()y=y.item()x=(x-x1)/(x2-x1)y=(y-y2)/(y1-y2)list.append(x)list.append(y)# print(list)return list


2. save_pose_feat 方法:

从指定目录下的图像中提取姿态特征,并保存到文本文件中。

 def save_pose_feat(self):img_paths=glob.glob('image_arm\*\*')with open('feature.txt','w',encoding='utf-8') as f:for img_path in img_paths:img_name=img_path.split('\\')[-2]+' 'list=self.extract_fact(img_path)f.write(img_name)list=str(list)f.write(list)f.write('\n')


3. load_db_pose_feat 方法:

从保存的特征文件中加载数据库中的图像名称和特征。

    def load_db_pose_feat(self):with open('feature.txt','r',encoding='utf-8') as f:lines=f.readlines()db_names=[]db_features=[]for line in lines:db_name=line.split(' ')[0]db_feature=line.split(' ',1)[1]db_feature=json.loads(db_feature)db_names.append(db_name)db_features.append(db_feature)return db_names,db_features


4. cal_similarity 方法:

计算输入图像与数据库中图像特征的相似度,并确定输入图像的类别。

 如果找出来最相似的三张图片是一样的,那么就可以成功预测出来

 def cal_similarity(self,img_path):#计算相似度db_names,db_features=self.db_names,self.db_featuresdb_names=np.array(db_names)my_feature=self.extract_fact(img_path)db_features=np.array(db_features)my_feature=np.array(my_feature)dist=np.linalg.norm(my_feature-db_features,axis=1)stack_dist_name=np.column_stack((dist,db_names))sort_index=np.argsort(stack_dist_name[:,0])top3=stack_dist_name[sort_index][:3][:,1]top1=top3[0]count=0for i in top3[1:]:if i==top1:count+=1if count==2:print('类别是',top1)else:print('啥也不是')print()

完整代码如下:

import glob
import json
import osimport cv2
import numpy as np
from ultralytics import YOLO
class FrameFeat:def __init__(self):self.model=self.load_model()self.db_names,self.db_features=self.load_db_pose_feat()def load_model(self):model=YOLO('yolov8n-pose.pt')return modeldef extract_fact(self,img_path):list=[]result=self.model(img_path)x1,y1,x2,y2,conf,cls=result[0].boxes.data[0]x1,y1,x2,y2=x1.item(),y1.item(),x2.item(),y2.item()for x_y in result[0].keypoints.xy[0]:x,y=x_yx=x.item()y=y.item()x=(x-x1)/(x2-x1)y=(y-y2)/(y1-y2)list.append(x)list.append(y)# print(list)return listdef save_pose_feat(self):img_paths=glob.glob('image_arm\*\*')with open('feature.txt','w',encoding='utf-8') as f:for img_path in img_paths:img_name=img_path.split('\\')[-2]+' 'list=self.extract_fact(img_path)f.write(img_name)list=str(list)f.write(list)f.write('\n')def load_db_pose_feat(self):with open('feature.txt','r',encoding='utf-8') as f:lines=f.readlines()db_names=[]db_features=[]for line in lines:db_name=line.split(' ')[0]db_feature=line.split(' ',1)[1]db_feature=json.loads(db_feature)db_names.append(db_name)db_features.append(db_feature)return db_names,db_featuresdef cal_similarity(self,img_path):#计算相似度db_names,db_features=self.db_names,self.db_featuresdb_names=np.array(db_names)my_feature=self.extract_fact(img_path)db_features=np.array(db_features)my_feature=np.array(my_feature)dist=np.linalg.norm(my_feature-db_features,axis=1)stack_dist_name=np.column_stack((dist,db_names))sort_index=np.argsort(stack_dist_name[:,0])top3=stack_dist_name[sort_index][:3][:,1]top1=top3[0]count=0for i in top3[1:]:if i==top1:count+=1if count==2:print('类别是',top1)else:print('啥也不是')print()if __name__ == '__main__':img_path=r'D:\AI_37\ultralytics-8.2.74\ultralytics\pos-detect\img_1.png'ff=FrameFeat()# ff.extract_fact(img_path)# ff.save_pose_feat()ff.load_db_pose_feat()ff.cal_similarity(img_path) 

数据的格式如下 

 

 

这篇关于基于 YOLOv8n-pose 模型的图像特征提取,可用于识别特定的姿态的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1099679

相关文章

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

Pytorch微调BERT实现命名实体识别

《Pytorch微调BERT实现命名实体识别》命名实体识别(NER)是自然语言处理(NLP)中的一项关键任务,它涉及识别和分类文本中的关键实体,BERT是一种强大的语言表示模型,在各种NLP任务中显著... 目录环境准备加载预训练BERT模型准备数据集标记与对齐微调 BERT最后总结环境准备在继续之前,确

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》:本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为