现在Computer Vision基本要用的几个图像特征和方法

2024-02-04 01:38

本文主要是介绍现在Computer Vision基本要用的几个图像特征和方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://www.zhizhihu.com/html/y2010/2431.html

现在Computer Vision基本要用的几个图像特征和方法
2010年12月12日  ⁄ 技术, 科研, 酷图 ⁄ 共 2118字 ⁄ 评论数 10 ⁄ 被围观 4,116 阅读+

http://lear.inrialpes.fr/pubs/2010/KMSZ10/drinking.png一直在关注Action Classification,VOC2010结果发布之后,大体看了一下,基本上就那些图像特征的使用(dense SIFT+Spatial Pyramid),然后就是乱七八糟的融合了,归结都低就是Multiple Kernel Learning以及一些近似的算法。

下面看看VOC2010关于ActionClassification部分的结果:

Average Precision (AP %)
 phoningplaying
instrument
readingriding
bike
riding
horse
runningtaking
photo
using
computer
walking
BONN_ACTION47.551.131.964.569.178.532.453.961.1
CVC_BASE56.256.534.775.183.686.525.460.069.2
CVC_SEL49.852.834.374.285.585.124.964.172.5
INRIA_SPM_HT53.253.630.278.288.484.630.460.961.8
NUDT_SVM_WHGO_SIFT_CENTRIST_LLM47.247.924.574.281.079.524.958.671.5
SURREY_MK_KDA52.653.535.981.089.386.532.859.268.6
UCLEAR_SVM_DOSP_MULTFEATS47.057.826.978.889.787.332.560.070.1
UMCO_DHOG_KSVM53.543.032.067.968.883.034.145.960.4
WILLOW_A_SVMSIFT_1-A_LSVM49.237.722.273.277.181.724.353.756.9
WILLOW_LSVM40.429.932.253.562.273.617.645.841.5
WILLOW_SVMSIFT47.929.121.753.576.778.326.042.956.4

各种方法的描述后面也有。

首先看看UCLEAR_SVM_DOSP_MULTFEATS的方法:

Multiple chi squared kernels are computed: spatial pyramid (SP) w/ dense SIFT, dense overlapping SP w/ HOG, texture filter, LAB values (bag-of-words w/ the above features) and edge dir hists. They are computed on full images, person bounding boxes (BB) and BB of the lower part (simple stretch-scale of person BB) expected to contain horse, bike etc. They are combined with class specific binary weights based on their perf on val set. Finally, class specific SVMs trained on train+val.

是不是感觉方法很简单?

再看看SURREY_MK_KDA的方法:

Kernel-level fusion with Spatial Pyramid Grids, Soft Assignment and Kernel Discriminant Analysis using spectral regression. 18 kernels have been generated from 18 variants of SIFT. 融合吧。

CVC_SEL的方法:

Enhanced CVC submission built upon CVC-BASE for action recognition. Standard BoW model over multiple features from CVC-BASE plus contextual object descriptors. Cross-validation procedure for action-specific feature and kernel selection. Foreground/background/neighborhood modeled separately, spatial pyramid over several features for foreground representation. Object detection based on deformable part-based detector incorporated. Late fusion of feature-specific SVM outputs for final action score.

综上所述:Spatial Pyramid w/(dense SIFT | overlap HOG)这是最好用的描述模板的方法,一起用就用Multiple Kernel融合起来,学个融合的参数,其实效果真的很好很好,不骗你。

所以说,对于一些类似这样的问题,除非你是非得自己发明一些描述子,不然用这些就能够达到一些实验的目标,当然实用也是未尝不可的。

http://lear.inrialpes.fr/pubs/2010/KMSZ10/drinking.png


这篇关于现在Computer Vision基本要用的几个图像特征和方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/676028

相关文章

C# 比较两个list 之间元素差异的常用方法

《C#比较两个list之间元素差异的常用方法》:本文主要介绍C#比较两个list之间元素差异,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1. 使用Except方法2. 使用Except的逆操作3. 使用LINQ的Join,GroupJoin

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

一文详解Git中分支本地和远程删除的方法

《一文详解Git中分支本地和远程删除的方法》在使用Git进行版本控制的过程中,我们会创建多个分支来进行不同功能的开发,这就容易涉及到如何正确地删除本地分支和远程分支,下面我们就来看看相关的实现方法吧... 目录技术背景实现步骤删除本地分支删除远程www.chinasem.cn分支同步删除信息到其他机器示例步骤

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

ModelMapper基本使用和常见场景示例详解

《ModelMapper基本使用和常见场景示例详解》ModelMapper是Java对象映射库,支持自动映射、自定义规则、集合转换及高级配置(如匹配策略、转换器),可集成SpringBoot,减少样板... 目录1. 添加依赖2. 基本用法示例:简单对象映射3. 自定义映射规则4. 集合映射5. 高级配置匹

在Golang中实现定时任务的几种高效方法

《在Golang中实现定时任务的几种高效方法》本文将详细介绍在Golang中实现定时任务的几种高效方法,包括time包中的Ticker和Timer、第三方库cron的使用,以及基于channel和go... 目录背景介绍目的和范围预期读者文档结构概述术语表核心概念与联系故事引入核心概念解释核心概念之间的关系

在Linux终端中统计非二进制文件行数的实现方法

《在Linux终端中统计非二进制文件行数的实现方法》在Linux系统中,有时需要统计非二进制文件(如CSV、TXT文件)的行数,而不希望手动打开文件进行查看,例如,在处理大型日志文件、数据文件时,了解... 目录在linux终端中统计非二进制文件的行数技术背景实现步骤1. 使用wc命令2. 使用grep命令

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到