不規則物體形狀匹配綜述

2023-10-12 00:18

本文主要是介绍不規則物體形狀匹配綜述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://www.cnblogs.com/CVArt/archive/2011/07/03/2096670.html

不規則物體形狀匹配綜述

  物體識別是計算機視覺應用的一項基本任務。識別通常基於目標物體的灰度信息、顏色信息或形狀信息。物體識別的目的就是要找到一個包含可以區分不同目標物體的有效信息的描述。由於要識別的物體是事先知道的,所以目標物體的幾何特征可以被直接應用到識別任務中。

  不規則物體的形狀匹配是一種有效的利用物體幾何特征進行識別的方法。根據匹配對象的不同,可以將不規則物體的形狀匹配分為基於區域的匹配方法和基於輪廓的匹配方法。

一、基於輪廓特征的形狀匹配

  基於輪廓特征的形狀匹配在實際中更為常用,這主要有兩方面的原因:一是基於輪廓特征的匹配計算量小,可以較好的滿足實時性要求;二是要識別的目標物通常是預先知道的,那麼它的幾何信息完全可以被用於識別過程中。為了識別不規則物體,主要任務就是設計一種基於(少量的)目標物幾何約束先驗知識的有效匹配方法。

1.   鏈碼直方圖(chain code histogram)

  鏈碼直方圖將人眼看上去相似的物體歸為一類。因此利用它不能進行精確的識別和分類。

  方向鏈碼(Freeman鏈碼)是用來表示物體輪廓的典型鏈碼表示法。一條離散曲線可以定義為Z2域內一組數量有限的8聯通點。因此,一條數字化二值曲線可以用方向鏈碼表示方向鏈碼是相鄰兩像素連線的8種可能的方向值。一條曲線被網格離散化後形成n個鏈碼方向,最終此曲線鏈碼可表示為{ai}n,每條鏈指向8個方向重的一個方向,ai={0,1,2,3,4,5,6,7},i為像素的索引值,ai是由像素(i)指向像素(i+1)的方向鏈碼。

  鏈碼直方圖的計算簡單而且快速。計算公式如下:

    

  其中,nk是一個鏈碼中鏈碼值k的數目,n是一個鏈碼中的節點數。

  

     (a)編碼的方向示意,(b)簡單物體形狀,(c)形狀的鏈碼表示,(d)鏈碼直方圖

  鏈碼法的特點:

  (1) 計算量小,可滿足實時性要求;

  (2) 具有平移、尺度不變性;

  (3) 具有90度旋轉不變性;

  (4) 規格化鏈碼直方圖可以達到更好的旋轉不變性。

2.   成對幾何直方圖(Pairwise Geometric Histogram)

  成對幾何直方圖通過相對角和相對位置特征來描述目標輪廓,並采用關系直方圖統計這對幾何特征來進行形狀索引。采用這種編碼方式需要具備一定的前提,即對於一個不規則物體我們可以將其近似為一個幾何多邊形。這種編碼方法可以很好地描述一個多邊形物體。

   將不規則形狀近似為多邊形,並將其定義為邊緣點的集合。這樣它所包含的輪廓邊緣(線段)就可以由連續的邊緣點來表示。接下來我們計算多邊形的PGH:將每一個輪廓邊緣視為其方向上的基准線,那麼它與其他輪廓邊緣間的相對角 以及最大最小垂直距離(dmin和dmax)可以被計算出來。邊緣之間的角度定義了直方圖的行,然後在其中增加對應的計算出來的最大和最小距離的所有直方塊,就得到了當前多邊形的PGH。

  它具有如下特點:

  (1) 計算簡單,可滿足實時性要求;

  (2) 具有平移、尺度不變性;

  (3) 具有360度旋轉不變性。

3.   簡單形狀描述符的結合(Combination of Simple Shape Descriptors)

  如圖,它們是幾種簡單的形狀描述符,分別代表了凹凸性、主軸、致密性、差異性和橢圓差異性。

  凹凸性:輪廓凸包周長與原輪廓周長的比率。(所有凸起的覆蓋輪廓稱為凸包)

  主軸:過物體質心的正交軸,主軸之間的比例可以由物體輪廓的協方差矩陣計算出來

  致密性:物體區域面積與等面積的正方形周長的比例,也可以是圓。

  差異性:表現為與模板比較的比例均方誤差。

   

  單獨用這幾種簡單描述符的任何一種來表示形狀進行匹配,都不能達到較好的匹配結果。但是如果我們將這五種簡單形狀描述符進行結合,同時用它們來描述一個形狀,那麼這個形狀的描述信息就非常豐富了,匹配的結果也會很好。

這種形狀描述方式具有如下的特點:

  (1) 單獨的任何一種簡單描述符都不能用於精確識別物體,但是多種簡單描述符的結合可以達到很高的識別效率;

  (2) 計算簡單,可以達到實時性;

  (3) 具有平移、尺度不變性;

  (4) 理論上360度旋轉不變性。

4.   基於hausdorff距離的形狀匹配

  Hausdorff距離用來計算兩個點集之間的匹配程度。給定兩個有限集A={a1,a2,…,ap}和B={b1,b2,…,bq},A,B之間的Hausdorff距離定義如下:

  

  其中:

  

  

  Hausdorff距離H(A,B)取h(A,B)和h(B,A)的最大值,這樣通過計算h(A,B)和h(B,A)就可以獲得兩個點集A,B之間的匹配程度。

  

  為了減少計算量,可以取角點進行匹配。但這樣匹配率將降低。基於hausdorff距離的形狀匹配的特點;

  (1) 對每個邊緣點進行hausdorff距離計算,計算量稍大,但對不是過於復雜的輪廓(如小尺寸輪廓),可以滿足實時性;

  (2) 具有平移、尺度不變性;

  (3) 具有旋轉不變性;

二、基於區域特征的形狀匹配

  基於不變矩的形狀匹配是典型的基於區域的匹配方法。其中,基於Hu不變矩的形狀匹配應用最為廣泛。

      圖像的矩函數在模式識別、目標分類中得到了廣泛的應用。在1961年首先基於代數不變量引入矩不變量。通過對幾何矩的非線性組合,導出了一組對於圖像平移、尺度、旋轉變化不變的矩,這種矩就成為Hu矩。

       一幅大小為M×N的二維圖像 其中(p+q)階矩:

對於二值圖像,其零階矩就是該形狀區域的面積。因此,將面積歸一化,每一個圖像矩除以零階矩得到的商具有形狀的尺度變化無關性。

  求圖像的p+q階中心矩,面積歸一化,使得具有平移、尺度不變性。

  (1) 

  (2) 

  計算圖像的7個面積歸一化的中心矩,{m11,m02,m20,m21,m12,m03,m30}Hu不變矩是關於這7個矩的函數。具有平移、旋轉和尺度不變性。

  

  彩色圖像Hu不變矩的計算流程如下:

  

  基於Hu矩的形狀匹配所具有的特點:

  (1) Hu不變矩只能用於對區域的檢測,不能用於邊界的檢測,但由於計算簡單,計算量不大,可以滿足實時性;

  (2) 具有平移、尺度不變性;

  (3) 具有旋轉不變性。

三、匹配方法間的比較

  

  CCH(鏈碼直方圖):是一種基於輪廓匹配方法。具有較強的平移不變性,尺度不變性一般,具有90度的旋轉不變性。由於編碼簡單,執行速度快。計算量和所需內存都較小,適合差別明顯的物體,對平滑和非平滑物體的識別並不明顯;

  PGH(成對幾何直方圖):是一種基於輪廓匹配方法。具有較強的平移不變性和尺度不變性,具有360度的旋轉不變性。執行速度快,可以較好地識別多邊形物體和部分自封閉的物體,由於它的計算過程,對非多邊形物體的識別可能會浪費計算量;

  CFSS(五種簡單形狀描述符結合):是一種基於輪廓匹配方法。具有較強的平移不變性和尺度不變性,具有360度的旋轉不變性。執行速度處於CCH方法和PGH方法之間。識別率與PGH相當,但是比它需要更少的計算時間和內存。

  HAUSDORFF距離:是一種基於輪廓匹配方法。具有較強的平移不變性,但是尺度不變性和旋轉不變性都較差。由於處理的數據維數較多,執行效率是這五種方法中最慢的一個。可用於匹配部分重和形狀物體。

  Hu不變矩:是一種基於區域的形狀匹配方法。具有較強的平移、尺度和旋轉不變性,其中旋轉不變性為360度。但由於匹配的數據量大,執行速度較慢。適合於進行一些更精確的匹配。

这篇关于不規則物體形狀匹配綜述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/191867

相关文章

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

POJ 3057 最大二分匹配+bfs + 二分

SampleInput35 5XXDXXX...XD...XX...DXXXXX5 12XXXXXXXXXXXXX..........DX.XXXXXXXXXXX..........XXXXXXXXXXXXX5 5XDXXXX.X.DXX.XXD.X.XXXXDXSampleOutput321impossible

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

二分图的最大匹配——《啊哈!算法》

二分图 如果一个图的所有顶点可以被分为X和Y两个集合,并且所有边的两个顶点恰好一个属于X,另外一个属于Y,即每个集合内的顶点没有边相连,那么此图就是二分图。 二分图在任务调度、工作安排等方面有较多的应用。 判断二分图:首先将任意一个顶点着红色,然后将其相邻的顶点着蓝色,如果按照这样的着色方法可以将全部顶点着色的话,并且相邻的顶点着色不同,那么该图就是二分图。 java

web群集--nginx配置文件location匹配符的优先级顺序详解及验证

文章目录 前言优先级顺序优先级顺序(详解)1. 精确匹配(Exact Match)2. 正则表达式匹配(Regex Match)3. 前缀匹配(Prefix Match) 匹配规则的综合应用验证优先级 前言 location的作用 在 NGINX 中,location 指令用于定义如何处理特定的请求 URI。由于网站往往需要不同的处理方式来适应各种请求,NGINX 提供了多种匹

JavaScript 根据关键字匹配数组项

要在JavaScript数组中根据关键字匹配项,可以使用filter方法结合一个测试函数。以下是一个示例代码,定义了一个函数findByKeyword,该函数接受一个数组和一个关键字,然后返回一个新数组,其中包含与关键字匹配的所有项。 function findByKeyword(array, keyword) {return array.filter(item => {// 假设要匹配的是对象

匹配电子邮件地址的正则表达式

这个正则表达式 QRegularExpression regex(R"((\w+)(\.|_)?(\w+)@(\w+)(\.(\w+))+))"); 用于匹配电子邮件地址的格式。下面是对这个正则表达式的逐步解析和解释: 1. QRegularExpression 构造函数 QRegularExpression regex(R"((\w+)(\.|_)?(\w*)@(\w+)(\.(\w+))+

ORA-01861:文字与格式字符串不匹配

select t.*, t.rowid from log_jk_dtl t; insert into log_jk_dtl (rq,zy,kssj,jssj,memo)  values (to_date(sysdate,'yyyy-mm-dd'),'插入供应商', to_char(sysdate,'hh24:mi:ss'),to_char(sysdate,'hh24:mi:ss'),'备注'