Multidimensional Scaling(MDS多维缩放)算法及其应用

2023-12-06 23:04

本文主要是介绍Multidimensional Scaling(MDS多维缩放)算法及其应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这篇博客中,我将与大家分享在流形分析领域的一个非常重要的方法,即多维缩放MDS。整体来说,该方法提供了一种将内蕴距离映射到显性欧氏空间的计算,为非刚性形状分析提供了一种解决方案。当初就是因为读了Bronstein的相关工作【1】,才下定决心在人脸数据分析中使用内蕴度量来建立特征分析方法,可以说MDS对我的学术之路起到了很大的影响作用。


1. 前言

在非刚性形状匹配中,我们希望找到两个曲面的对应关系。由于受到非刚性形变影响,使得我们不能直接建立基于类似ICP一样的方法来实现对准。提到非刚性分析,很自然的就会让人联想到使用基于曲面第一基本形式的内蕴几何特征来建立分析方法。对于人脸人体这种非刚性形变分析对象,由于受到骨架的约束,使得其非刚性形变满足近似等距的特性,这里的等距指测地线。曲面第一基本形式对应曲面曲线,刚好可以使用测地线作为表示。那么,我们只要基于测地线来建立几何特征表达,就能够实现近似等距条件下的形状分析,进而满足非刚性形状分析要求。

关于测地线的计算,我在之前的博客已经有所介绍,有兴趣的同学可以翻看:

Fast Marching算法及其在点云测地线计算中的应用-CSDN博客

Geodesic in Heat: 一种测地线计算方法-CSDN博客

在有了测地线作为内蕴几何特征的显性表示后,我们希望对原始曲面建立一种形状度量,这种度量由测地线定义,能够反映形状之间的相似程度,进而推出点的对应关系。一个最直接的想法是利用参数化的方法。通过参数化,我们能够对原始的曲面进行“摊平”,进而在摊平后的参数域建立对应。然而,参数化需要指定边界和控制点,其本身的计算也相对复杂。如果对于拓扑相对复杂的形状建立参数化,其对原始测地线距离将会产生严重扭曲,即不再是可控的近似等距变换。我们希望使用类似ICP那样的直接距离对应方法,对基于测地线表示的曲面进行匹配。一个理想的方案是将点对间的测地距离,变换到一个m维的欧氏空间。在该欧氏空间中,点与点的欧氏距离与未变换前的点对测地距离存在一种对应关系。这样,我们只需要在变换后的形状进行刚性配准,点对的结果就对应了原始数据的非刚性对应结果。这就是使用MDS方法实现非刚性形状分析的初始想法。


2. MDS介绍

如前所述,MDS的目的就是将点间的测地距离嵌入到一个新的欧氏空间中,使得内蕴距离获得显性化的表达。在相关工作【2】中,这种嵌入后的曲面表达被称为bending-invariant canonical forms。具体过程如下:

首先我们给出一个测地线的表示δij,表示两点pi和pj的测地距离。我们把所有点的行列组成矩阵形式,使用δij填满,ij相等为0。然后,我们对δij求平方,重写矩阵里的项:

Δ所表达的矩阵在等距变换下是不变的,但是其形式会因为点序号的变化而变化。我们希望获得一个测地距离不变的表示,且具有唯一性。这时,就可以利用MDS将其嵌入到一个低维的欧氏空间中,该过程等价于:

嵌入误差可以写为:

MDS方法也包含很多类别,Bronstein在论文【3】中提到一种称为classical scaling【4】的方法来实现MDS:

首先对Δ进行中心化操作,即double-centering。J=I-1/2U,I是单位矩阵,U是一个完全由1组成的矩阵。之后对B进行主成分分析,获得对应的m个特征值和特征向量:

i对应点的序号,j对应m的维度,一般m取3,即将原始形状基于测地距离映射会三维欧氏空间。这样经过特征向量e表达的新坐标x在欧氏空间组成一个新的形状,在工作【1】中被称为Canonical form,以我的观点来看,即内蕴型。


3. 应用

Bronstein在最开始设计算法的时候,目标就是解决三维人脸识别中的表情鲁棒问题。他在论文中已经提到了一般性非刚性形状分析可以转换为对内蕴距离向欧氏空间的嵌入,如下图:

上面的例子充分说明将测地线嵌入回欧氏空间,对应的形状所具备的近似等距特性。原来手指的欧氏距离,一定会因为非刚性形变发生变化,但是对应的测地距离是稳定的。将测地距离嵌入回欧氏空间,得到右边的Canonical form,其点的欧氏距离就具备了原来点的测地距离特性。这时我们再使用类似ICP的方法,就能够非常方便的建立对应关系。

表情即被认为是一种近似等距的非刚性形变,如果我们对人脸数据进行类似Canonical form的变换,那么变换的结果自然会获得对表情不变的结果。原论文中给出了示意图:

可以看到第一行的人脸是具有多种不同的表情的。但是这些人脸的Canonical form具有极其相近的几何表示。在Canonical form的基础上,设计三维人脸识别算法,自然能获得表情鲁棒特性。论文中还给了一个系统界面:

整个算法流程还是非常清晰的。但是求Δ需要的庞大计算量,限制了该算法的效率。

Reference

[1] Bronstein AM, Bronstein MM, Kimmel R. Three-dimensional face recognition[J]. International Journal of Computer Vision, 2005, 64: 5-30.

[2] Elad A, Kimmel R. Bending Invariant Representations for Surfaces[C]. Proceedings of the Conference on Computer Vision and Pattern Recognition, 2001, 2: 168-168.

[3] Bronstein AM, Bronstein MM, Kimmel R. Expression-invariant 3D face recognition[C]. International conference on Audio-and video-based biometric person authentication, 2003: 62-70.

[4] Young G, Householder A S. Discussion of a set of points in terms of their mutual distances[J]. Psychometrika, 1938, 3(1): 19-22.

这篇关于Multidimensional Scaling(MDS多维缩放)算法及其应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/463678

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO