线性代数|机器学习-P35距离矩阵和普鲁克问题

2024-09-08 09:28

本文主要是介绍线性代数|机器学习-P35距离矩阵和普鲁克问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1. 距离矩阵
  • 2. 正交普鲁克问题
  • 3. 实例说明

1. 距离矩阵

假设有三个点 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3,三个点距离如下:
∣ ∣ x 1 − x 2 ∣ ∣ 2 = 1 , ∣ ∣ x 2 − x 3 ∣ ∣ 2 = 1 , ∣ ∣ x 1 − x 3 ∣ ∣ 2 = 6 \begin{equation} ||x_1-x_2||^2=1,||x_2-x_3||^2=1,||x_1-x_3||^2=6 \end{equation} ∣∣x1x22=1,∣∣x2x32=1,∣∣x1x32=6

  • 根据上面的公式发现不满足三角不等式定理,两边之和大于第三边 1 + 1 ≤ 6 1+1\le6 1+16
  • 根据三个点组成的距离矩阵Distance Matrix如下:
    D = [ 0 1 6 1 0 1 6 1 0 ] \begin{equation} D=\begin{bmatrix} 0&1&6\\\\ 1&0&1\\\\ 6&1&0 \end{bmatrix} \end{equation} D= 016101610
  • 假设我们有两个点 x 1 , x 2 x_1,x^2 x1,x2,那么 d i j d_{ij} dij的定义:
    D i j = ∣ ∣ x i − x j ∣ ∣ 2 = ( x i − x j ) T ( x i − x j ) = x i T x i − x i T x j − x j T x i + x j T x j \begin{equation} D_{ij}=||x_i-x_j||^2=(x_i-x_j)^T(x_i-x_j)=x_i^Tx_i-x_i^Tx_j-x_j^Tx_i+x_j^Tx_j \end{equation} Dij=∣∣xixj2=(xixj)T(xixj)=xiTxixiTxjxjTxi+xjTxj
  • 由于对称性可得: x i T x j = x j T x i x_i^Tx_j=x_j^Tx_i xiTxj=xjTxi,故化简可得:
    D i j = x i T x i − 2 x i T x j + x j T x j \begin{equation} D_{ij}=x_i^Tx_i-2x_i^Tx_j+x_j^Tx_j \end{equation} Dij=xiTxi2xiTxj+xjTxj
  • 为了方便计算,我们定义一个矩阵G表示如下:
    X = [ x i x j ] ; X T = [ x i T x j T ] → G = X T X = [ x i T x i x i T x j x j T x i x j T x j ] \begin{equation} X=\begin{bmatrix}x_i&x_j\end{bmatrix};X^T=\begin{bmatrix}x_i^T\\\\x_j^T\end{bmatrix}\to G=X^TX=\begin{bmatrix}x_i^Tx_i&x_i^Tx_j\\\\x_j^Tx_i&x_j^Tx_j\end{bmatrix} \end{equation} X=[xixj];XT= xiTxjT G=XTX= xiTxixjTxixiTxjxjTxj
  • 由此我们可以用G来表示D如下:
    D i j = G i i − 2 G i j + G j j \begin{equation} D_{ij}=G_{ii}-2G_{ij}+G_{jj} \end{equation} Dij=Gii2Gij+Gjj
  • 优势:为什么我们要这么费力的做?原因在于,我们求D矩阵的时候,我们需要不断的进行多重循环,效率非常低,如果我们这种方法,第一步通过点乘求得矩阵G,第二步只需要简单的抽取矩阵G中的元素,第三步就通过简单的加减乘除即可得到同样结果的距离矩阵D,结果是一样,但是此种算法大大减少了计算量,真是太神奇了!!!
  • 参考链接:
    斯坦福CS231N课程笔记(三)-距离矩阵的计算方法

2. 正交普鲁克问题

假设有两个矩阵A,B ,我们希望找到一个正交矩阵Q,使得 ∣ ∣ A Q − B ∣ ∣ F ||AQ-B||_F ∣∣AQBF最小?
min ⁡ ∣ ∣ A Q − B ∣ ∣ F ; s t : Q T Q = I \begin{equation} \min||AQ-B||_F;st:Q^TQ=I \end{equation} min∣∣AQBF;st:QTQ=I

  • 其中 A , B ∈ R m × n A,B\in R^{m\times n} A,BRm×n,待求 Q ∈ R n × n Q\in R^{n\times n} QRn×n为正交矩阵

3. 实例说明

  • 假设我们有一个矩阵A,B表示如下,希望找到一个正交矩阵Q使得 ∣ ∣ A Q − B ∣ ∣ F ||AQ-B||_F ∣∣AQBF尽可能的小?
    A = [ 1 0 0 1 1 1 ] ; B = [ 0 − 1 1 0 1 − 1 ] ; \begin{equation} A=\begin{bmatrix} 1&0\\\\ 0&1\\\\ 1&1\end{bmatrix};B=\begin{bmatrix} 0&-1\\\\ 1&0\\\\ 1&-1\end{bmatrix}; \end{equation} A= 101011 ;B= 011101 ;
  • 第一步: 求矩阵C
    C = A T B = [ 1 0 1 0 1 1 ] [ 0 − 1 1 0 1 − 1 ] = [ 1 − 2 2 − 1 ] ; \begin{equation} C=A^TB=\begin{bmatrix} 1&0&1\\\\ 0&1&1\end{bmatrix}\begin{bmatrix} 0&-1\\\\ 1&0\\\\ 1&-1\end{bmatrix}=\begin{bmatrix} 1&-2\\\\ 2&-1\end{bmatrix}; \end{equation} C=ATB= 100111 011101 = 1221 ;
  • 第二步:将矩阵C进行奇异值分解SVD:
    C = U Σ V T ; U = [ − 1 2 − 1 2 − 1 2 1 2 ] Σ = [ 3 0 0 1 ] ; V T = [ − 1 2 1 2 1 2 1 2 ] \begin{equation} C=U\Sigma V^T;U=\begin{bmatrix} -\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\\ -\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix} \Sigma=\begin{bmatrix} 3&0\\\\ 0&1\end{bmatrix};V^T=\begin{bmatrix} -\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\\ \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix} \end{equation} C=UΣVT;U= 2 12 12 12 1 Σ= 3001 ;VT= 2 12 12 12 1
  • 第三步: 求出正交矩阵Q
    Q = U V T = [ − 1 2 − 1 2 − 1 2 1 2 ] [ − 1 2 1 2 1 2 1 2 ] = [ 0 − 1 1 0 ] \begin{equation} Q=UV^T=\begin{bmatrix} -\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\\ -\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix} \begin{bmatrix} -\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\\ \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}= \begin{bmatrix} 0&-1\\\\ 1&0\end{bmatrix} \end{equation} Q=UVT= 2 12 12 12 1 2 12 12 12 1 = 0110
  • 第四步,验证 ∣ ∣ A Q − B ∣ ∣ ||AQ-B|| ∣∣AQB∣∣
    ∣ ∣ A Q − B ∣ ∣ F = 0 \begin{equation} ||AQ-B||_F=0 \end{equation} ∣∣AQBF=0
  • 小结:这种方法还真能够找到正交矩阵Q.

这篇关于线性代数|机器学习-P35距离矩阵和普鲁克问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1147728

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

Redis出现中文乱码的问题及解决

《Redis出现中文乱码的问题及解决》:本文主要介绍Redis出现中文乱码的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 问题的产生2China编程. 问题的解决redihttp://www.chinasem.cns数据进制问题的解决中文乱码问题解决总结

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

Springboot如何正确使用AOP问题

《Springboot如何正确使用AOP问题》:本文主要介绍Springboot如何正确使用AOP问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录​一、AOP概念二、切点表达式​execution表达式案例三、AOP通知四、springboot中使用AOP导出

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题

《解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题》:本文主要介绍解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4... 目录未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘打开pom.XM

IDEA Maven提示:未解析的依赖项的问题及解决

《IDEAMaven提示:未解析的依赖项的问题及解决》:本文主要介绍IDEAMaven提示:未解析的依赖项的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝... 目录IDEA Maven提示:未解析的依编程赖项例如总结IDEA Maven提示:未解析的依赖项例如

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

SpringBoot+Redis防止接口重复提交问题

《SpringBoot+Redis防止接口重复提交问题》:本文主要介绍SpringBoot+Redis防止接口重复提交问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录前言实现思路代码示例测试总结前言在项目的使用使用过程中,经常会出现某些操作在短时间内频繁提交。例