矩阵的 Frobenius 范数及其求偏导法则

2024-04-30 02:08

本文主要是介绍矩阵的 Frobenius 范数及其求偏导法则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

矩阵的迹求导法则
矩阵的迹求导法则
矩阵的frobenius范数及其求偏导法则-1
矩阵的frobenius范数及其求偏导法则-2

1. 复杂矩阵问题求导方法:可以从小到大,从scalar到vector再到matrix
3
4
2. x is a column vector, A is a matrix

d(Ax)/dx=A
d(xTA)/dxT=A
d(xTA)/dx=AT
d(xTAx)/dx=xT(AT+A)

3. Practice:
5
4. 矩阵求导计算法则
求导公式(撇号为转置):
Y = A * X –> DY/DX = A’
Y = X * A –> DY/DX = A
Y = A’ * X * B –> DY/DX = A * B’
Y = A’ * X’ * B –> DY/DX = B * A’
乘积的导数:
d(f*g)/dx=(df’/dx)g+(dg/dx)f’

一些结论

  1. 矩阵Y对标量x求导:
    相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了
    Y = [y(ij)]–> dY/dx = [dy(ji)/dx]
  2. 标量y对列向量X求导:
    注意与上面不同,这次括号内是求偏导,不转置,对N×1向量求导后还是N×1向量
    y = f(x1,x2,..,xn) –> dy/dX= (Dy/Dx1,Dy/Dx2,..,Dy/Dxn)’
  3. 行向量Y’对列向量X求导:
    注意1×M向量对N×1向量求导后是N×M矩阵。
    将Y的每一列对X求偏导,将各列构成一个矩阵。
    重要结论:
    dX’/dX =I
    d(AX)’/dX =A’
  4. 列向量Y对行向量X’求导:
    转化为行向量Y’对列向量X的导数,然后转置。
    注意M×1向量对1×N向量求导结果为M×N矩阵。
    dY/dX’ =(dY’/dX)’
  5. 向量积对列向量X求导运算法则:
    注意与标量求导有点不同。
    d(UV’)/dX =(dU/dX)V’ + U(dV’/dX)
    d(U’V)/dX =(dU’/dX)V + (dV’/dX)U’
    重要结论:
    d(X’A)/dX =(dX’/dX)A + (dA/dX)X’ = IA + 0X’ = A
    d(AX)/dX’ =(d(X’A’)/dX)’ = (A’)’ = A
    d(X’AX)/dX =(dX’/dX)AX + (d(AX)’/dX)X = AX + A’X
  6. 矩阵Y对列向量X求导:
    将Y对X的每一个分量求偏导,构成一个超向量。
    注意该向量的每一个元素都是一个矩阵。
  7. 矩阵积对列向量求导法则:
    d(uV)/dX =(du/dX)V + u(dV/dX)
    d(UV)/dX =(dU/dX)V + U(dV/dX)
    重要结论:
    d(X’A)/dX =(dX’/dX)A + X’(dA/dX) = IA + X’0 = A
  8. 标量y对矩阵X的导数:
    类似标量y对列向量X的导数,
    把y对每个X的元素求偏导,不用转置。
    dy/dX = [Dy/Dx(ij) ]
    重要结论:
    y = U’XV= ΣΣu(i)x(ij)v(j) 于是 dy/dX = [u(i)v(j)] =UV’
    y = U’X’XU 则dy/dX = 2XUU’
    y =(XU-V)’(XU-V) 则 dy/dX = d(U’X’XU - 2V’XU + V’V)/dX = 2XUU’ - 2VU’ +0 = 2(XU-V)U’
  9. 矩阵Y对矩阵X的导数:
    将Y的每个元素对X求导,然后排在一起形成超级矩阵。
    10.乘积的导数
    d(f*g)/dx=(df’/dx)g+(dg/dx)f’
    结论
    d(x’Ax)=(d(x”)/dx)Ax+(d(Ax)/dx)(x”)=Ax+A’x (注意:”是表示两次转置)

矩阵求导 属于 矩阵计算,应该查找 Matrix Calculus 的文献:
http://www.psi.toronto.edu/matrix/intro.html#Intro
http://www.psi.toronto.edu/matrix/calculus.html
http://www.stanford.edu/~dattorro/matrixcalc.pdf
http://www.colorado.edu/engineering/CAS/courses.d/IFEM.d/IFEM.AppD.d/IFEM.AppD.pdf
http://www4.ncsu.edu/~pfackler/MatCalc.pdf
http://center.uvt.nl/staff/magnus/wip12.pdf

这篇关于矩阵的 Frobenius 范数及其求偏导法则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/947672

相关文章

hdu 4565 推倒公式+矩阵快速幂

题意 求下式的值: Sn=⌈ (a+b√)n⌉%m S_n = \lceil\ (a + \sqrt{b}) ^ n \rceil\% m 其中: 0<a,m<215 0< a, m < 2^{15} 0<b,n<231 0 < b, n < 2^{31} (a−1)2<b<a2 (a-1)^2< b < a^2 解析 令: An=(a+b√)n A_n = (a +

hdu 6198 dfs枚举找规律+矩阵乘法

number number number Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Problem Description We define a sequence  F : ⋅   F0=0,F1=1 ; ⋅   Fn=Fn

线性代数|机器学习-P35距离矩阵和普鲁克问题

文章目录 1. 距离矩阵2. 正交普鲁克问题3. 实例说明 1. 距离矩阵 假设有三个点 x 1 , x 2 , x 3 x_1,x_2,x_3 x1​,x2​,x3​,三个点距离如下: ∣ ∣ x 1 − x 2 ∣ ∣ 2 = 1 , ∣ ∣ x 2 − x 3 ∣ ∣ 2 = 1 , ∣ ∣ x 1 − x 3 ∣ ∣ 2 = 6 \begin{equation} ||x

【线性代数】正定矩阵,二次型函数

本文主要介绍正定矩阵,二次型函数,及其相关的解析证明过程和各个过程的可视化几何解释(深蓝色字体)。 非常喜欢清华大学张颢老师说过的一段话:如果你不能用可视化的方式看到事情的结果,那么你就很难对这个事情有认知,认知就是直觉,解析的东西可以让你理解,但未必能让你形成直觉,因为他太反直觉了。 正定矩阵 定义 给定一个大小为 n×n 的实对称矩阵 A ,若对于任意长度为 n 的非零向量 ,有 恒成

python科学计算:NumPy 线性代数与矩阵操作

1 NumPy 中的矩阵与数组 在 NumPy 中,矩阵实际上是一种特殊的二维数组,因此几乎所有数组的操作都可以应用到矩阵上。不过,矩阵运算与一般的数组运算存在一定的区别,尤其是在点积、乘法等操作中。 1.1 创建矩阵 矩阵可以通过 NumPy 的 array() 函数创建。矩阵的形状可以通过 shape 属性来访问。 import numpy as np# 创建一个 2x3 矩阵mat

【UVA】10003-Cutting Sticks(动态规划、矩阵链乘)

一道动态规划题,不过似乎可以用回溯水过去,回溯的话效率很烂的。 13988658 10003 Cutting Sticks Accepted C++ 1.882 2014-08-04 09:26:49 AC代码: #include<cstdio>#include<cstring>#include<iostream>#include<algorithm>#include

算法练习题17——leetcode54螺旋矩阵

题目描述 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。  代码 import java.util.*;class Solution {public List<Integer> spiralOrder(int[][] matrix) {// 用于存储螺旋顺序遍历的结果List<Integer> result = new ArrayList

线性代数 第六讲 特征值和特征向量_相似对角化_实对称矩阵_重点题型总结详细解析

文章目录 1.特征值和特征向量1.1 特征值和特征向量的定义1.2 特征值和特征向量的求法1.3 特征值特征向量的主要结论 2.相似2.1 相似的定义2.2 相似的性质2.3 相似的结论 3.相似对角化4.实对称矩阵4.1 实对称矩阵的基本性质4.2 施密特正交化 5.重难点题型总结5.1 判断矩阵能否相似对角化5.2 已知两个矩阵相似,求某个矩阵中的未知参数5.3 相似时,求可逆矩阵P,使

最大子矩阵和问题归纳总结

一,最大子矩阵问题: 给定一个n*n(0< n <=100)的矩阵,请找到此矩阵的一个子矩阵,并且此子矩阵的各个元素的和最大,输出这个最大的值。 Example: 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 其中左上角的子矩阵: 9 2 -4 1 -1 8 此子矩阵的值为9+2+(-4)+1+(-1)+8=15。 二,分析 子矩阵是在矩阵

3.门锁_STM32_矩阵按键设备实现

概述 需求来源: 门锁肯定是要输入密码,这个门锁提供了两个输入密码的方式:一个是蓝牙输入,一个是按键输入。对于按键输入,采用矩阵按键来实现。矩阵按键是为了模拟触摸屏的按键输入,后续如果项目结束前还有时间就更新为触摸屏按键输入。 矩阵按键开发整体思路: 由于矩阵按键就是GPIO的控制,所以不进行芯片和设备的分层编写,控制写在同一个文件中,最终向应用层提供一个接口。 代码层级关系: