因子分析Factor analysis

2023-12-10 10:58

本文主要是介绍因子分析Factor analysis,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介:本文主要介绍EM算法求解因子分析问题

因子分析Factor analysis

在文章  EM算法 求解混合高斯模型时,通常假设拥有足够多的样本去构造这个混合高斯分布,即样本数量n要远大于样本维数d:  如果样本数量小于样本维数,那么协方差矩阵 是奇异矩阵,那么  和都无法计算。在因子分析中,一个d维的向量通常由一个k维向量生成,通常k远小于d。具体模型如公式1所示:

公式1

上式中d x k维矩阵  称为因子载荷矩阵factor loading matrix,k维向量z称为因子factors,d维向量是满足均值为0,对角协方差矩阵的高斯分布的噪声,那么根据公式1该模型写成概率形式如公式2所示:

公式2

该模型如图1所示:

图1 因子分析生成模型

根据 Pattern Recognition and Machine Learning 已知公式2可得x的边缘概率和已知z的条件概率如公式3和公式4所示(详见原书公式2.113-2.117):

公式3

公式4

根据公式3采用极大似然估计法maximum-likelihood estimation (MLE) 可以的到似然函数如公式5所示:

公式5

直接对公式5求导并令其等于0很难得到结果,而EM算法可以很好的解决这个问题。

回顾 EM算法 (这里z为隐含变量),迭代过程如下所示:

  • E-Step:

公式6

  • M-Step:

公式7

上述算法E-Step直接利用公式4的结论,下面详细分析M-Step。把要求的最大化概率推到导公式8所示,其中K是和参数无关的常量:

公式8

去掉常量,最终需要最大化的式子如公式9所示:

公式9

  • 求参数

根据矩阵迹Trace性质 和矩阵求导的性质 ,公式9对 求偏导如下:

公式10
带颜色部分利用了矩阵相关性质,令其等于0我们可以得到:

整理可得  如公式11所示:

公式11

根据公式4,E[z]如公式12所示:

公式12

根据公式4,E[zz’]如公式13所示:
公式13

  • 求参数

公式9对  求偏导如下:

公式14

最后一步通过公式11代入得到,那么整理得到:

加上对角限制最终表达式如公式15所示:

公式15

EM算法运用于因子分析过程如下所示:

  • E-Step:

  • M-Step:

至此关于因子分析和EM算法推到全部结束。

参考文献

1、 CS229 Factor analysis
2、 The EM Algorithm for Mixtures of Factor Analysis
3、 The Expectation-Maximization (EM) Algorithm
4、 Pattern Recognition and Machine Learning

这篇关于因子分析Factor analysis的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/476915

相关文章

Versioned Staged Flow-Sensitive Pointer Analysis

VSFS 1.Introduction2.Approach2.1.相关概念2.2.VSFS 3.Evaluation参考文献 1.Introduction 上一篇blog我介绍了目前flow-sensitive pointer analysis常用的SFS算法。相比IFDS-based方法,SFS显著通过稀疏分析提升了效率,但是其内部依旧有许多冗余计算,留下了很大优化空间。 以

OpenCV_连通区域分析(Connected Component Analysis-Labeling)

申明:本文非笔者原创,原文转载自:http://blog.csdn.net/icvpr/article/details/10259577 OpenCV_连通区域分析(Connected Component Analysis/Labeling) 【摘要】 本文主要介绍在CVPR和图像处理领域中较为常用的一种图像区域(Blob)提取的方法——连通性分析法(连通区域标

CUICatalog: Invalid asset name supplied: (null), or invalid scale factor: 2.000000错误解决方案

[[UIImage imageNamed:@""] 当后面的字符串为空时,会出现题目中的错误 if (imagstr != nil) {         cell.imageView.image =[UIImage imageNamed:imagstr];     }

CST软件如何计算天线系数Antenna Factor-达索官方授权

天线系数(Antenna Factor)也称天线因子,是指天线附近接收的电场强度与天线端口生成的电压比值,简单讲就是天线接收电磁波,然后转化成电信号的能力;或者反过来,激励电信号之后,天线转化成电磁波的能力。由于电场单位是V/m,所以天线系数(简称AF)的单位就是每米“/m”,如果用dB表示的话,就是dBm^-1. 首先一个问题就是,天线系数和增益有什么区别呢?直接上公式吧,对于50欧姆的天线:

MATH36022 Numerical Analysis 2 Approximation of Functions – Week 3 Exercises

Show that the Chebyshev polynomials are orthogonal on ( − 1 , 1 ) (−1, 1) (−1,1) with respect to the weight function ( 1 − x 2 ) − 1 / 2 (1 − x^2)^{−1/2} (1−x2)−1/2. Ans: T n ( x ) = cos ⁡ ( n arcc

《Data Structure Algorithm Analysis in C》Chap.10笔记

5大算法:贪婪 Greedy,分治 Divide and conquer,动态规划 Dynamic Programming,随机 Randomized,回溯 Backtracking。 每一个小节都是一个具体的问题,应当仔细看,待看的:10.2.2-4,10.3,10.4.3,10.5.2。

05.德国博士练习_06_mapping_analysis

文章目录 1. exercise01: mapping multi-fields2. exercise02: nested and join mapping3. exercise03: custom analyzer 1. exercise01: mapping multi-fields # ** EXAM OBJECTIVE: MAPPINGS AND TEXT ANALYS

MATH36022 Numerical Analysis 2 Approximation of Functions – Week 2 Exercises

Attempt these exercises in advance of the tutorial in Week 3 Find the best L ∞ L_\infin L∞​ approximation to f ( x ) = x n + 1 + ∑ k = 0 n a k x k f (x) = x^{n+1} + \sum_{k=0}^na_kx^k f(x)=xn+1+∑k=

ROS naviagtion analysis: costmap_2d--ObstacleLayer

构造函数 ObstacleLayer(){costmap_ = NULL; // this is the unsigned char* member of parent class Costmap2D.这里指明了costmap_指针保存了Obstacle这一层的地图数据} 对于ObstacleLater,首先分析其需要实现的Layer层的方法: virtual void o

ROS naviagtion analysis: costmap_2d--StaticLayer

从UML中能够看到,StaticLayer主要是在实现Layer层要求实现的接口。 virtual void onInitialize();virtual void activate();virtual void deactivate();virtual void reset();virtual void updateBounds(double robot_x, double rob