因子分析Factor analysis

2023-12-10 10:58

本文主要是介绍因子分析Factor analysis,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介:本文主要介绍EM算法求解因子分析问题

因子分析Factor analysis

在文章  EM算法 求解混合高斯模型时,通常假设拥有足够多的样本去构造这个混合高斯分布,即样本数量n要远大于样本维数d:  如果样本数量小于样本维数,那么协方差矩阵 是奇异矩阵,那么  和都无法计算。在因子分析中,一个d维的向量通常由一个k维向量生成,通常k远小于d。具体模型如公式1所示:

公式1

上式中d x k维矩阵  称为因子载荷矩阵factor loading matrix,k维向量z称为因子factors,d维向量是满足均值为0,对角协方差矩阵的高斯分布的噪声,那么根据公式1该模型写成概率形式如公式2所示:

公式2

该模型如图1所示:

图1 因子分析生成模型

根据 Pattern Recognition and Machine Learning 已知公式2可得x的边缘概率和已知z的条件概率如公式3和公式4所示(详见原书公式2.113-2.117):

公式3

公式4

根据公式3采用极大似然估计法maximum-likelihood estimation (MLE) 可以的到似然函数如公式5所示:

公式5

直接对公式5求导并令其等于0很难得到结果,而EM算法可以很好的解决这个问题。

回顾 EM算法 (这里z为隐含变量),迭代过程如下所示:

  • E-Step:

公式6

  • M-Step:

公式7

上述算法E-Step直接利用公式4的结论,下面详细分析M-Step。把要求的最大化概率推到导公式8所示,其中K是和参数无关的常量:

公式8

去掉常量,最终需要最大化的式子如公式9所示:

公式9

  • 求参数

根据矩阵迹Trace性质 和矩阵求导的性质 ,公式9对 求偏导如下:

公式10
带颜色部分利用了矩阵相关性质,令其等于0我们可以得到:

整理可得  如公式11所示:

公式11

根据公式4,E[z]如公式12所示:

公式12

根据公式4,E[zz’]如公式13所示:
公式13

  • 求参数

公式9对  求偏导如下:

公式14

最后一步通过公式11代入得到,那么整理得到:

加上对角限制最终表达式如公式15所示:

公式15

EM算法运用于因子分析过程如下所示:

  • E-Step:

  • M-Step:

至此关于因子分析和EM算法推到全部结束。

参考文献

1、 CS229 Factor analysis
2、 The EM Algorithm for Mixtures of Factor Analysis
3、 The Expectation-Maximization (EM) Algorithm
4、 Pattern Recognition and Machine Learning

这篇关于因子分析Factor analysis的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/476915

相关文章

综合评价 | 基于因子分析和聚类分析的节点重要度综合评价(Matlab)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 综合评价 | 基于因子分析和聚类分析的节点重要度综合评价(Matlab) 程序设计 完整程序和数据获取方式:私信博主回复基于因子分析和聚类分析的节点重要度综合评价(Matlab)。 参考资料 [1] http://t.csdn.cn/pCWSp [2] https://download.

文本挖掘之降维技术之特征提取之因子分析(FA)

因子分析法(FA)     因子分析法是通过将原有变量内部的相互依赖关系进行数据化,把大量复杂关系归为少量的几个综合因子的统计方法。它的基本思想是通过分析各变量之间的方差贡献效果,将大的即相关性高的联系比较紧密的分在同一个类别中,而不同类的则相关性是比较低的,这其中一个类别描述了一种独立结构,这个结构在因子分析法中叫做公共因子。这个方法的研究目的就是尝试使用少数几个不可测的通过协方差矩阵计算得来

当 Alphalens 遇上 DolphinDB:单因子分析利器再升级

多因子投研一直都是量化投资领域当中的重要基石,Alphalens 和 DolphinDB,作为知名的单因子分析框架和基于高性能时序数据库的时序计算平台,无疑是备受瞩目的两大因子投研利器。当二者相结合,将碰撞出怎样令人期待的火花? 1. Alphalens 和 DolphinDB 的简介 Alphalens 是 Quantopian 用 Python 开发的一个因子分析(评价)工具包。我们用 D

【PL理论】(31) 类型系统:静态分析 (Static Analysis) | 静态类型系统 | 什么是类型?

💭 写在前面:本章我们将进入类型系统的讲解,回顾一下之前我们整理的 F- 语言,然后介绍一下静态分析和静态类型系统。讨论程序员该如何处理一些 bug,有没有完美的静态分析器。 目录 0x00 回顾:F- 语言 0x01 静态分析(Static Analysis) 0x02 静态类型系统(Static Type System) 0x03 什么是类型? 0x00 回顾:F- 语言

因子分析模板

因子分析的模板 2011A-2模板论文 P10           因子分析的主要步骤如下: 数据标准化 由于不同重金属元素的量纲可能不同, 因此为了消除量纲对数据的影响, 对所有的重金属采用下面的公式对数据进行归一化处理: 其中 表示第i个采样点第j种元素的浓度实测值, 表示第j种重金属元素的实测值的平均值,表示第j种重金属元素实测值的标准差

词频统计(Word Frequency Analysis)详解

词频统计(Word Frequency Analysis)是语言学和文本分析中的一个重要工具,用于统计文本中各个词汇的出现频率。以下是关于词频统计(PTA)的详细解释,结合参考文章中的相关信息进行归纳和总结: 一、定义与目的 词频统计是对语篇或语料库中某一语词或短语出现的频数进行统计的过程或结果。其目的是通过量化词汇在文本中的出现次数,分析文本的主题、关键词、趋势等信息,为文本分析、数据挖掘、

Python图片数据增强crop、rotate、environment factor

简介 利用Python的CV模块,实现图片数据的增强操作:随机裁剪、旋转角度、增强光照噪声。 结果 代码 '''Created on 2017年9月14日@author: XT'''import cv2import numpy as npimport os.pathimport randomimport mathdef rotate( img, #image matr

MATLAB算法实战应用案例精讲-【数模应用】因子分析(附MATLAB和python代码实现)

目录 前言 算法原理 SPSS因子分析 操作步骤 结果分析 SPSSAU 因子分析案例 1、背景 2、理论 3、操作 4、SPSSAU输出结果 5、文字分析 6、剖析 疑难解惑 同源方差或共同方法变异偏差,Harman单因子检验? 提示出现奇异矩阵? 因子得分和综合得分? 因子分析计算权重? KMO值过低? 无论如何均‘张冠李戴’或‘纠缠不清’? 因子分析

为什么 google analysis 的 Custom Dimensions 设置后 Explorations 中不显示选项

可能有以下几种原因: 未完成配置或发布: 确保自定义维度已经完全设置,并且配置已经发布。未发布的设置不会生效。 数据处理延迟: 自定义维度设置后,数据处理可能需要一些时间。通常需要24到48小时才能在报告和探索中看到新的自定义维度。 范围问题: 确保自定义维度的范围(Scope)正确。GA4中的自定义维度可以有事件范围、用户范围等。范围设置错误可能导致在某些报告中不可见。 数据收集不完整

second order system analysis in adaptive control 自控 带零点的二阶系统matlab仿真分析

带零点的二阶系统matlab仿真分析 上图是使用Matlab的simulink对带零点的二阶系统模型和不带零点的二阶系统进行仿真分析的模拟图 仿真示波器输出结果: 上面的波形是带零点的二阶系统输出 下面的波形是不带零点的二阶系统的波形输出 我们可以看出,零点(位于实轴负半轴)对二阶系