本文主要是介绍ML4因子分析笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
因子分析
by chenlongzhen
from dataguru
因子分析简介
- 降维的一种方法,是主成分分析的推广和发展
- 是用于分析隐藏在表面现象背后的因子作用的统计模型。试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量
- 例子:各科学习成绩(数学能力,语言能力,运劢能力等)
- 例子:生活满意度(工作满意度,家庭满意度)
- 例子:薛毅书P522
因子分析的主要用途
- 减少分析变量个数
- 通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变量分为一组,用共性因子来代替该变量
- 使问题背后的业务因素的意义更加清晰呈现
与主成分分析的区别
- 主成分分析侧重“变异量”(分散程度),通过转换原始变量为新的组合变量使到数据的“变异量”最大,从而能把样本个体之间的差异最大化,但得出来的主成分往往从业务场景的角度难以解释
- 因子分析更重视相关变量的“共变异量”,组合的是相关性较强的原始变量,目的是找到在背后起作用的少量关键因子,因子分析的结果往往更容易用业务知识去加以解释
因子分析使用的数学方法
- 求解模型的方法:主成分法,主因子法,极大似然法(原理请参见薛毅书)
- 结果还可以通过因子旋转,使到业务意义更加明显
应用
- 企业绩效考核
- 股票市场指标设计(学完quantmod再实现)
- 等
这篇关于ML4因子分析笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!