机器学习中PCA和ICA的理解

本文主要是介绍机器学习中PCA和ICA的理解，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在高维数据处理中，为了简化计算量以及储存空间，需要对这些高维数据进行一定程度上的降维，并尽量保证数据的不失真。PCA和ICA是两种常用的降维方法。

PCA：principal component analysis ，主成分分析

ICA ：Independent component analysis，独立成分分析

PCA,ICA都是统计理论当中的概念，在机器学习当中应用很广，比如图像，语音，通信的分析处理。

PCA是找出信号当中的不相关部分(正交性），对应二阶统计量分析。PCA的实现一般有两种，一种是用特征值分解去实现的，一种是用奇异值(SVD)分解去实现。特征值分解也有很多的局限，比如说变换的矩阵必须是方阵,SVD没有这个限制。

PCA的问题其实是一个基的变换，使得变换后的数据有着最大的方差。方差的大小描述的是一个变量的信息量，我们在讲一个东西的稳定性的时候，往往说要减小方差，如果一个模型的方差很大，那就说明模型不稳定了。但是对于我们用于机器学习的数据（主要是训练数据），方差大才有意义，不然输入的数据都是同一个点，那方差就为0了，这样输入的多个数据就等同于一个数据了。