本文主要是介绍机器学习实战 --- 利用PCA简化数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
降维技术
— 场景:
-
我们正在通过电视观看体育比赛,在电视的显示器上有一个球。
-
显示器大概包含100W个像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。
-
人们在实时的将显示器上的百万像素转化成为一个三维图形,该图像就给出运动场上球的位置。
-
在这个过程中,人们已经将百万像素点的数据,降维到三维。这个过程就称为降维(dimensionality reduction)
— 数据显示并非大规模特征下的唯一难题,对数据进行简化还有如下一系列的原因:
-
使得数据更容易使用
-
降低很多算法的计算开销
-
去除噪音
-
使得结果更易懂
— 适用范围:
-
在已标注与未标注的数据上都有降维技术
-
这里我们将关注未标注数据上的降维技术,将技术同样也可以应用于已标注的数据
— 以下3种降维技术中,PCA的应用目前最为广泛。
-
主成分分析(Principal Component Analysis, PCA)
-
-
通俗理解:就是找出一个最重要的特征,然后进行分析。
-
例如:考察一个人的智力情况,就直接看数学成绩就行(存在:数学、语文、英语成绩)
-
-
因子分析(
这篇关于机器学习实战 --- 利用PCA简化数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!