发布网友 发布时间:2022-04-26 06:25
共1个回答
热心网友 时间:2022-06-23 16:59
PCA把原先的n个特征用数目更少的m个特征取代,新的m个特征一要保证最大化样本方差,二保证相互独立的。新特征是旧特征的线性组合,提供一个新的框架来解释结果。
PCA的原理就是维数投影,通俗的说可以把3维或者更高维数投影到2维或者1维坐标上,PC1和PC2就是主元得分,三维的点投影到二维的位置就是主元得分,其次怎么确定投影坐标的维数呢,需要一个累计贡献率去做,比如保证百分之85的信息,再去确定其坐标维数;
计算的话,先算协方差,然后确定特征向量和特征值,通过累计贡献率算维数,然后原有数据乘以特征矩阵得到得分值,具体的你可以看看文献内容。
扩展资料:
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
参考资料来源:百度百科-主成分分析