特征向量的结果:
原始数据:(18样本*6变量)
92 77 80 95 99 126
97 75 77 80 95 125
95 80 70 78 89 120
75 75 73 88 98 110
92 68 72 79 88 113
90 85 80 70 78 103
72 93 75 77 80 100
88 70 76 72 81 102
64 70 69 85 93 105
70 73 70 87 84 100
78 69 75 73 89 97
78 72 71 68 75 96
75 64 63 76 73 92
84 66 77 55 65 76
70 64 51 60 67 88
58 72 75 62 52 75
82 73 40 50 48 61
45 65 42 47 43 60
三种方法特征根都是一样的:
3.9829 0.8314 0.6630 0.4120 0.0640 0.0466
但特征向量不一样:
SAS、SPSS的结果(特征向量矩阵):
0.342794 0.071053 0.882724 0.118374 0.287588 0.039016
0.253554 0.914051 -.200006 0.233780 -.020130 0.071834
0.403902 0.112564 -.045051 -.906119 0.006436 -.032695
0.446693 -.234003 -.405320 0.201942 0.711506 -.185481
0.472785 -.263329 -.120036 0.154394 -.296973 0.762033 0.481670 -.150637 0.008555 0.213692 -.567814 -.614127
Matlab的结果(特征向量矩阵):
-0.3428 0.0711 -0.8827 0.1184 0.2876 0.0390
-0.2536 0.9141 0.2000 0.2338 -0.0201 0.0718
-0.4039 0.1126 0.0451 -0.9061 0.0064 -0.0327
-0.4467 -0.2340 0.4053 0.2019 0.7115 -0.1855
-0.4728 -0.2633 0.1200 0.1544 -0.2970 0.7620
-0.4817 -0.1506 -0.0086 0.2137 -0.5678 -0.6141
第一主成分和第三主成分的特征向量的正负号正好是相反的。从结果直观分析,sas、spss的结果应该更好,即,第一主成分的特征向量理论上应该是正的。
为什么有如此差异?有什么方法可以解决?
谢谢!
主成分分析(PCA),用Matlab和SAS、SPSS结果不一样,后二者一样。但三者...
主成份分析本质上是一种降维技术,要将多个变量通过旋转在少数维度(最好是2个)上表示出来,并据此分类。但是旋转的方法不同,投射出来的结果也是不一样的,因此你会看到特征向量数值绝对值相同,但符号相反。就好比一种旋转方法将点投影到了X轴之上,而另一种方法恰好投影到了X轴之下。在使用时你只要...
matlab pca与princomp结果为什么不同
MATLAB直接用样本实现主成分分析用有多种方式,但是mathwork公司推荐(1)式,因为princomp在使用时调用的是pca,两者的计算结果一样,而且pca多一项explain,更强大。[coeff,score,latent,tsquared,explained]= pca(X) (1)[COEFF,SCORE,latent,tsquare] = princomp(X) (2)解释:X: 就是原...
数模系列(2):主成分分析(PCA)
今天,我们将深入探讨主成分分析(PCA),一种在统计学、数据科学和机器学习领域广泛应用的重要技术。PCA是一种数据降维方法,它帮助我们以更简洁的形式表示数据,同时保留关键信息。PCA的直观作用是将原始数据集中多个变量综合成较少的几个新变量,这些新变量彼此间互不相关。这不仅简化了数据,还帮助我们...
主成分分析(PCA)及其MATLAB的实现方法
主成分分析(PCA)是一种数据处理技术,旨在从高维数据中提取最重要的信息,简化数据表示并进行可视化。其核心目标是通过线性变换,将原始数据映射到一个新的坐标系,减少维度同时保持大部分信息。以体测成绩为例,PCA可以帮助我们从多指标中找出关键维度。首先,通过中心化处理,消除数据集的均值,然后使用...
主成分分析-PCA
PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与...
Stata:特征值、特征向量与主成分分析-pca
特征值和特征向量在数学中扮演着关键角色,它们在经济学、统计学、物理和化学等多个领域有着广泛应用。本文将深入探讨这两个概念,并重点介绍它们在主成分分析(PCA)中的应用。为了帮助读者更好地理解,我们先从一个实际案例入手。特征值和特征向量是线性代数中的核心概念,它们在解决各种数学问题时发挥着...
SPSS | 主成分分析(PCA)
主成分分析(PCA)是一种用于降维的多元统计方法,它在减少数据维度的同时,尽量保留原始数据中尽可能多的信息。主成分分析的核心是将多个指标转化为几个综合指标,这些综合指标即为主成分,每个主成分都是原始变量的线性组合,且各主成分之间互不相关。在进行主成分分析时,需要遵循以下基本步骤:首先,将...
主成分分析(PCA)
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。 PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。 如图。我们希...
spss主成分分析(Principal Component Analysis,PCA)及结果解读
联系:两者都是降维工具,新变量代表原始变量大部分信息且独立,适用于后续分析。区别:(1)主成分分析基于方差最大化,不强调实际意义。(2)因子分析注重解释实际结构。SPSS中,主成分分析混于因子分析中。以数据文件为例,进行标准化与主成分分析。1. 数据标准化 加载数据文件,选择相关变量进行描述统计,...
主成分分析(PCA)
主成分分析(PCA)是一种广泛应用于降维的数据预处理方法,通过找出数据中最重要的特征来简化高维数据,提高处理效率,同时便于理解和分析。以下是PCA的一些关键概念和特点:PCA是一种基于数据方差和协方差的降维技术,其核心思想是通过变换找出新的正交坐标轴,其中前k个轴包含了大部分数据的方差,而后续轴...