找回密码
 注册
查看: 7067|回复: 2

R语言进行主成分分析scores代表的是新指标的值吗?

[复制链接]
发表于 2010-5-29 23:06:14 | 显示全部楼层 |阅读模式

问题描述:
我用R的princomp函数对R内含的USArrests数据进行主成分分析:
原始数据
> USArrests
               Murder Assault UrbanPop Rape
Alabama          13.2     236       58 21.2
Alaska           10.0     263       48 44.5
Arizona           8.1     294       80 31.0
Arkansas          8.8     190       50 19.5
California        9.0     276       91 40.6
Colorado          7.9     204       78 38.7
Connecticut       3.3     110       77 11.1
Delaware          5.9     238       72 15.8
Florida          15.4     335       80 31.9
Georgia          17.4     211       60 25.8
Hawaii            5.3      46       83 20.2
Idaho             2.6     120       54 14.2
Illinois         10.4     249       83 24.0
Indiana           7.2     113       65 21.0
Iowa              2.2      56       57 11.3
Kansas            6.0     115       66 18.0
Kentucky          9.7     109       52 16.3
Louisiana        15.4     249       66 22.2
Maine             2.1      83       51  7.8
Maryland         11.3     300       67 27.8
Massachusetts     4.4     149       85 16.3
Michigan         12.1     255       74 35.1
Minnesota         2.7      72       66 14.9
Mississippi      16.1     259       44 17.1
Missouri          9.0     178       70 28.2
Montana           6.0     109       53 16.4
Nebraska          4.3     102       62 16.5
Nevada           12.2     252       81 46.0
New Hampshire     2.1      57       56  9.5
New Jersey        7.4     159       89 18.8
New Mexico       11.4     285       70 32.1
New York         11.1     254       86 26.1
North Carolina   13.0     337       45 16.1
North Dakota      0.8      45       44  7.3
Ohio              7.3     120       75 21.4
Oklahoma          6.6     151       68 20.0
Oregon            4.9     159       67 29.3
Pennsylvania      6.3     106       72 14.9
Rhode Island      3.4     174       87  8.3
South Carolina   14.4     279       48 22.5
South Dakota      3.8      86       45 12.8
Tennessee        13.2     188       59 26.9
Texas            12.7     201       80 25.5
Utah              3.2     120       80 22.9
Vermont           2.2      48       32 11.2
Virginia          8.5     156       63 20.7
Washington        4.0     145       73 26.2
West Virginia     5.7      81       39  9.3
Wisconsin         2.6      53       66 10.8
Wyoming           6.8     161       60 15.6
获得载荷矩阵
>  princomp(USArrests)$loadings[,]
              Comp.1      Comp.2      Comp.3      Comp.4
Murder   -0.04170432  0.04482166  0.07989066  0.99492173
Assault  -0.99522128  0.05876003 -0.06756974 -0.03893830
UrbanPop -0.04633575 -0.97685748 -0.20054629  0.05816914
Rape     -0.07515550 -0.20071807  0.97408059 -0.07232502
获得scores
> princomp(USArrests)$scores
                    Comp.1      Comp.2       Comp.3     Comp.4
Alabama         -64.802164  11.4480074  -2.49493284  2.4079009
Alaska          -92.827450  17.9829427  20.12657487 -4.0940470
Arizona        -124.068216  -8.8304030  -1.68744836 -4.3536852
Arkansas        -18.340035  16.7039114   0.21018936 -0.5209936
California     -107.422953 -22.5200698   6.74587299 -2.8118259
Colorado        -34.975986 -13.7195840  12.27936280 -1.7214637
Connecticut      60.887282 -12.9325302  -8.42065719 -0.6999023
Delaware        -66.731025  -1.3537978 -11.28095735 -3.7279812
Florida        -165.244370  -6.2746901  -2.99793315  1.2476807
Georgia         -40.535177   7.2902396   3.60952946  7.3436728
Hawaii          123.536106 -24.2912079   3.72444284  3.4728494
Idaho            51.797002   9.4691910  -1.52006356 -3.3478283
Illinois        -78.992097 -12.8970605  -5.88326477  0.3676407
Indiana          57.550961  -2.8462647   3.73816049  1.6494302
Iowa            115.586790   3.3421305  -0.65402935 -0.8694960
Kansas           55.789694  -3.1572339   0.38436416  0.6527917
Kentucky         62.383181  10.6732715   2.23708903  3.8762164
Louisiana       -78.277631   4.2949175  -3.82786965  4.4835590
Maine            89.261044  11.4878272  -4.69240562 -2.1161995
Maryland       -129.330136   5.0070315  -2.34717282 -1.9283242
Massachusetts    21.266283 -19.4501790  -7.50714835 -1.0348189
Michigan        -85.451527  -5.9045567   6.46434210  0.4990479
Minnesota        98.954816  -5.2096006   0.00657376 -0.7318957
Mississippi     -86.856358  27.4284196  -5.00343624  3.8797577
Missouri         -7.986289  -5.2756414   5.50057972  0.6794055
Montana          62.483635   9.5105021   1.83835536  0.2459426
Nebraska         69.096544   0.2111959   0.46802086 -0.6565664
Nevada          -83.613578 -15.1021839  15.88869482  0.3341962
New Hampshire   114.777355   4.7345584  -2.28238693 -0.9359106
New Jersey       10.815725 -23.1373389  -6.31015739  1.6124273
New Mexico     -114.868163   0.3364531   2.26126996 -1.3812478
New York        -84.294231 -15.9239655  -4.72125960  0.8920194
North Carolina -164.325514  31.0966153 -11.69616350 -2.1111927
North Dakota    127.495597  16.1350394  -1.31182982 -2.3009639
Ohio             50.086822 -12.2793244   1.65733077  2.0291157
Oklahoma         19.693723  -3.3701310  -0.45314329 -0.1803457
Oregon           11.150240  -3.8660682   8.12998050 -2.9140109
Pennsylvania     64.689142  -8.9115466  -3.20646858  1.8749353
Rhode Island     -3.063973 -18.3739704 -17.47001970 -2.3082597
South Carolina -107.281069  23.5361159  -2.03279501  1.2517463
South Dakota     86.106720  16.5978586   1.31437998 -1.2522874
Tennessee       -17.506264   6.5065756   6.10012753  3.9228558
Texas           -31.291122 -12.9849566  -0.39340922  4.2420040
Utah             49.913397 -17.6484577   1.78816852 -1.8677052
Vermont         124.714469  27.3135591   4.80277765 -2.0049857
Virginia         14.817448   1.7526150   1.04538813  1.1738408
Washington       25.075839  -9.9679669   4.78112764 -2.6910819
West Virginia    91.544647  22.9528778  -0.40198344  0.7368781
Wisconsin       118.176328  -5.5075792  -2.71132077  0.2049724
Wyoming          10.434539   5.9244529  -3.79444682 -0.5178674

我的问题是:
理论上来说载荷矩阵的值的大小代表原指标和新指标的相关性,并且载荷矩阵于新指标阵的乘积应该等于原矩阵,但是我算了一下差别很大。
哪位能帮忙给个指点,这是什么原因呢,或者我对scores的理解有问题


回复

使用道具 举报

 楼主| 发表于 2010-5-31 21:06:31 | 显示全部楼层
找到解决办法了,呵呵,我问题描述也有点问题。
scores是新的主成分值

三个值的关系是这样的:
USArrests的每个数减去对应列的均值,然后乘以loading矩阵,等于scores矩阵
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-5-31 21:07:12 | 显示全部楼层
需要调整一下每一列数的中心
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-23 17:41 , Processed in 0.027521 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表