作者passionare (怪怪ㄟ兽)
看板Statistics
标题[问题] 如何利用PCA简化变数?
时间Wed Jan 15 18:11:05 2014
如果是跟统计软体有关请重发文章
如果跟论文有关也烦请您重发文章
文章类别是为了帮助大家搜寻资料与解答,造成不便之处请见谅
不知道可不可以利用PCA来简化变数
目前有27个变数想要简化成13个
以下是算出来的结果
Importance of components:
PC1 PC2 PC3 PC4 PC5
Standard deviation 3.4619 2.0655 1.63058 1.45106 1.27229
Proportion of Variance 0.4439 0.1580 0.09847 0.07798 0.05995
Cumulative Proportion 0.4439 0.6019 0.70035 0.77833 0.83829
PC1 PC2 PC3
最大降雨 0.79392472 -0.123015555 -0.427866275
最小降雨 0.19038766 0.559686529 -0.009064013
平均降雨 0.54870486 -0.040940061 -0.700741734
温度差 -0.56213423 -0.214135710 -0.146952105
海拔 0.85265935 -0.282907331 0.028590115
最高温度 -0.96124684 0.001849815 -0.126504736
最低温度 -0.91456587 0.136359681 -0.074723367
年均温 -0.97570411 0.052911701 -0.101209547
直射光空域 0.79829525 -0.127279311 -0.056290773
海拔变异程度 0.23582338 0.644816235 -0.357059921
森林总面积 0.41793700 0.196845490 0.274742727
森林指标 0.61593800 0.074006252 -0.309788570
human.surface.area -0.37101172 -0.643226134 -0.438070149
human.area -0.36996055 -0.645855818 -0.437811309
植生指数mean 0.56371360 -0.067288469 0.045291044
植生指数STD 0.37524184 0.775436122 -0.167066916
道路密度 -0.07993246 -0.512624387 -0.207902802
坡度平均值 0.13046480 0.722181051 -0.277555250
南向 0.17766275 -0.554853053 -0.270605434
夏季温度 -0.96934463 0.013199399 -0.111225503
秋季温度 -0.97059660 0.021085091 -0.098342924
冬季温度 -0.92356768 0.133752520 -0.085059938
春季温度 -0.97753325 0.072584802 -0.096554524
夏季降雨 -0.11087280 0.028102474 -0.856365631
秋季降雨 0.05637413 0.791319387 -0.475813055
冬季降雨 0.88145245 -0.229793703 0.001917229
春季降雨 0.86236316 -0.283196968 -0.151131476
例如PC1轴里最高温度.最低温度.年均温.夏季温度.秋季温度.冬季温度.春季温度都为很
大的负值,那我可以只留一个变因其他删除吗?
就只留春季温度...
这样是对的方法吗?
还是有别的方法可以去简化我的变数
谢谢大家><
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.25.131
1F:→ hugh23715:请考虑的PC1、PC2、PC3代表什麽指标 01/15 19:21
2F:→ hugh23715:这些变因正负值通常可以推测出PC1指标的意义 01/15 19:26
3F:→ passionare:那像是PC1指标为温度,那我可以只留一个温度的意思吗? 01/15 20:27
4F:→ passionare:PC2比较像是植被方面,PC3为降雨 01/15 20:29
5F:→ hugh23715:PC1 PC2 PC3 PC4 PC5已经27变因是转换过後的5个指标 01/15 20:49
6F:→ hugh23715:你选出来PC1-PC5已经是27个变因降到5个指标 01/15 20:51
7F:推 hugh23715:PC1的这些变因组合到底能看出什麽,或许需要参考文献 01/15 20:55
8F:→ passionare:所以如果我挑到PC5,这样就利用这五个指标去做CCA?? 01/15 21:47
9F:→ passionare:谢谢你 01/15 21:49
10F:→ passionare:那我可以在PC1中挑一个数值对大得(绝对值)当做PC1的一 01/15 21:54
11F:→ passionare:个指标吗? 01/15 21:54
12F:→ hugh23715:PCA应该没有这种选法,你有参考文献佐证吗? 01/15 22:03
13F:→ hugh23715:CCA是你的专业领域,指标也只是从你的PC1-PC5来推测 01/15 22:06
14F:→ hugh23715:也有可能根本没有这个指标 01/15 22:06
15F:→ hugh23715:或者是根本没有意义 01/15 22:07
16F:→ hugh23715:指标的合理解释要从你专业领域来探讨 01/15 22:07
17F:→ passionare:了解!! 谢谢你 01/15 23:52
18F:→ andrew43:拿pca的结果去做cca怪怪的... cca已经有降维的功能了. 01/16 08:28
19F:→ passionare:但是我的样区只有14个,所以环境变因最多只能放13个... 01/16 10:54
20F:→ passionare:那我该如何去删减我的环境变因...谢谢你 01/16 10:55
21F:→ andrew43:你说的环境变因是constraing mat 还是conditioning mat? 01/16 14:25
22F:→ andrew43:前者没有限制变项数量但後者有. 01/16 14:28
23F:→ darkwiny:变数的选取可能还是要从专业去看,PCA主要是了解变数间关 01/16 18:23
24F:→ darkwiny:系,且PCA是线性的模式,你可以先用DCA去看前三轴的轴长 01/16 18:24
25F:→ darkwiny:如果低於4那用线性模式(PCA,RDA),大於则用高斯模型(CA,) 01/16 18:25
26F:→ darkwiny:DCA,CCA)会比较妥切 01/16 18:26