作者FrederickLiu (Frederick)
看板Statistics
标题[讨论] PCA相关和协方差矩阵
时间Mon Mar 5 22:26:31 2018
PCA 用 correlation or covariance比较
基本上我有爬文,也知道他是如何运算的
可以知道当尺度相同的时候用covariance所丢失的讯息量会最少
我的尺度相同故我先用covariance 计算得到的结果可以发现的确3个轴加起来约90%
这时候发现这些资料依照’’地区’’来区分可以明显的分群
但如果依照种类却结果并不是很好
接着我也做了correlation 发现资料丢失量的确满多的 前三个加起来能解释约66%
也很神奇地发现 使用correlation的方式可以依照’’种类’’来区隔开
想问一下各位 这样可以两种资料都用来讨论吗??
因为covariance可以漂亮的分出’’地区’’无法分出’’种类’’
但是相反correlation可以漂亮的分出’’种类’’,却无法分出’’地区’’
https://i.imgur.com/r7H2zFX.jpg
左上-correlation-地区
右上-covariance-地区(good)
左下-correlation-种类(good)
右下-covariance-种类
还有如果两个都可以解释的话,会造成这麽刚好也是有可能的吗??
会造成这样的原因是因为??
有点想不透 要怎麽跟人解释资料量变少反而有一个可以变很漂亮…
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.137.1.213
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1520259993.A.E85.html
1F:→ andrew43: 图的角度都不一样,也看不出实际投影在三轴上的位置。 03/06 01:44
2F:→ andrew43: 我会先猜测所谓漂亮也只是你看起来觉得漂亮。 03/06 01:45
3F:→ andrew43: 也可以关心二者主要差别在哪些变数的loading 03/06 01:57
4F:→ FrederickLiu: Andrew大大您说的没错,是看起来漂亮,至於角度我 03/06 10:56
5F:→ FrederickLiu: 把他转到我觉得看起来比较漂亮的哈哈 03/06 10:56
6F:→ FrederickLiu: 关心两者变数的loading我会去看的,感谢! 03/06 10:57
7F:→ andrew43: 把三维图转转多看几眼,或是直接拿PCA分数做clustering 03/06 11:27
8F:→ andrew43: 应该就可以辨别是不是真的按某个类别分开 03/06 11:28
9F:→ LiamIssac: 分群有很多方法 SVM也是可以 而且更清楚 03/06 13:22