作者gsuper (Logit(odds))
看板Statistics
标题[问题] 一个概念性的 feature design 问题
时间Thu Feb 6 12:36:18 2014
假设拥有两个很基本的向量
lm(Y~X)
Y 与 X 都是 numeric variable , 这样可以跑回归或相关
但 numeric variable 可以降维 , 变成 multinomial 或 binomail
比方说温度变项 , 可以变为 高/中/低温组 , 也可以变成 热/冷组
这样可以变成 contingency table
也可以变成 logistic regression (二元或多元)
也可以变成 one-way ANOVA
----------------------------------------------
总觉得不知如何是好 , 因为总有办法可以找出 significant difference
是否降维就是损失?
numeric 的 comparison 一定比 降维後的 categorocal data 容易显着
所以能做 numeric comparison 就不必降维再做?
诚心请教
--
我用名为真心的卡牌说服你
这是我最後一张牌
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.32.215.136
※ 编辑: gsuper 来自: 114.32.215.136 (02/06 12:37)
1F:推 singlovesong:那个应该不叫做降维 叫离散化 看你在意的是什麽 02/06 14:33
2F:→ singlovesong:如果只在意高低 就高低 在意numerical value就不用 02/06 14:33
我是在 code systematical analysis flow
想说一次写完 , 永久使用
但每种都写又觉得怪怪的
※ 编辑: gsuper 来自: 114.32.215.136 (02/06 14:41)