作者KatherineM (忆 本象)
看板CSSE
标题[问题] 请问SVM的问题
时间Thu Jan 31 11:27:56 2013
大家好,我有一个关於 SVM 的小问题想请教。
就是 SVM 中 feature 的值能不能混用 binary,例如: <0,1>来表示有出现跟没出现
跟连续值,例如: <0.7, 0.9> 这种经过权重後的数值。
因为我是做 text mining,我想要同时有 binary 跟 权重的特徵,
但不晓得这样混用会不会有影响,或是有要考量的地方,请大大们指教。
p.s. 因为我第一次找到这个版,若是有其他更适合讨论 Machine Learning 相关的
地方,烦请告诉我,谢谢!!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.36.65.1
1F:推 bob123:fuzzy SVM ? 02/01 04:39
2F:→ KatherineM:所以代表SVM原本是不建议这样设定特徵值罗? ~"~ 02/01 10:33
3F:推 cansas:我研所作文件自动分类 有使用Weighting的效果会比Binary的 02/04 19:47
4F:→ cansas:表示方式好得多 就是会分的比较准 如果你要混用 我觉得可以 02/04 19:48
5F:→ cansas:试试啦 不会怎样 效果不一定 有时候也要看那个Feature是否 02/04 19:49
6F:→ cansas:本身有监别力 02/04 19:50
7F:推 h3615840:刚好我目前也在做类似的研究!目前感觉起来还是feature 02/15 19:05
8F:→ h3615840:的监别度影响比较大,目前我也有用到混用的部分, 02/15 19:06
9F:→ h3615840:在可以拆成多个binary的情况下,使用binary的效果感觉上 02/15 19:07
10F:→ h3615840:比起用单一个实数表示稍微好些,不知道是不是因为采用 02/15 19:08
11F:→ h3615840:更多维度做判断有利提升准确性的关系 02/15 19:09