作者iambakr (123)
看板R_Language
标题[问题] 特徵选取问题
时间Tue Jul 1 00:21:32 2025
经验谘询(我想用R作特徵选取,请问大家的经验)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
我打算使用 TF-IDF 作文字探勘,碰到以下几个问题:
Q1:我打算用 mutual information 与 mRMR作特徵选取
我应该先做 TF-IDF 然後再做特徵选取?
还是反过来?
Q2: 承上,我将降维後的词汇作机器学习分类 (ex: svm, rf, etc)
我需要将这些文字特徵以及其他数值型特徵作标准化吗?
如下面 code 最後一行
以及倒数第二行有注解的 step_nzv() 这个实务上也是需要的吗?
rec <- recipe(Label ~ ., data = train_data) |>
step_zv(all_predictors()) |>
#step_nzv(all_predictors()) |>
step_normalize(all_numeric_predictors())
谢谢各位
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.37.214.84 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1751300494.A.77C.html