作者a83912a (Richie)
看板R_Language
标题[问题] 等深分箱法
时间Sun Dec 3 12:15:49 2017
最近老师上课有提到分箱法
有等宽、等深分箱法
他是要取 CSV 档的栏位去算
等宽分箱法已经知道怎麽使用
就是先让数值排序 接着算出最大最小值
然後在分成要的等分 就可以用 cut 分群出来
但是等深却一直用不出来
等深是用资料的数量
但是用 cut , split 都没有办法
最後还是用回圈去写
但是感觉这就不是真正的方法
想请问有高手能教教刚入门的菜鸟吗
谢谢各位
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.9.230.21
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1512274551.A.EC9.html
1F:推 sw52099: 查查看 cross validation ,有看到类似的东西 12/03 13:09
2F:推 x88776544pc: 假设分 K 箱 12/03 22:28
3F:→ x88776544pc: breaks = unique(quartile(x,probs=seq(0,1,length=K 12/03 22:30
4F:→ x88776544pc: +1))) 12/03 22:30
5F:→ x88776544pc: new_x=cut(x,breaks,include.lowest=T,right=F) 12/03 22:31