作者eri820503 (snoopyahoo)
看板R_Language
标题[问题] 如何等比例切割资料?
时间Sun Jun 12 22:01:04 2016
[问题类型]:
程式谘询
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
该如何等比例切割资料?
假设目前资料目前有5个变数,样本数为1000个
每个变数内的资料都想切成5等份,每份为200个
目前用cut函数切出来的只是等距,但每段内的样本数不为200个
目前想到的做法为,先将资料做排序,看每100笔资料的interval在哪边
再透过cut去做切割,但样本数大的时候这个做法似乎不有效
不知道有没有人知道其他做法?
[程式范例]:
将资料第i个变数切成5等份(等距但不等比例):
cut(data[,i],breaks=5, order_result=T,include.lowest=T)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.172.117.22
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1465740068.A.467.html
1F:→ celestialgod: cut(or findInterval) + quantile 06/12 22:20
2F:→ eri820503: ok我试试看,谢谢 06/13 09:01