作者cog5566 (刃之56)
看板R_Language
标题Re: [问题] 不会传递 expression 到sub-function
时间Mon Jun 3 03:00:15 2013
刚刚又试了另一种写法也成功了
######################################################################
library('doBy')
sdSubsetFun = function(group, dVar, data) {
subf = substitute( (dVar > (mean(dVar) - 1*sd(dVar))) &
(dVar < (mean(dVar) + 1*sd(dVar))))
do.call('subsetBy', list(group, subf, data))
}
# Create Data
x = rep(c('a','b','c'), 50)
y = 1:150
tData = data.frame(aa = x, bb = y)
subData = sdSubsetFun(~aa, bb, tData)
######################################################################
虽然结果一样,但是这应该跟我上一篇的 variable mapping 有所不同。
上一篇是直接把所有变数的 expression 都 map 到里面的subsetBy
但是这一篇只有 dVar 会是 map 到外面的 expression
group 和 data 就没有被 map 成外面的 ~aa 和 tData
连我自己都觉得讲的好绕口...
※ 引述《cog5566 (刃之56)》之铭言:
: 感谢版主的回应。
: 我也是在看 github
: 在经过 4个小时看完这篇内容之後,
: https://github.com/hadley/devtools/wiki/Computing-on-the-language
: 我终於成功弄(凑)出来了。好感动
: ######################################################################
: library('doBy')
: sdSubsetFun = function(group, dVar, data) {
: dataOut = substitute(
: subsetBy(group,
: (dVar > (mean(dVar) - 1*sd(dVar))) &
: (dVar < (mean(dVar) + 1*sd(dVar))),
: data = data)
: )
: eval(dataOut)
: }
: # Create Data
: x = rep(c('a','b','c'), 50)
: y = 1:150
: tData = data.frame(aa = x, bb = y)
: subData = sdSubsetFun(~aa, bb, tData)
: ######################################################################
: 重点是要用 substitute 包住全部的 code
: 而 substitute 很奥妙,它会替换里面的 variable name 去对应
: 可能的值,然後输出 language object
: 有趣的是如果吧 substitute() 改成 quote()
: 就不会替换成值。我也是现在才终於知道这两个关键性的差别。
: ※ 引述《Wush978 (拒看低质媒体)》之铭言:
: : 以下是我最初推文时测的code
: : ```r
: : library('doBy')
: : sdSubsetFun = function(group, dVar, data) {
: : sdVar = substitute(dVar)
: : # 2SD threshold
: : subsetThreshold <- substitute( (sdVar > (mean(sdVar) - 2*sd(sdVar))) &
: : (sdVar < (mean(sdVar) + 2*sd(sdVar))) )
: : data$temp <- eval(subsetThreshold)
: : dataOut = subsetBy(group,
: : subset = temp,
: : data = data)
: : }
: : # Create Data
: : aa = rep(c('a','b','c'), 50)
: : bb = 1:150
: : tData = data.frame(aa,bb)
: : subData = sdSubsetFun(~aa, bb, tData)
: : ```
: : 不过应该和Chris7462的修改类似。
: 是类似,但还是不一样。Chris7462 一直试图在 function 外弄出多余的变数,
: 来让他的程式假性的没有出错。
: 在後来的回文我改了一个地方让变数不会造成混肴
: x = rep(c('a','b','c'), 50)
: y = 1:150
: tData = data.frame(aa = x, bb=y)
: subData = sdSubsetFun(~aa, bb, tData)
: 版主的程式会 work 是因为它在这一行
: data$temp <- eval(subsetThreshold)
: eval 会去 evaluate bb这个变数。
: 但是其实 fuction 内没有 bb 这个变数的,所以 R 会去外面抓 bb
: (这点我也是很不习惯这种 scoping 的方式)
: 刚好外面有 bb 所以看起来没有出问题。
: 但是其实这个写法出来的答案会是错的,因为这时候 sd 是由 1:150来算的,
: 因为是抓 bb = 1:150
: 而不是依组别算的。
: 现在把function 外变数改成这样x,y的话,就会出错。因为fuction 外面其实没有 bb
: bb 是在 tData 里面的变数,如果没有 attach() 到 search path,
: 是根本抓不到的。
: ======================================================================
: 总结来说,就是有没有办法设计一个 function 他是可以照组别删去
: data frame 特定 variable 的 2sd 之外的资料呢?
: 我希望在我有一个 data frame tData 的情况下,
: sdSubsetFun 这个 function
: sdSubsetFun = function(group, dVar, data)
: 的 dVar 的引数输入的时候,我可以直接放 data frame 的 variable name
: 而不用利用 attach() 或是做出而外的变数来达成我的目标。
: 因为 subset, subsetBy 等等的也是这样就可以做到
: 一个解答就是以上的 code
: 我不知道有没有更好的解法,如果有也请多指教。
: 我觉得 R 在这一部份可能跟 fucntional programming 有关的实在很复杂。
: : ---
: : 关於物件的是属於symbol或character,也就是後来cog5566提到关於`rm`函数行为的问题,
: : 这也是我过去学R ,到目前觉得很不可思议和不方便的地方。
: : cog5566可以用以下的方式来探索函数的行为:
: : ```r
: : debug(rm)
: : x <- "y"
: : y <- 10
: : rm(x)
: : ```
: : 这之後会进入除错模式,你可以巨细靡遗的观察`rm`函数的行为。
: : 你会发现有种叫作"name"型态的物件。
: : 也可以去追相关函数的说明文件,也许你就可以搞清楚了。
: : ps. 我最近事情有点多,就没追下去搞懂他了。
: : 我也不太确定Hadley的R advanced里面有没有提到这件事情。
: : ps. 现在github好像挂了,晚点我再补连结。
: : 期待你搞清楚後也可以播空发篇文章教教我,先谢谢了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 139.184.222.89