作者cog5566 (刃之56)
看板R_Language
标题Re: [问题] 不会传递 expression 到sub-function
时间Mon Jun 3 00:02:34 2013
感谢版主的回应。
我也是在看 github
在经过 4个小时看完这篇内容之後,
https://github.com/hadley/devtools/wiki/Computing-on-the-language
我终於成功弄(凑)出来了。好感动
######################################################################
library('doBy')
sdSubsetFun = function(group, dVar, data) {
dataOut = substitute(
subsetBy(group,
(dVar > (mean(dVar) - 1*sd(dVar))) &
(dVar < (mean(dVar) + 1*sd(dVar))),
data = data)
)
eval(dataOut)
}
# Create Data
x = rep(c('a','b','c'), 50)
y = 1:150
tData = data.frame(aa = x, bb = y)
subData = sdSubsetFun(~aa, bb, tData)
######################################################################
重点是要用 substitute 包住全部的 code
而 substitute 很奥妙,它会替换里面的 variable name 去对应
可能的值,然後输出 language object
有趣的是如果吧 substitute() 改成 quote()
就不会替换成值。我也是现在才终於知道这两个关键性的差别。
※ 引述《Wush978 (拒看低质媒体)》之铭言:
: 以下是我最初推文时测的code
: ```r
: library('doBy')
: sdSubsetFun = function(group, dVar, data) {
: sdVar = substitute(dVar)
: # 2SD threshold
: subsetThreshold <- substitute( (sdVar > (mean(sdVar) - 2*sd(sdVar))) &
: (sdVar < (mean(sdVar) + 2*sd(sdVar))) )
: data$temp <- eval(subsetThreshold)
: dataOut = subsetBy(group,
: subset = temp,
: data = data)
: }
: # Create Data
: aa = rep(c('a','b','c'), 50)
: bb = 1:150
: tData = data.frame(aa,bb)
: subData = sdSubsetFun(~aa, bb, tData)
: ```
: 不过应该和Chris7462的修改类似。
是类似,但还是不一样。Chris7462 一直试图在 function 外弄出多余的变数,
来让他的程式假性的没有出错。
在後来的回文我改了一个地方让变数不会造成混肴
x = rep(c('a','b','c'), 50)
y = 1:150
tData = data.frame(aa = x, bb=y)
subData = sdSubsetFun(~aa, bb, tData)
版主的程式会 work 是因为它在这一行
data$temp <- eval(subsetThreshold)
eval 会去 evaluate bb这个变数。
但是其实 fuction 内没有 bb 这个变数的,所以 R 会去外面抓 bb
(这点我也是很不习惯这种 scoping 的方式)
刚好外面有 bb 所以看起来没有出问题。
但是其实这个写法出来的答案会是错的,因为这时候 sd 是由 1:150来算的,
因为是抓 bb = 1:150
而不是依组别算的。
现在把function 外变数改成这样x,y的话,就会出错。因为fuction 外面其实没有 bb
bb 是在 tData 里面的变数,如果没有 attach() 到 search path,
是根本抓不到的。
======================================================================
总结来说,就是有没有办法设计一个 function 他是可以照组别删去
data frame 特定 variable 的 2sd 之外的资料呢?
我希望在我有一个 data frame tData 的情况下,
sdSubsetFun 这个 function
sdSubsetFun = function(group, dVar, data)
的 dVar 的引数输入的时候,我可以直接放 data frame 的 variable name
而不用利用 attach() 或是做出而外的变数来达成我的目标。
因为 subset, subsetBy 等等的也是这样就可以做到
一个解答就是以上的 code
我不知道有没有更好的解法,如果有也请多指教。
我觉得 R 在这一部份可能跟 fucntional programming 有关的实在很复杂。
: ---
: 关於物件的是属於symbol或character,也就是後来cog5566提到关於`rm`函数行为的问题,
: 这也是我过去学R ,到目前觉得很不可思议和不方便的地方。
: cog5566可以用以下的方式来探索函数的行为:
: ```r
: debug(rm)
: x <- "y"
: y <- 10
: rm(x)
: ```
: 这之後会进入除错模式,你可以巨细靡遗的观察`rm`函数的行为。
: 你会发现有种叫作"name"型态的物件。
: 也可以去追相关函数的说明文件,也许你就可以搞清楚了。
: ps. 我最近事情有点多,就没追下去搞懂他了。
: 我也不太确定Hadley的R advanced里面有没有提到这件事情。
: ps. 现在github好像挂了,晚点我再补连结。
: 期待你搞清楚後也可以播空发篇文章教教我,先谢谢了。
: ※ 引述《cog5566 (刃之56)》之铭言:
: : ...嗯...
: : 你觉得... subsetBy 的范例有用 attach() 吗?
: : 就是因为他没有用,所以才酷的...
: : 当然啊...因为你加了 attach() ...
: : 你把 dietox 拿到 search path 当然这个时候 Weight < mean(Weight)
: : 就可以被 evaluate。
: : 这不是等於说,你问我有没有看到一只猫,我说没有。
: : 然後你放了一只猫在我前面,再问一次有没有看到一只猫...
: : 然後说我之前错了,这里其实是有一只猫的...
: : 这很有趣...
: : 不过讲正经的,这真的不是 attach() 的问题。
: : 从头到尾都没有必要 attach dietox 到 Search Path
: : 我很怀疑你自己有没有真的执行过没有 attach() 的范例
: : 是真的可以执行的。跟 attach() 没有关系。
: : 那
: : x <- 10
: : 请问 sum(x,x) 跟 sum(10,10) 会不会一样呢?
: : 所以你有试过 rm(y) 吗?
: : 你觉得答案是?
: : 答案是 y 会被删掉而不是 x
: : 但是爲什麽这个时候 y 不会被替换成 'x'变成 rm('x') 而删掉 x?
: : 答案是这个完全决定於 rm 的内部写法。也就是说使用者没办法在外部决定输入值是
: : variable name 或是 value。
: : 我不知道这有没有吓到你啦,但是我第一次看到这个是有被吓到啦。
: : 可能我还太嫩了。
: : 这边我想我们各有一半的责任。
: : 我的责任是说错了一点 data frame 应该没有包含一个 environment,就只是变数
: : 和值的对应关系。
: : 你的责任是你小小作弊式的用了 attach() 然後再做
: : typeof(Weight < mean(Weight))
: : 不然实际情况这个应该会出错,然後会很惊讶的觉得爲什麽
: : subsetBy(~Evit, Weight < mean(Weight), data=dietox) 却不会有问题
: : 但是这是我的最终问题呀。可能是我表达不好,不过你看不懂是如何回答的?
: : 没错这是个问题,而且是大问题。但是你有看到我贴的 error message 吗
: : 在这个问题发生之前上面就出问题了。
: : 这真的不是这个问题
: : 这个有趣...
: : 你这样可以跑是因为你用了跟刚刚加了 attach() 的作弊方式
: : aa <- x
: : bb <- y
: : 这跟 attach(tData) 是类似的意思
: : 但是这跟原本的 subsetBy那种写法意思就差多了。
: : 我要的是 bb 不是单纯的 value 代进去sdSubsetFun
: : 而是 bb 本身的 name 会被 sdSubsetFun 在里面识别出来,进而组成一个新的
: : expression 当做 subsetBy 的引数。
: : 不过如果你看不懂
: : x <- 10
: : rm(x) 跟 rm(10) 的这个基本又神秘的地方,那我也不知道该怎麽跟你说明了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 139.184.222.89
※ 编辑: cog5566 来自: 139.184.222.89 (06/03 00:07)
1F:推 Chris7462:我误会了你的意思,跟您道歉。 06/03 01:53