作者cog5566 (刃之56)
看板R_Language
标题Re: [问题] 不会传递 expression 到sub-function
时间Sun Jun 2 16:39:24 2013
※ 引述《Chris7462 (~烤焦面包~)》之铭言:
: ※ 引述《cog5566 (刃之56)》之铭言:
: : 我想不是 logical 是 logical expression
: : 你看例子的第二个参数是 Weight < mean(Weight)
: : 并不是 dietox$Weight < mean(dietox$Weight)
: 你只看到了第二个参数,没看到後面的 data=dietox
: subsetBy 括号里面整个的意思是用 dietox 这组资料的 Weight 也就是 dietox$Weight
: 可以把资料 attach 上去就知道了。
...嗯...
你觉得... subsetBy 的范例有用 attach() 吗?
就是因为他没有用,所以才酷的...
: > data(dietox)
: > attach(dietox)
: > typeof(Weight < mean(Weight))
: [1] "logical"
: > typeof(dietox$Weight < mean(dietox$Weight))
: [1] "logical"
: > Weight == dietox$Weight
: 两个是一样的
当然啊...因为你加了 attach() ...
你把 dietox 拿到 search path 当然这个时候 Weight < mean(Weight)
就可以被 evaluate。
这不是等於说,你问我有没有看到一只猫,我说没有。
然後你放了一只猫在我前面,再问一次有没有看到一只猫...
然後说我之前错了,这里其实是有一只猫的...
: : 如果你用
: : typeof(Weight < mean(Weight))
: : 和
: : typeof(dietox$Weight < mean(dietox$Weight))
: : 会得到完全不一样的结果
: 因为你开 R 的时候有读到旧的资料或是 R 的暂存档,没有 attach dietox 这个 data
: 的话应该不会 Weight 这个 variable
: 请先把旧的暂存档或旧资料清掉,不然这样讨论下去你只会一直得到很奇怪的结果
这很有趣...
不过讲正经的,这真的不是 attach() 的问题。
从头到尾都没有必要 attach dietox 到 Search Path
我很怀疑你自己有没有真的执行过没有 attach() 的范例
是真的可以执行的。跟 attach() 没有关系。
: : Weight < mean(Weight) 会变成 logical class 会是在 subsetBy 自己的 scope 之内
: : 的事,但是在 subsetBy 之外的时候状况很奇怪。
: : 这也是一个我很不习惯 R 的地方之一。有一些 function 会展现出奇怪的特性,
: : 就是你不知道到底 function 是抓引数的 value 还是 name or expression
: : 譬如说好了
: : x <- 10
: : rm('x') 和 rm(x)
: : 有同样的效果
: 请看 ?rm
: rm (..., list = character(), pos = -1,
: envir = as.environment(pos), inherits = FALSE)
: ...
: the objects to be removed, as names (unquoted) or character strings (quoted).
: 里面放的可以是变数名称或是字串,所以 rm('x') 跟 rm(x) 一样
: : 看起来好像没有很奇怪,但是爲什麽 rm(x) 不会变成 rm(10)呢?
: 看不懂。
那
x <- 10
请问 sum(x,x) 跟 sum(10,10) 会不会一样呢?
: : 下面这个例子就会更奇怪
: : x <- 10
: : y <- 'x'
: : rm(y)
: : 那到底这个时候是什麽情况,到底这时候会抓 rm 的参数 name y 还是 value 'x'?
: 请把值呼叫出来
: > x # x 是变数,数值为 10
: [1] 10
: > y # y 是变数,数值是字元 "x"
: [1] "x"
所以你有试过 rm(y) 吗?
你觉得答案是?
答案是 y 会被删掉而不是 x
但是爲什麽这个时候 y 不会被替换成 'x'变成 rm('x') 而删掉 x?
答案是这个完全决定於 rm 的内部写法。也就是说使用者没办法在外部决定输入值是
variable name 或是 value。
我不知道这有没有吓到你啦,但是我第一次看到这个是有被吓到啦。
可能我还太嫩了。
: : 回到我的问题的例子
: : subsetBy(~Evit, Weight < mean(Weight), data=dietox)
: : 如果在一般的 function下,而且 Weight 有给予值时,
: : Weight < mean(Weight) 应该会去抓 Weight 的值来得出 logical class
: : 但是这边等神奇之处就是,Weight 是 dietox 的一个 column,
: : 或是复杂一点的说,是 dietox 这个 data frame 的 environment 里面的变数
: : 他们是在 subsetBy 之内才被组合的。
: 看不懂。
这边我想我们各有一半的责任。
我的责任是说错了一点 data frame 应该没有包含一个 environment,就只是变数
和值的对应关系。
你的责任是你小小作弊式的用了 attach() 然後再做
typeof(Weight < mean(Weight))
不然实际情况这个应该会出错,然後会很惊讶的觉得爲什麽
subsetBy(~Evit, Weight < mean(Weight), data=dietox) 却不会有问题
: : 这样一来,subsetBy 必定会知道 subsetBy 外面被 call 时引数的 expression
: : 而不是值。现在知道这可以用 substitute 来实现,但是我的问题是如果有下一层,
: : 如何将这个 expression 带到下一层?
: 一样看不懂。
但是这是我的最终问题呀。可能是我表达不好,不过你看不懂是如何回答的?
: : 我还是会不行用耶,贴上我的 code
: : ######################################################################
: : library('doBy')
: : sdSubsetFun = function(group, dVar, data) {
: : # 2SD threshold
: : subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
: : (dVar < (mean(dVar) + 2*sd(dVar)))
: : dataOut = subsetBy(group,
: : subset = subsetThreshold,
: : data = data)
: 问题是出在这边,因为 data = data 用的是 data 这个资料的 data$subsetThreshold
: 但是 data 下并没有 data$subsetThreshold 这个变数,所以就有 error
没错这是个问题,而且是大问题。但是你有看到我贴的 error message 吗
在这个问题发生之前上面就出问题了。
: : }
: : x = rep(c('a','b','c'), 50)
: : y = 1:150
: : tData = data.frame(aa = x, bb = y)
: 另外这边也错,两个改法。一个是
: > tData = data.frame(aa <- x, bb <- y)
: 或是
: > tData = data.frame(aa = x, bb = y)
: > aa <- x
: > bb <- y
: : subData = sdSubsetFun(~aa, bb, tData)
: : ######################################################################
: : Error in sdSubsetFun(~aa, bb, tData) : object 'bb' not found
: : ######################################################################
: : 其实很显而易见,在 evaluate dVar 的时候会在 local environment 找不到值,
: : 因为 dynamic scope 的关系,它会去 global environment 找,但也会找不到。
: : 所以他会再找 bb 的value,但是根本就没有 bb 这个变数,bb是tData的 column name
: : 所以最後他会说 bb 找不到。
: : 还是说我什麽地方弄错了?可能有小细节没有注意到。
: 看不懂上面的几个错误跟 dynamic scope 有什麽关系?
: 整的问题只是呼叫 function 的时候没有把该放的参数放对而已。
这真的不是这个问题
: 我把整个改过的程式贴上来如下,如果再不行我也不知道怎麽帮你了....
这个有趣...
: library('doBy')
: sdSubsetFun = function(group, dVar, data) {
: # 2SD threshold
: data$subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) &
: (dVar < (mean(dVar) + 2*sd(dVar)))
: dataOut = subsetBy(group,
: subset = subsetThreshold,
: data = data)
: }
: x = rep(c('a','b','c'), 50)
: y = 1:150
: tData = data.frame(aa = x, bb = y)
: aa <- x
: bb <- y
: subData = sdSubsetFun(~aa, bb, tData)
你这样可以跑是因为你用了跟刚刚加了 attach() 的作弊方式
aa <- x
bb <- y
这跟 attach(tData) 是类似的意思
但是这跟原本的 subsetBy那种写法意思就差多了。
我要的是 bb 不是单纯的 value 代进去sdSubsetFun
而是 bb 本身的 name 会被 sdSubsetFun 在里面识别出来,进而组成一个新的
expression 当做 subsetBy 的引数。
不过如果你看不懂
x <- 10
rm(x) 跟 rm(10) 的这个基本又神秘的地方,那我也不知道该怎麽跟你说明了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 139.184.222.89