R_Language 板


LINE

※ 引述《Chris7462 (~烤焦面包~)》之铭言: : ※ 引述《cog5566 (刃之56)》之铭言: : : [问题类型]: : : 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来) : : [软体熟悉度]: : : 入门(写过其他程式,只是对语法不熟悉) : : [问题叙述]: : : 以 subsetBy 为例好了 (这是doBy package 的一个function) : : 这个 function 可以依照组别来筛选 data frame 的资料。 : : 假设我想要写一个 function 会用到 subsetBy : : 这个 function 的功能是依组别去除 2 倍 SD 之外的资料 : : 问题如下: : : subsetBy 的第二个参数是要输入一个 expression (应该是吧) : subsetBy(formula, subset, data = parent.frame(), select, drop=FALSE, : join=TRUE, ... ) : 第二个参数是 logical 不是 expression,可以看他的说明 : subset logical expression indicating elements or rows to keep: missing values : taken as false. : 用他的 example 看一下就知道了 : sbstBy> data(dietox) : sbstBy> subsetBy(~Evit, Weight < mean(Weight), data=dietox) : data(dietox) : dietox$Weight < mean(dietox$Weight) 我想不是 logical 是 logical expression 你看例子的第二个参数是 Weight < mean(Weight) 并不是 dietox$Weight < mean(dietox$Weight) 如果你用 typeof(Weight < mean(Weight)) 和 typeof(dietox$Weight < mean(dietox$Weight)) 会得到完全不一样的结果 Weight < mean(Weight) 会变成 logical class 会是在 subsetBy 自己的 scope 之内 的事,但是在 subsetBy 之外的时候状况很奇怪。 这也是一个我很不习惯 R 的地方之一。有一些 function 会展现出奇怪的特性, 就是你不知道到底 function 是抓引数的 value 还是 name or expression 譬如说好了 x <- 10 rm('x') 和 rm(x) 有同样的效果 看起来好像没有很奇怪,但是爲什麽 rm(x) 不会变成 rm(10)呢? 下面这个例子就会更奇怪 x <- 10 y <- 'x' rm(y) 那到底这个时候是什麽情况,到底这时候会抓 rm 的参数 name y 还是 value 'x'? 回到我的问题的例子 subsetBy(~Evit, Weight < mean(Weight), data=dietox) 如果在一般的 function下,而且 Weight 有给予值时, Weight < mean(Weight) 应该会去抓 Weight 的值来得出 logical class 但是这边等神奇之处就是,Weight 是 dietox 的一个 column, 或是复杂一点的说,是 dietox 这个 data frame 的 environment 里面的变数 他们是在 subsetBy 之内才被组合的。 这样一来,subsetBy 必定会知道 subsetBy 外面被 call 时引数的 expression 而不是值。现在知道这可以用 substitute 来实现,但是我的问题是如果有下一层, 如何将这个 expression 带到下一层? : : 如 : : subsetBy(~Evit, Weight < mean(Weight), data=dietox) : : 这个 expression 是筛选资料的算式,其中的变数会对应到 data frame : : 的 column name : : 而我想要写一个 function 是 : : sdSubsetFun = function(group, dVar, data) : : data 是我要操作的 data frame : : dVar 是要去掉的 2SD 的目标 column name : : group 是分组的依据 (class 是 formula) : : 但是我没办法将 dVar 传进去里面的 subsetBy 的第二个参数 : : 程式码如下 : : ###################################################################### : : library('doBy') : : sdSubsetFun = function(group, dVar, data) { : : - sdVar = substitute(dVar) : : # 2SD threshold : : - subsetThreshold = substitute( (sdVar > (mean(sdVar) - 2*sd(sdVar))) & : : - (sdVar < (mean(sdVar) + 2*sd(sdVar))) ) : + subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) & : + (dVar < (mean(dVar) + 2*sd(dVar))) : : dataOut = subsetBy(group, : : - subset = eval(subsetThreshold, group, parent.frame()), : + subset = subsetThreshold, : : data = data) : : } : - 是删除,+ 是新增。这样应该就可以用了 :p 我还是会不行用耶,贴上我的 code ###################################################################### library('doBy') sdSubsetFun = function(group, dVar, data) { # 2SD threshold subsetThreshold = (dVar > (mean(dVar) - 2*sd(dVar))) & (dVar < (mean(dVar) + 2*sd(dVar))) dataOut = subsetBy(group, subset = subsetThreshold, data = data) } x = rep(c('a','b','c'), 50) y = 1:150 tData = data.frame(aa = x, bb = y) subData = sdSubsetFun(~aa, bb, tData) ###################################################################### Error in sdSubsetFun(~aa, bb, tData) : object 'bb' not found ###################################################################### 其实很显而易见,在 evaluate dVar 的时候会在 local environment 找不到值, 因为 dynamic scope 的关系,它会去 global environment 找,但也会找不到。 所以他会再找 bb 的value,但是根本就没有 bb 这个变数,bb是tData的 column name 所以最後他会说 bb 找不到。 还是说我什麽地方弄错了?可能有小细节没有注意到。 : : # Create Data : : aa = rep(c('a','b','c'), 50) : : bb = 1:150 : : tData = data.frame(aa,bb) : : subData = sdSubsetFun(~aa, bb, tData) : : ###################################################################### : : 错误讯息为: : : Error in eval(subsetThreshold, group, parent.frame()) : : : object 'subsetThreshold' not found : : 也就是说,里面的 subsetBy 都不会抓我的 subsetThreshold 的值, : : 都还是会抓 subsetThreshold 自己本身的 expression。 : : 要怎麽做才会让他抓到 subsetThreshold 的值呢? --



※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 139.184.222.89







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP