作者onionsteven (.__ . )
看板R_Language
标题[问题] 如何减少使用for
时间Mon Dec 2 12:03:06 2013
[问题类型]:
效能谘询(我想让R 跑更快)
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
正在做分析 想让执行速度加快
我的语法用了三层的for回圈 想请问能不能避开
资料存放在多个档案夹中 所以第一个回圈是改变资料读取路径跟档名
第二个回圈是模拟资料的10000笔 依序做计算
第三个回圈是针对每笔数据给予某定值做计算 约有2000组
apply或是sapply的执行速度比for快
但是使用它来计算某个函数时 我希望能指定不同的参数位置
[程式范例]:
例如:10000笔的模拟资料中 每一笔有三个
假定每笔资料为a1 a2 a3
data=matrix(rnorm(30000,0,1),10000,3)
apply(data,1,mean)可以计算a1 a2 a3的mean
但是我想做的是另外自己写的函数
可能是a1^a2/a3
这部分有哪个语法能够取代for回圈呢
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.76.107
1F:→ koai:如果只有一个变数的话,sapply是可以取代你的for的! 你可以试 12/02 13:20
2F:→ koai:下面这个例子 sapply(1:10,function(x){x^2}) 12/02 13:21
3F:→ onionsteven:恩 这里就是我求救的地方 我的变数有三个 XD 12/02 13:22
4F:→ koai:在你的问题里面, 应该是先算完idx <- f(a1,a2,a3)的值(向量) 12/02 13:22
5F:→ koai:然後用 sapply(idx,function(x){...}) 12/02 13:23
6F:→ koai:这样子不知道有没有帮到你... @@" 12/02 13:24
7F:→ koai:如果还有问题,也许可以试着给一点范例资料,帮你做看看! 12/02 13:25
8F:→ onionsteven:我试看看 @@ 谢谢 12/02 13:33
9F:→ koai:sapply(1:10000,function(x){g(data[x,])}),g(*)你可以自己写 12/02 13:40
10F:→ koai:这应该是你想要做的事吧? @@" 12/02 13:40
11F:→ obarisk:apply比for快...实验看看吧!比较美倒是真的! 12/02 13:42
12F:→ obarisk:注意到x是个物件,所以他不是一个值 12/02 13:44
13F:推 Yukirin:apply族的函数本质不也就是for loop吗 记得不会比较快 12/02 13:58
14F:→ onionsteven:那如果我希望改进for回圈的执行速度 能用甚麽样的写法 12/02 14:00
15F:→ koai:vectorize... eg.N=1000000; data=matrix(rnorm(3*N),N,3) 12/02 14:29
16F:→ koai:system.time( sapply(1:N,function(x){ data[x,1]^data[x,2]/ 12/02 14:30
17F:→ koai:data[x,3] }) ); 12/02 14:31
18F:→ koai:system.time(for(x in 1:N){data[x,1]^data[x,2]/data[x,3]}) 12/02 14:31
19F:→ koai:system.time( test <- data[,1]^data[,2]/data[,3] ) 12/02 14:32
20F:→ koai:你可以比较一下上面例子分别需要多少时间!! 12/02 14:32
21F:→ onionsteven:好的 谢谢 12/02 14:49
22F:→ gsuper:不要思考怎麽躲避回圈 应该要思考怎麽安排记忆体 12/02 17:04
23F:→ gsuper:比方说暂时用不到的的变数移除等 12/02 17:05
24F:→ onionsteven:请问意思是 执行的时候 变数越少越好吗? 12/02 17:33
25F:推 Wush978:除了vectorize之外都没有什麽好语法可以显着提升速度 12/02 21:50
26F:推 Wush978:但是透过电脑的硬体和适当的R 套件,可以显着提升速度 12/02 21:51
27F:→ Wush978:但是这个是case by case 的状况,所以建议可以详细给code 12/02 21:51