作者Wush978 (拒看低质媒体)
看板R_Language
标题Re: [问题] [data.table] cbind
时间Sun Jun 30 00:54:39 2013
※ 引述《celestialgod (攸蓝)》之铭言:
: 如果格式data.frame只要7368 bytes
: 但是格式data.table 要10512 bytes
这个增加的格式看起来是只有和column数相关。
```r
for(n in 1:10) {
b <- do.call("rbind", rep(list(iris), n))
a1 <- b
a2 <- data.table(b)
print(object.size(a2) - object.size(a1))
}
```
差距都在0.6kb左右
可以看到记忆体的差距和row的个数无关。
但是请记得data.table提供了index 的功能,
所以在大资料的时候做subset等查询的效能差异是非常大的。
至於这个记忆体的差距其实非常小,单位应该只是在kb,
以现在Gb级的记忆体量来说实在是微不足道。
当然,建立index 本身也是要记忆体的。
--
欢迎到ptt R_Language版分享R 的相关知识
欢迎加入 Taiwan R User Group :
http://www.facebook.com/Tw.R.User
聚会报名
http://www.meetup.com/Taiwan-R/
聚会影片
https://www.youtube.com/user/TWuseRGroup
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.137.111.239