R_Language 板


LINE

出處 http://stackoverflow.com/questions/11486369/growing-a-data-frame-in-a-memory-efficient-manner 這篇文章探討要如何有效率一筆一筆的增加資料的數量。 一般用`data.frame`的作法: ```r res <- data.frame(x=rep(NA,1000), y=rep(NA,1000)) tracemem(res) for(i in 1:1000) { res[i,"x"] <- runif(1) res[i,"y"] <- rnorm(1) } ``` ps. 之前我不知道`tracemem`這個指令,所以才需要用C 來印記憶體位置 `tracemem`會在記憶體被複製的時候,印出訊息 可以看到每次`[<-` 都會複製記憶體,導致當res 是很大的data.frame時效能低落 ( 在我現在要處理的資料上,res 有600000 rows... ) 目前我也完全不知道有什麼R 的方法,可以在增加資料上避免data.frame的複製。 ( 所以我之前都寫Rcpp來對付這個問題,但是就是增加我的coding 量... ) 直到我膝蓋中了一箭,看到data.table和這篇文章。 ```r library(data.table) dt <- data.table(x=rep(0,1000), y=rep(0,1000)) tracemem(dt) for(i in 1:1000) { dt[i,x := runif(1)] dt[i,y := rnorm(1)] } # note no mesage from tracemem ``` 在我的資料上,利用data.table的效能提升至少十倍。 ※ 引述《Wush978 (拒看低質媒體)》之銘言: : [關鍵字]: R, large scale data : [出處]: http://cran.r-project.org/web/packages/data.table/index.html : [重點摘要]: : data.table很適合在資料很大的時候取代data.frame: : 我並沒有很詳細的研究底層和其他特性,但是至少data.table支援以下兩個功能: : - 支援in memory indexing : - 支援modification in place : 這讓我今天在處理大量資料時,效能大大提升。 : 存取時間下降,記憶體使用量也下降。 : 所以在此分享這個套件,給所有記憶體吃緊的版友們。 -- 歡迎加入 Taiwan R User Group : http://www.facebook.com/Tw.R.User 我們每週一都有在「政大公企中心(台北市金華街187號)西樓WB05」 舉辦Machine Learning / Data Mining Monday: 報名 http://www.meetup.com/Taiwan-R/ 聚會影片 https://www.youtube.com/user/TWuseRGroup --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.149.151
1F:推 memphis:看你的code, 看不出有什麼特別之處, 所以是特異功能? 05/11 12:30
2F:→ memphis:一般來說如果是順序性的塞資料, 的確是不會一個一個assign 05/11 12:31
3F:→ memphis:所以兩個都是stupid code的情況下, 只能歸因於data.table 05/11 12:33
4F:→ memphis:用index的方式 加快i的搜尋? 05/11 12:34
5F:→ Wush978:在data.frame的版本,每個回圈都會new 一個data.frame 05/11 13:10
6F:→ Wush978:在data.table的版本,不會 05/11 13:10







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Soft_Job站內搜尋

TOP