作者Esmelee (Esme)

看板R_Language

标题

[问题] shiny读取大档案csv会当机

时间Sat Oct 21 21:42:37 2017

文章分类提示: - 问题:shiny [问题类型]: 程式谘询(我想用R 做某件事情，但是我不知道要怎麽用R 写出来) [软体熟悉度]: 入门(写过其他程式，只是对语法不熟悉) [问题叙述]: 我做了一个shiny读取历年资料的程式可是我的csv档案有2gb大发现读取可以，可是要用shiny+套件时就会当机如果不用shiny就可以正常绘图了有人建议我用mysql可是我把资料弄进mysql，mysql就当机了档案太大吗??只有2g阿到底要怎麽用才能正常在shiny上跑呢我的记忆体有16g 我是不是要用甚麽spark hadoop的就会跑得出来而且後端档案有2g大网站要怎麽做呢 shinyapps.io好像不可能... [程式范例]: library(leaflet) library(shiny) library(shinydashboard) library(readr) library(methods) library(DT) library(RCurl) alldata_2010 <- read_csv("alldata_test.csv", col_types = cols(PM2.5 = col_number(), year = col_character(), month = col_character(), day = col_character(), hour = col_character())) ui <- fluidPage( titlePanel("Basic DataTable"), fluidRow( column(4, selectInput("year", "year:", alldata_2010, selectize=TRUE) ), column(4, selectInput("month", "month:", alldata_2010, selectize=TRUE) ), column(4, selectInput("day", "day:", alldata_2010, selectize=TRUE) ), column(4, selectInput("hour", "hour:", alldata_2010, selectize=TRUE) ), fluidRow( title = "data MAP", collapsible = TRUE, width = "100%", height = "100%", leafletOutput("datamap", height = "900px") ) ) ) server <- function(input, output) { output$datamap <- renderLeaflet({ data <- alldata_2010 if (input$year != "all") { data <- data[data$year == input$year,] } if (input$month != "All") { data <- data[data$month == input$month,] } if (input$day != "All") { data <- data[data$day == input$day,] } if (input$hour != "All") { data <- data[data$hour == input$hour,] } cPal <- colorNumeric(palette = c("green","orange","red","purple"),domain = 0:100) leaflet(taiwan) %>%addProviderTiles(providers$CartoDB.Positron) %>% addPolygons(color = "#444444", weight = 1.5, smoothFactor = 1.5, opacity = 1.5, fillOpacity = 0.1) %>% addCircleMarkers(lng=data$TWD97Lon,lat=data$TWD97Lat, radius=13,stroke=FALSE, fillOpacity = 0.9, fillColor = ~cPal(data$PM2.5), label =~as.character(data$PM2.5), popup = ~as.character(data$site))%>% addLegend("bottomright", pal = cPal, values =data$PM2.5,title = "PM2.5", labFormat = labelFormat(suffix = " "),opacity = 1) } ) } shinyApp(ui = ui, server = server) [环境叙述]: R version 3.3.3 windows 10 记忆体16gb [关键字]:shiny 资料大 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.132.6.162 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1508593359.A.BE4.html

1^F：→ celestialgod: 你有打算自己架shiny server吗 10/21 21:55

2^F：→ celestialgod: 另外 mysql不可能存2GB就死了... 10/21 21:55

3^F：→ celestialgod: 最好的架构应该是直接架一台linux server 10/21 21:56

4^F：→ celestialgod: 用MariaDB存资料，需要的资料在捞出来画图就好 10/21 21:56

5^F：→ Esmelee: 要怎麽自己架server,我还在研究 10/21 22:03

6^F：→ Esmelee: 请问就是直接架一台linux server就不会造成当机了吗 10/21 22:04

7^F：→ celestialgod: Windows的application 我是比较不信他XD 10/21 22:06

8^F：→ Esmelee: 我目前光挑选csv中的资料就会很慢 10/21 22:06

9^F：→ celestialgod: 但是MySQL应该没那麽脆弱，你可能还是找找看 10/21 22:06

10^F：→ celestialgod: 问题在哪 10/21 22:06

11^F：→ celestialgod: SQL DB可以用Index加快搜寻速度 10/21 22:06

12^F：→ Esmelee: 我家电脑没有linux. 哭 10/21 22:07

13^F：→ celestialgod: csv资料筛选可以用data.table套件加速设keys 10/21 22:07

14^F：→ celestialgod: 看你到底是什麽用途... 10/21 22:07

15^F：→ celestialgod: 我只是推一个最好的架构并非一定要那样做 10/21 22:07

16^F：→ Esmelee: 这程式就是选择几年几日几时的数据，有二十年之长，如果 10/21 22:13

17^F：→ Esmelee: 弄成一个月是没问题，但我很需要长的资料啊 10/21 22:13

18^F：→ celestialgod: 资料库是最好的选择 10/21 22:15

19^F：→ celestialgod: 你不如去请教为什麽MySQL会死可能比较快XD 10/21 22:16

20^F：→ Esmelee: 我再看看mysql好了，如果shiny跟mysql做连结，会不会跑 10/21 22:16

21^F：→ Esmelee: 的比较快？ 10/21 22:16

22^F：→ celestialgod: mysql建好table要记得给index应该就没问题了 10/21 22:17

23^F：→ celestialgod: 我好像看出来你为什麽单纯2GB资料记忆体就吃不消的 10/21 22:18

24^F：→ celestialgod: 问题了... 10/21 22:18

25^F：→ celestialgod: 我回个文好了 10/21 22:18

26^F：推 HumuHumu: 我有整理架设shiny server的流程站内你 10/21 23:01

27^F：→ Esmelee: 谢谢大大了，我会再研究看看 10/22 00:06

28^F：推 bluecadence: 你的作业系统是 32- or 64-bit? 你的 R 执行档是 32- 10/22 12:44

29^F：→ bluecadence: or 64-bit build? 10/22 12:44

30^F：→ Esmelee: Platform: x86_64-w64-mingw32/x64 (64-bit) 10/22 12:55

31^F：→ Esmelee: 所以应该是64 ? 10/22 12:55

32^F：→ bluecadence: 你这应该还是windows作业系统的问题，你可以看一下 10/22 13:11

33^F：→ bluecadence: https://stat.ethz.ch/R-manual/R-devel/library/bas 10/22 13:11

34^F：→ bluecadence: e/html/Memory-limits.html (抱歉没缩网址) 10/22 13:12

35^F：→ bluecadence: 虽然OS和Apps都是64 bit 但是底下有一句话 10/22 13:13

36^F：→ bluecadence: "It is not normally possible to allocate as much 10/22 13:13

37^F：→ bluecadence: as 2Gb to a single vector in a 32-bit build of R 10/22 13:13

38^F：→ Esmelee: 修改过memory.limit造成windows当机，我等等上传csv 10/22 13:15

39^F：→ bluecadence: ... 贴到一半我发现我看错了.. 10/22 13:15

40^F：→ bluecadence: 原则上 64-bit Apps on 64-bit OS 应该没问题.. 10/22 13:15

41^F：→ bluecadence: 但你的错误讯息 cannot allocate vector of size ... 10/22 13:16

42^F：→ bluecadence: 看起来是 OS 不给memory 10/22 13:17

43^F：→ bluecadence: 还要再要 93 MB 的时候失败了 10/22 13:23

44^F：→ Esmelee: csv 下载 https://goo.gl/R1yvKs 10/22 13:31

45^F：→ Esmelee: 有没有不需要记忆体的方法阿 10/22 13:31

46^F：推 bluecadence: "cannot allocate vector of size N" 指的是不能继续 10/22 13:52

47^F：→ bluecadence: 取得"连续的"记忆体区块 10/22 13:53

48^F：→ Esmelee: 我把二十年改成十年就可以读取了! 10/22 15:35

49^F：→ celestialgod: 满好奇原PO资料是几个栏位，共有几个row? 10/22 20:16

50^F：推 cywhale: 2gb应该不会是data.table or SQL的阻碍.如果档案只查不改 10/23 13:44

51^F：→ cywhale: 也可以做前处理，自己依栏位属性切成较小的档案..如果 10/23 13:45

52^F：→ cywhale: 栏位属性不复杂也可以考虑bigmemory #1NaPhu9c 10/23 13:46

53^F：→ cywhale: 不过以文中看来，用成关联资料库取出资料应该最直接,,, 10/23 13:48

54^F：→ Esmelee: 我会再研究sql的，谢谢大家热心帮忙 10/24 22:41

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

R_Language 板

[问题] shiny读取大档案csv会当机

热门看板

赞助商连结