DataScience 板


LINE

抱歉,重新改寫,前幾天生病有工作,心有餘了而不足,頭腦有點昏又焦急,在這更新一 下,希望能幫助以後有同樣困擾的人。 小弟目前正在學習資料分析,想到kaggle 練功,所以在這想請問幾個問題......麻煩各 位了 首先是統計軟體的問題,請問SAS、RStdio、Python可以跑多大的資料? 第二個是bigquery,如果用私服器跑資料分析,一定得用linux嗎? 因為我看到RSudio s erver只能用linux...最主要是因為前陣子有興趣的變項很多都在biqquery,所以才想挑 戰看看 第三個是linux,如果我想操作linux,是否需要把電腦重灌作業系統? 又或者是買新的一台新的電競桌電(強的cpu、gpu、記憶體)? 因為之前用mac,結果sas不能用,今年一月才入手了一台七萬多的Thinkpad,現在已經有 兩台筆電了!所以很矛盾QAQ 抱歉 問題這麼多...最近真的很焦慮 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.77.79.151
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1554445133.A.05C.html
1F:推 egoweaver: 在本機上跑不需要 RStudio server,單純使用的狀況能跑04/05 14:46
2F:→ egoweaver: 的資料大小受你的記憶體大小限制。04/05 14:46
3F:→ egoweaver: 要上 Google Cloud 跑 bigquery 的話跟你本機的作業系04/05 14:47
4F:→ egoweaver: 統沒有關係,Rstudio server 也是要部署在伺服器端。04/05 14:47
5F:→ egoweaver: Google 有官方文件說明怎麼在他們的主機部署 Rstudio04/05 14:49
6F:→ egoweaver: 請詳讀說明文件:http://tinyurl.com/y6r8thvr04/05 14:49
7F:推 st1009: 其實你標題可以取跟問題本身有關一點,然後有種技術叫雙系04/05 15:13
8F:推 st1009: 統,windows+linux大讚04/05 15:13
9F:推 st1009: 買新電腦CP應該不會比灌雙系統高,如果你電腦容量不夠,也04/05 15:16
10F:推 st1009: 可以用行動硬碟灌linux,那顆硬碟帶到哪,linux就到哪04/05 15:16
11F:→ f496328mm: 第一,先把 SAS 刪掉,貴又只在特定領域有用 04/05 15:47
12F:→ f496328mm: R 跟 python,超過 10gb or 上億筆 data 都可04/05 15:48
13F:→ f496328mm: linux 好用多了,windows 簡直爛04/05 15:48
14F:→ f496328mm: mac 筆電不考慮,記憶體小,cp 值超低 04/05 15:49
15F:→ nohunt: 還有個辦法 用VM開Linux 04/05 20:26
16F:→ sma1033: MAC缺點好像是同價位硬體都弱一截04/05 20:59
17F:→ sma1033: 基本上只要硬體夠塞,理論上沒到TB等級的資料沒問題04/05 20:59
18F:→ sma1033: 至少我用py自己跑幾百G都還滿OK的(完全看硬體等級啦)04/05 21:00
19F:→ truehero: KAGE? KAGGLE ?如果是KAGGLE就直接用KAGGLE KERNEL....04/06 00:23
20F:→ truehero: 或是上COLAB就好 ...04/06 00:23
21F:推 sunkao1035: 當然是在server或雲上跑分析呀04/06 01:37
※ 編輯: filialpiety (223.138.66.254), 04/06/2019 22:02:51
22F:→ filialpiety: 感謝樓上各位大大的協助,我會努力的 04/06 22:03
23F:→ sxy67230: 如果是實驗或比賽,用kernel或是Colab就好了。我自己的 04/08 10:37
24F:→ sxy67230: 經驗是python中有很多批量處理的方式,像是generator或 04/08 10:37
25F:→ sxy67230: 是pandas有專門給批量處理的生成方式,相對他就只佔固定 04/08 10:37
26F:→ sxy67230: 的記憶體,至於sklearn也有對應增量學習的方法,線性的s 04/08 10:37
27F:→ sxy67230: vm可以用SGD改成hinge loss,非線性的話,目前沒有效的 04/08 10:37
28F:→ sxy67230: 方式處理(可以去聽吳恩達教授的課,他有說明),至於DL 04/08 10:37
29F:→ sxy67230: 本身就有batch的方式處理了。軟體解決的方案都考慮過, 04/08 10:37
30F:→ sxy67230: 在去處理硬體。詳細的軟體寫法可以去python 版問 04/08 10:37
31F:→ sxy67230: 基本上,colab的cpu跟gpu都很夠了,除非你的服務是要上 04/08 12:52
32F:→ sxy67230: 線的,要不然純粹開發階段,Colab就很爽啦,到哪都可以 04/08 12:52
33F:→ sxy67230: 開發,只要一條網路線就好了,我都在用文書機寫code了 04/08 12:52
34F:→ sxy67230: 最後就是還真的記憶體不夠用,記得檢查哪些記憶體是可以 04/08 13:03
35F:→ sxy67230: 釋放的,哪些可以重複使用,不要被高階語言跟硬體慣壞, 04/08 13:03
36F:→ sxy67230: 系統釋放跟管理系統資源是程式設計者的本分,創了一堆無 04/08 13:03
37F:→ sxy67230: 用的array當然記憶體會不夠用 04/08 13:03







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP