Python 板


LINE

各位前輩大家好 小弟本身是在做資料分析的工作 平常工作上使用的主要是SQL跟SAS 自己想學其他的 open source code 加強能力 不知道各位前輩對於做ETL or Data mining 比較推薦python還是R呢 小弟第一次發言 請大家提供小弟建議 謝謝 --
QR Code



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.14.97.42
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1466365654.A.723.html
1F:→ bibo9901: Python已經夠慢了, R更是慢到無以復加... 06/20 11:08
2F:→ shadowjohn: 資料得處理再處理再處理再處理再去餵工具XD 06/20 13:07
3F:→ Neisseria: 先評估函式庫/套件有沒有符合需求再來選語言 06/20 13:22
4F:→ Neisseria: 語法上是 Python 比 R 簡單,但這往往不是最重要的點 06/20 13:23
5F:推 JackBaska: 單資料整理 R 贏 Python , 如果你的資料是型態很雜且 06/20 17:00
6F:→ JackBaska: 需要很前處理的話,我是推薦 R 06/20 17:01
7F:→ JackBaska: 如果你的資料是大量數值,或是結構性還有coding狀況算好 06/20 17:01
8F:→ JackBaska: 的資料,Python在校能上可以讓你做很多分析,而且速度非 06/20 17:02
9F:→ JackBaska: 常快,像是我之前要在R上面生出一億個元素的亂數矩陣 06/20 17:03
10F:→ JackBaska: 等超久,Python只要幾秒,看需求為主 06/20 17:03
11F:→ Wush978: R 的亂數產生器比較嚴謹。很多R 開發者的取捨,效能並不 06/20 17:19
12F:→ Wush978: 是最重要的。因為要說效能,python/R都呵呵 06/20 17:19
13F:推 JackBaska: 是阿...可惜....全用Cpp爆開開發速度會崩潰 06/20 17:34
14F:→ JackBaska: 我比較傾向先確定想法算法可以work,再考慮要不要刻 06/20 17:34
15F:→ keepingJBJ: 謝謝前輩們提供的建議,小弟就先從R開始學習,資料 06/20 17:59
16F:→ keepingJBJ: 整理的效能對統計分析真的很重要 06/20 18:00
17F:→ bibo9901: 用R就注定你的data大學永遠只能是玩具等級 06/20 18:02
18F:→ bibo9901: 小 06/20 18:02
19F:→ bibo9901: 另外可以給個"R的亂數產生器比較嚴謹"的 reference 嗎? 06/20 18:09
20F:→ Wush978: 我用R在企業中處理一天破億筆的資料,並且架設推薦引擎 06/20 18:48
21F:→ Wush978: R的dplyr後面接一層就可以直接串sparkSQL 06/20 18:49
22F:→ Wush978: R的rng介紹: http://0rz.tw/uZRcI 06/20 18:51
23F:→ Wush978: 不過說回來,處理大數據,和用R,用python比較沒關係 06/20 18:51
24F:→ Wush978: 了解資料結構,演算法,作業系統等知識後,用什麼都一樣 06/20 18:52
25F:→ Wush978: 恩... 應該說,語言還是有差,但是不會是在R vs Python這 06/20 18:52
26F:→ Wush978: 種問題,而是java hadoop-like 等工具集合 v.s. 其他等這 06/20 18:53
27F:→ Wush978: 種層面上 06/20 18:53
28F:推 gozule: 選python,需要速度就用cython加速 06/20 22:57
29F:推 gozule: 我用cython+numpy寫算法,效能和純c的程式效能差異可以壓 06/20 23:01
30F:→ gozule: 在10%以內 06/20 23:01
31F:推 gogogogo3333: 請問樓上大大,cpython 該如何入門呢?有推薦的ide 06/21 07:05
32F:→ gogogogo3333: 嗎? 小弟目前是使用anaconda 下的spider ide 06/21 07:05
33F:推 JackBaska: go大。原po主需求是資料前處理還有ㄧ般統計分析,還有 06/21 09:06
34F:→ JackBaska: 對非cs背景的親合度,整體來說R應該更適合,對非相關 06/21 09:06
35F:→ JackBaska: 領域來說dplyr比pandas還有re親民許多 06/21 09:06
36F:→ JackBaska: 不過我也想問cython入門 06/21 09:06
37F:推 gozule: cython只是把python加上type後編譯而已,重點是編譯後可以 06/21 10:49
38F:→ gozule: 加速的幅度非常大,官網 http://cython.org/ 06/21 10:49
39F:→ gozule: 還有cython不是CPython,這是兩種不同的東西 06/21 10:50
40F:→ gozule: cython的寫法也很簡單,先把python程式寫好確定正確性後, 06/21 10:51
41F:→ gozule: 就可以開始替變數加type,加好後編譯即可直接執行 06/21 10:51
42F:→ gozule: cython的IDE目前我只知pycharm pro有支援,學術用免費 06/21 10:52
43F:→ gozule: 效能比較1 https://goo.gl/fCpr5l 06/21 10:56
44F:→ gozule: 效能比較2 https://goo.gl/8hHZjd 06/21 10:56
45F:→ gozule: 如果R能夠用llvm編譯執行也能很快,只是相關套件不成熟 06/21 11:00
46F:→ Neisseria: 看了一下 g 大提供的 benchmark,覺得 Cython 蠻厲害的 06/21 11:07
47F:→ Neisseria: 可以接近 C 和 Julia,但是相對好寫很多 06/21 11:08
48F:→ Wush978: (偏了) 要效能的話,試試看pypy吧,可能比cython更快 06/21 20:02
49F:→ Wush978: 而且不用改code,只是換interpreter 06/21 20:02
50F:推 os653: PyPy 是比 Python 快不少啦,但是跟 C 比... 06/21 20:54
51F:→ uranusjr: PyPy 一般被認為在可以和 C 在同一個數量級喔, 完全可比 06/21 21:10
52F:推 gozule: pypy也是一個選項,只是對於numpy為主的套件似乎支援不完 06/22 01:03
53F:→ gozule: pypy官網一直都有在募集資金做numpy for pypy的porting 06/22 01:06
54F:→ gozule: http://pypy.org/numpydonate.html ,如果是以numpy開發為 06/22 01:06
55F:→ gozule: 主,建議用cython, 如是純python的話,可以用pypy更省事。 06/22 01:06
56F:→ gozule: pypy套件列表 http://packages.pypy.org/ 06/22 01:08
57F:推 svin: 新手想請教gozule大, 請問cython code裡可以使用python的其 06/22 01:15
58F:→ svin: 他package嗎? 06/22 01:15
59F:推 CaptainH: pypy不能用scipy等package 太傷了 06/22 02:12
60F:推 CaptainH: 而且個人經驗是:pypy 和 C/C++ 速度同個數量級的程式碼 06/22 02:18
61F:→ CaptainH: ,此時Cpython也不會慢到哪去 06/22 02:18
62F:推 JackBaska: os大大 C很快但開發時間跟不上老闆的心啊 06/22 07:58
63F:→ gozule: cython裡面可以使用cpython的全部套件,也可以用c/c++開發 06/22 13:49
64F:→ gozule: 的library,如TA-lib的wrapper https://goo.gl/G17vLb 06/22 13:50
65F:→ gozule: 簡單的說,只要cpython能夠import的套件,cython通通能用 06/22 13:51







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:iOS站內搜尋

TOP