作者del680202 (HANA)
看板Soft_Job
標題Re: [請益] 資料分析 R or Python ?
時間Sat Jul 15 16:42:23 2017
※ 引述《JingJing00 (晶晶)》之銘言:
: ※ 引述《f496328mm (123)》之銘言:
: : 想請教從事 資料分析、ML 相關工作的各位,
: : 比較常用 R 還是 Python ?
: : 因為我上網搜尋相關工作,比較常看到必備需求中包含 Python ,幾乎沒有 R
: : 因為 R 比較偏向學術嗎?
: : 我上網GOOGLE到這幾篇
: : R, Python Duel As Top Analytics, Data Science software – KDnuggets 2016
: : Software Poll Results
: : https://goo.gl/DQNEvq
: : SAS, R, or Python Survey 2016: Which Tool Do Analytics Pros Prefer?
: : https://goo.gl/sJUubT
: : R vs Python for Data Science: The Winner is
: : http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
: : 都是 R 使用率大於 Python
: : 所以想請教各位,謝謝
標題是說"資料分析" R贏倒是不意外
自己合作過的的幾個data team大概都有個現象
沒SE背景的喜歡R
有SE背景的喜歡Python
做資料分析的,跟做ML、DL的通常的我自己會分開看
做資料分析這段多的是統計數學甚至其他背景出身的
這類人通常不愛寫程式,R對他們來說嚇嚇叫了
如果是做服務還是ML,DL 這段的通常SE背景的多,所以更偏好python也是正常
掛名data scientist這個詞我個人對他解釋是偏向前者多一點
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.15.43.92
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1500108145.A.692.html
1F:→ mike7689: data "engineer" 身分是engineer 的通常更喜歡python 07/15 17:53
2F:→ ericrobin: 以你講的這些來說 用R跟python難度沒差多少吧 07/15 18:06
3F:→ ericrobin: 做ML跟DL多數時還是直接用調包 總不會用什麼就刻一次 07/15 18:08
4F:推 f496328mm: 感謝回覆,我就是統計出身,蠻喜歡寫程式的,只是R跟Py 07/15 18:17
5F:→ f496328mm: thon邏輯不太一樣,要轉換需要花點時間 07/15 18:17
6F:推 vfgce: 對一般資訊背景的人來說,R難學多了,光是list,data.frame和 07/15 18:41
7F:→ vfgce: matrix,搭配各種apply,aggregate就夠頭昏眼花的,加上詭異的 07/15 18:42
8F:推 f496328mm: 我統計的,比較喜歡R的邏輯 07/15 18:44
9F:→ vfgce: 物件導向,會讓很多人覺得很亂,不過用習慣真的簡潔. 07/15 18:45
10F:→ vfgce: python其實是一般程式語言,為了科學計算及資料處理,才用上 07/15 18:47
11F:→ vfgce: numpy及pandas,用起來其實也和R很像,但終究不是原生功能... 07/15 18:48
12F:→ vfgce: 所以寫起來就沒R簡潔... 07/15 18:48
我是R跟Python都有在用
DL那些不論,平常想要簡單的探索資料性質的時候R是真的用很爽
※ 編輯: del680202 (118.15.43.92), 07/15/2017 18:55:47
13F:推 f496328mm: R真的好方便QQ,程式碼很精簡又強 07/15 19:20
14F:推 physheepy: 我覺得以資料分析來說的話 應該專注在分析 而不是工具 07/16 08:51
15F:→ physheepy: 所以使用什麼語言不重要 可以把東西做出來就好 07/16 08:53
16F:→ physheepy: 我99%的時間使用C++ python 跟 javascript 缺什麼常用 07/16 08:54
17F:→ physheepy: 的function 就自己寫 建立自己的lib 07/16 08:55
18F:→ physheepy: 我是數理背景的DS 但沒有用過R 因為從來感覺不到有需要 07/16 08:57
19F:噓 fantasywater: 物件導向會讓很多人覺得很亂..!?!?!?!?! 07/16 13:35
20F:推 vfgce: R的物件導向很複雜,至少就有s3,s4,RC三種... 07/16 15:01
21F:→ vfgce: 不知道樓上用過沒... 07/16 15:01
22F:推 vfgce: 相較於其他程式語言單一化的物件寫法,R的物件導向不算好懂. 07/16 15:05
嗯...個人看法,當做資料分析的還要分心去搞物件導向去搞底層
或許該檢討的是分工方式,基本上data flow還是API介接還是lib等東西
自然有data engineer跟ML engineer會搞定
雖說各公司文化方針會有差異,至少我接觸過做資料分析的會被要求專心對付資料的問題
他們平常設計實驗跑數據就忙翻了
當然自己有興趣去碰是另當別論
※ 編輯: del680202 (118.15.43.92), 07/16/2017 17:01:49
23F:推 wei220: 認識自稱R神的 07/18 12:33