作者JingJing00 (晶晶)
看板Soft_Job
标题Re: [请益] 资料分析 R or Python ?
时间Sat Jul 15 16:30:04 2017
※ 引述《f496328mm (123)》之铭言:
: 想请教从事 资料分析、ML 相关工作的各位,
: 比较常用 R 还是 Python ?
: 因为我上网搜寻相关工作,比较常看到必备需求中包含 Python ,几乎没有 R
: 因为 R 比较偏向学术吗?
: 我上网GOOGLE到这几篇
: R, Python Duel As Top Analytics, Data Science software – KDnuggets 2016
: Software Poll Results
: https://goo.gl/DQNEvq
: SAS, R, or Python Survey 2016: Which Tool Do Analytics Pros Prefer?
: https://goo.gl/sJUubT
: R vs Python for Data Science: The Winner is
: http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
: 都是 R 使用率大於 Python
: 所以想请教各位,谢谢
做商业应用扩充性很重要
资料清理过、分析过之後,蛮需要弄成API让别人也可以用你清理或分析过的资料
python可以建成API,甚至可以直接在这个应用上面接Django或Flask写前端
应用继续成长,使用资料一定会涉及到使用者权限
python直接通DB,用SQLAlchemy,1小时内就可以搞定
有一天资料来源变大了,或更复杂了,直接用python做ETL,用luigi管理流程
维护也变复杂了,需要写许多python script
但如果要比简洁度跟效率,应该都比不过scala,可以用很少的程式码写分散式运算
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.77.30
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1500107406.A.189.html
1F:→ Wush978: 内部交流的话,包web API不如直接发套件吧 07/15 16:36
2F:→ Wush978: 直接把资料的读取方法封装,不用多一层web 07/15 16:38
3F:→ Wush978: 透过自建的套件repository 发布 07/15 16:39
4F:→ Wush978: 这种方式每一种工具都能用 07/15 16:39
5F:推 Sunal: 原po应该不是单指内部交流 07/15 16:47
6F:推 drajan: 这两个用途不太一样 R更专精於资料分析 python则是general 07/15 16:54
7F:推 f496328mm: 感谢大大,看来两种都要熟悉,最近试着将R转成Python 07/15 18:14
8F:→ f496328mm: 看看 07/15 18:14
9F:→ celestialgod: 资料前端的处理 Python这方面真的满方便 07/15 21:53
10F:→ celestialgod: 不过後端的资料分析以及一些ETL,我都还是用R做 07/15 21:53
11F:推 fantasywater: 包 web api 是为了异质系统介接整合,或是跨单位存 07/16 13:40
12F:→ fantasywater: 取分析後的资料,可能不是单纯包套件可以取代.. 07/16 13:40