作者goodpoint (worry)
看板Statistics
标题[问题] 为何国内都教/用 SAS 很少用STATA ?
时间Sun Aug 27 01:31:09 2017
我是生医领域的 很多生统的人都是用SAS 学校的教授也喜欢叫人学SAS
但是STATA的统计功能不比SAS差
甚至也有人说STATA超越SAS
譬如这本书的作者讲的
http://www.books.com.tw/products/0010736076
又譬如合并档案
这篇文章
http://www.everdark.info/2012/12/sas-data-merge.html
里面写道 STATA的merge几乎是万用 SQL的joint做不到的STATA也行
况且STATA也可以用点选的 友善许多
我自己用的经验也是STATA是又快又好用
虽然受限於记忆体
不过在生医领域 即使跑健保资料库 STATA也是绰绰有余
不知为何大部分都没在 教or用 STATA ?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 182.234.180.189
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1503768673.A.E31.html
1F:推 parcequetoi: 也许一部份是未来就业市场需求的考量? 08/27 01:50
3F:→ parcequetoi: 人回应,或许可以参考看看。(不然我也很想说R几乎是 08/27 01:52
4F:→ parcequetoi: 万用 XD) 08/27 01:52
5F:→ Richee1996: 一个软体可以扣逗其他软体,那干嘛还要学STAT,R万用 08/27 02:19
6F:→ Richee1996: 啊 08/27 02:19
7F:推 DIDIMIN: 可能大部分老师都用 SAS 吧,不需再买另一套 08/27 08:56
8F:推 goshfju: 感觉是被收买了 颗颗 08/27 09:36
9F:→ goshfju: SAS光安装就很恼人 08/27 09:36
10F:→ jupit: 因为你把SAS拿来当处理资料的工具而非统计上的使用 08/27 09:53
11F:→ jupit: SAS对於任何的统计法都会有对应的paper跟一堆教授背书 08/27 09:54
12F:→ jupit: 对於FDA而言,程式好不好用并不是重点,而是结果可不可信 08/27 09:55
13F:→ jupit: 所以FDA内部很多人用R做研究,但送审资料一定要求用SAS 08/27 09:56
14F:→ parcequetoi: 我觉得或许还是已经习惯沿用的问题 08/27 10:40
15F:→ parcequetoi: 事实上R语言背後也是都有对应的paper跟一堆教授背书 08/27 10:40
16F:→ parcequetoi: 有些甚至是统计相关与电脑科学的双博士 08/27 10:41
17F:→ parcequetoi: 它是免钱,但好像会有些人以为它都没在维护或不可信 08/27 10:43
19F:→ nefele: SAS EG 08/27 13:46
20F:→ f496328mm: R 免费 所以出事没办法推给别人阿 08/27 21:37
21F:→ f496328mm: SAS贵的很 花这麽多钱 出事有人负责 08/27 21:37
22F:→ f496328mm: 不是教授背书 是SAS背书 08/27 21:38
23F:推 lsshno1: FDA 08/27 22:19
24F:推 timshan: 美国FDA只认SAS 医药领域当然用SAS... 08/28 18:58
25F:→ bmka: 没有DFA只认SAS这回事 08/28 21:22
26F:→ bmka: 不要再以讹传讹 08/28 21:25
28F:→ recorriendo: 教授背书? 教授能保证你用的package里没有任何bug? 08/29 01:18
29F:→ recorriendo: 别忘了弄出来是几百万人要吃的药 如果出事查出来是软 08/29 01:19
30F:→ recorriendo: 体的bug这个责任很大条 用商用软体至少有人会背黑锅 08/29 01:23
31F:→ recorriendo: 所以这不只是好不好用的问题 还有风险管理考量 08/29 01:23
32F:推 f496328mm: SAS 收费这麽高 就是保证强 08/29 02:43
33F:→ f496328mm: R 跟 Python 几乎都是 open source 相对危险 08/29 02:43
34F:推 c0harles: 奇怪,怎麽都没有人提到,SAS可以处理上千万笔资料能力 08/29 07:03
35F:→ c0harles: 之优越,R,Stats就是这点很弱呀 08/29 07:03
36F:→ paladin499: R也可以处理上千万笔资料啊 08/29 07:17
37F:→ f496328mm: 我用 R 处理过 8千万笔data过................. 08/29 10:21
38F:→ celestialgod: SAS处理千万级以上的资料能力才弱吧.... 08/29 20:29
39F:→ celestialgod: 几亿的资料在R处理都可以很顺 08/29 20:29
STATA据官网表示 观察值笔数可以到200亿笔 但这是理论值
要看记忆体大小决定可以处理的资料大小
40F:→ celestialgod: 至於为什麽没人提跟你一样的理由就是 跟你认知相反 08/29 20:30
41F:推 lsshno1: 应该这麽说 FDA也认R 但是这产业九成用SAS 08/29 22:32
43F:→ lsshno1: FDA只认SAS某种程度像是狮子的鬃毛 08/29 22:36
44F:→ celestialgod: 上面那个连杰在这篇出现三次XDDD 08/29 22:58
STATA的处理资料方式跟其他不同 是把资料全部读进记忆体里面
所以运算的速度会快非常多 ram的速度比硬碟快太多了 即使用固态硬碟
还是比一般的ram慢
SAS大概比SPSS速度快了一个数量级 Stata又比SAS快了一个数量级
而且就资料处理以及统计分析而言 SAS做得到的Stata也都做得到
而且Stata的统计方法比SAS还多(当然太进阶太新的统计方法也用不到)
Stata的语法又是简洁扼要
所以我学Stata 不学SAS
目前Stata的缺点唯一想到的就是记忆体没有加到很大时
无法处理非常非常庞大的资料
不知各位高手有无其他意见 ?
单纯讨论各统计软体的优劣与各自的特色
※ 编辑: goodpoint (114.35.254.137), 08/30/2017 00:46:58
45F:→ f496328mm: 个人比较喜欢 R 程式码精简 工具也非常齐全 08/30 08:21
46F:→ f496328mm: 而且 R 很直觉 如果某些统计方法没有套件 08/30 08:21
47F:→ f496328mm: 用 R 直接写一个也不难 08/30 08:22
48F:→ f496328mm: 另外 R 也是将 DATA 丢到 RAM 中 08/30 08:24
49F:→ f496328mm: R 可以多核心运算 高阶函数也多 速度上算快了 08/30 08:25
50F:→ f496328mm: 不过还是看每个人的习惯喜好 08/30 08:27
51F:→ f496328mm: 另外也不用局限在单一语言 写超过两种语言都很正常 08/30 08:29
52F:推 abc80082: 说穿了 这些老师在当时受美国教育就是被他的老师教授sa 08/31 08:15
53F:→ abc80082: s 也没再学stata 所以你只能接受他只教sas的事实罗 08/31 08:15
54F:推 tew: SAS是以公司向企业推广,并且提供他们独特的解法 08/31 11:14
55F:→ tew: 直接帮银行建资料库还有处理方案 08/31 11:14
56F:→ tew: 而且是针对总行洗脑 08/31 11:15
57F:→ tew: 总行完成以後,就开始推到分行,当分行也好了以後 08/31 11:15
58F:→ tew: 以後企业缴交材料要用SAS format给他们 08/31 11:16
59F:→ tew: 你想贷款时,你要不要有人学SAS,还是说老子就是不用SAS 08/31 11:16
60F:→ tew: 所以,不管你会什麽其他软体,只要这些软体没有人攻向企业 08/31 11:17
61F:→ tew: 只要让SAS完成金融界用SAS,不管他有多慢,得会SAS 08/31 11:19
62F:推 goshfju: 感谢楼上详细解说~ 09/01 00:18
63F:推 goshfju: 洗脑用得很恰当XD 09/01 00:20
64F:推 paladin499: Stata的merge并不是SQL的join做不到吧,他只是说SQL 09/01 07:24
65F:→ paladin499: 没有这样的逻辑,但是换一个逻辑结果还是做得到吧 09/01 07:24
66F:→ obarisk: 管理功能应该还是有差吧,R, py都没有管理功能,银行都无 09/01 12:49
67F:→ obarisk: 法用 09/01 12:49
68F:→ clsmbstu: 好奇楼上说的「管理功能」是什麽? @@ 09/01 18:41
69F:推 moris927: 就是有问题找的到人负责处理到好,除了金融业,卫福部资 09/01 19:59
70F:→ moris927: 料中心之类的政府单位也都是SAS插旗,未来他们也为更专 09/01 19:59
71F:→ moris927: 注於"服务"这块吧,特别是以大数据资料科学之名... 09/01 19:59
72F:推 f496328mm: 很好奇SAS真的好用吗?之前学过一阵子SAS + 考到base 09/02 07:24
73F:→ f496328mm: 证照,在接触R、Py之後,完全不想用SAS了 09/02 07:24
74F:推 f496328mm: 一个 SAS 好几GB,真不知道为什麽要这麽大,用光碟安 09/02 07:31
75F:→ f496328mm: 装过,好像有4片,神扯 09/02 07:31