作者goodpoint (worry)
看板Statistics
標題[問題] 為何國內都教/用 SAS 很少用STATA ?
時間Sun Aug 27 01:31:09 2017
我是生醫領域的 很多生統的人都是用SAS 學校的教授也喜歡叫人學SAS
但是STATA的統計功能不比SAS差
甚至也有人說STATA超越SAS
譬如這本書的作者講的
http://www.books.com.tw/products/0010736076
又譬如合併檔案
這篇文章
http://www.everdark.info/2012/12/sas-data-merge.html
裡面寫道 STATA的merge幾乎是萬用 SQL的joint做不到的STATA也行
況且STATA也可以用點選的 友善許多
我自己用的經驗也是STATA是又快又好用
雖然受限於記憶體
不過在生醫領域 即使跑健保資料庫 STATA也是綽綽有餘
不知為何大部分都沒在 教or用 STATA ?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 182.234.180.189
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1503768673.A.E31.html
1F:推 parcequetoi: 也許一部份是未來就業市場需求的考量? 08/27 01:50
3F:→ parcequetoi: 人回應,或許可以參考看看。(不然我也很想說R幾乎是 08/27 01:52
4F:→ parcequetoi: 萬用 XD) 08/27 01:52
5F:→ Richee1996: 一個軟體可以扣逗其他軟體,那幹嘛還要學STAT,R萬用 08/27 02:19
6F:→ Richee1996: 啊 08/27 02:19
7F:推 DIDIMIN: 可能大部分老師都用 SAS 吧,不需再買另一套 08/27 08:56
8F:推 goshfju: 感覺是被收買了 顆顆 08/27 09:36
9F:→ goshfju: SAS光安裝就很惱人 08/27 09:36
10F:→ jupit: 因為你把SAS拿來當處理資料的工具而非統計上的使用 08/27 09:53
11F:→ jupit: SAS對於任何的統計法都會有對應的paper跟一堆教授背書 08/27 09:54
12F:→ jupit: 對於FDA而言,程式好不好用並不是重點,而是結果可不可信 08/27 09:55
13F:→ jupit: 所以FDA內部很多人用R做研究,但送審資料一定要求用SAS 08/27 09:56
14F:→ parcequetoi: 我覺得或許還是已經習慣沿用的問題 08/27 10:40
15F:→ parcequetoi: 事實上R語言背後也是都有對應的paper跟一堆教授背書 08/27 10:40
16F:→ parcequetoi: 有些甚至是統計相關與電腦科學的雙博士 08/27 10:41
17F:→ parcequetoi: 它是免錢,但好像會有些人以為它都沒在維護或不可信 08/27 10:43
19F:→ nefele: SAS EG 08/27 13:46
20F:→ f496328mm: R 免費 所以出事沒辦法推給別人阿 08/27 21:37
21F:→ f496328mm: SAS貴的很 花這麼多錢 出事有人負責 08/27 21:37
22F:→ f496328mm: 不是教授背書 是SAS背書 08/27 21:38
23F:推 lsshno1: FDA 08/27 22:19
24F:推 timshan: 美國FDA只認SAS 醫藥領域當然用SAS... 08/28 18:58
25F:→ bmka: 沒有DFA只認SAS這回事 08/28 21:22
26F:→ bmka: 不要再以訛傳訛 08/28 21:25
28F:→ recorriendo: 教授背書? 教授能保證你用的package裡沒有任何bug? 08/29 01:18
29F:→ recorriendo: 別忘了弄出來是幾百萬人要吃的藥 如果出事查出來是軟 08/29 01:19
30F:→ recorriendo: 體的bug這個責任很大條 用商用軟體至少有人會背黑鍋 08/29 01:23
31F:→ recorriendo: 所以這不只是好不好用的問題 還有風險管理考量 08/29 01:23
32F:推 f496328mm: SAS 收費這麼高 就是保證強 08/29 02:43
33F:→ f496328mm: R 跟 Python 幾乎都是 open source 相對危險 08/29 02:43
34F:推 c0harles: 奇怪,怎麼都沒有人提到,SAS可以處理上千萬筆資料能力 08/29 07:03
35F:→ c0harles: 之優越,R,Stats就是這點很弱呀 08/29 07:03
36F:→ paladin499: R也可以處理上千萬筆資料啊 08/29 07:17
37F:→ f496328mm: 我用 R 處理過 8千萬筆data過................. 08/29 10:21
38F:→ celestialgod: SAS處理千萬級以上的資料能力才弱吧.... 08/29 20:29
39F:→ celestialgod: 幾億的資料在R處理都可以很順 08/29 20:29
STATA據官網表示 觀察值筆數可以到200億筆 但這是理論值
要看記憶體大小決定可以處理的資料大小
40F:→ celestialgod: 至於為什麼沒人提跟你一樣的理由就是 跟你認知相反 08/29 20:30
41F:推 lsshno1: 應該這麼說 FDA也認R 但是這產業九成用SAS 08/29 22:32
43F:→ lsshno1: FDA只認SAS某種程度像是獅子的鬃毛 08/29 22:36
44F:→ celestialgod: 上面那個連杰在這篇出現三次XDDD 08/29 22:58
STATA的處理資料方式跟其他不同 是把資料全部讀進記憶體裡面
所以運算的速度會快非常多 ram的速度比硬碟快太多了 即使用固態硬碟
還是比一般的ram慢
SAS大概比SPSS速度快了一個數量級 Stata又比SAS快了一個數量級
而且就資料處理以及統計分析而言 SAS做得到的Stata也都做得到
而且Stata的統計方法比SAS還多(當然太進階太新的統計方法也用不到)
Stata的語法又是簡潔扼要
所以我學Stata 不學SAS
目前Stata的缺點唯一想到的就是記憶體沒有加到很大時
無法處理非常非常龐大的資料
不知各位高手有無其他意見 ?
單純討論各統計軟體的優劣與各自的特色
※ 編輯: goodpoint (114.35.254.137), 08/30/2017 00:46:58
45F:→ f496328mm: 個人比較喜歡 R 程式碼精簡 工具也非常齊全 08/30 08:21
46F:→ f496328mm: 而且 R 很直覺 如果某些統計方法沒有套件 08/30 08:21
47F:→ f496328mm: 用 R 直接寫一個也不難 08/30 08:22
48F:→ f496328mm: 另外 R 也是將 DATA 丟到 RAM 中 08/30 08:24
49F:→ f496328mm: R 可以多核心運算 高階函數也多 速度上算快了 08/30 08:25
50F:→ f496328mm: 不過還是看每個人的習慣喜好 08/30 08:27
51F:→ f496328mm: 另外也不用侷限在單一語言 寫超過兩種語言都很正常 08/30 08:29
52F:推 abc80082: 說穿了 這些老師在當時受美國教育就是被他的老師教授sa 08/31 08:15
53F:→ abc80082: s 也沒再學stata 所以你只能接受他只教sas的事實囉 08/31 08:15
54F:推 tew: SAS是以公司向企業推廣,並且提供他們獨特的解法 08/31 11:14
55F:→ tew: 直接幫銀行建資料庫還有處理方案 08/31 11:14
56F:→ tew: 而且是針對總行洗腦 08/31 11:15
57F:→ tew: 總行完成以後,就開始推到分行,當分行也好了以後 08/31 11:15
58F:→ tew: 以後企業繳交材料要用SAS format給他們 08/31 11:16
59F:→ tew: 你想貸款時,你要不要有人學SAS,還是說老子就是不用SAS 08/31 11:16
60F:→ tew: 所以,不管你會什麼其他軟體,只要這些軟體沒有人攻向企業 08/31 11:17
61F:→ tew: 只要讓SAS完成金融界用SAS,不管他有多慢,得會SAS 08/31 11:19
62F:推 goshfju: 感謝樓上詳細解說~ 09/01 00:18
63F:推 goshfju: 洗腦用得很恰當XD 09/01 00:20
64F:推 paladin499: Stata的merge並不是SQL的join做不到吧,他只是說SQL 09/01 07:24
65F:→ paladin499: 沒有這樣的邏輯,但是換一個邏輯結果還是做得到吧 09/01 07:24
66F:→ obarisk: 管理功能應該還是有差吧,R, py都沒有管理功能,銀行都無 09/01 12:49
67F:→ obarisk: 法用 09/01 12:49
68F:→ clsmbstu: 好奇樓上說的「管理功能」是什麼? @@ 09/01 18:41
69F:推 moris927: 就是有問題找的到人負責處理到好,除了金融業,衛福部資 09/01 19:59
70F:→ moris927: 料中心之類的政府單位也都是SAS插旗,未來他們也為更專 09/01 19:59
71F:→ moris927: 注於"服務"這塊吧,特別是以大數據資料科學之名... 09/01 19:59
72F:推 f496328mm: 很好奇SAS真的好用嗎?之前學過一陣子SAS + 考到base 09/02 07:24
73F:→ f496328mm: 證照,在接觸R、Py之後,完全不想用SAS了 09/02 07:24
74F:推 f496328mm: 一個 SAS 好幾GB,真不知道為什麼要這麼大,用光碟安 09/02 07:31
75F:→ f496328mm: 裝過,好像有4片,神扯 09/02 07:31