作者Ajax3 (键盘柳承敏)
看板Statistics
标题Re: [讨论] Python 有 SAS、SPSS 做不到的资料分析吗
时间Thu Mar 2 14:07:18 2017
一些不同意见。
※ 引述《songhome (爽轰)》之铭言:
: 但是现代资料探勘中,你计算的东西基本上就是整个母体了
尽管计算能力与资料存储方式一直在进步,
受限於研究方法 (是否有能力取得母体的资料) 或实验成本,
现今很多领域研究的对象依然是样本而非母体。
以基因体研究为例,一个病人检体的WGS就要数十万,
不可能去计算母体的资料。
: 虽然不知道贵公司是在处理甚麽资料
: 但同样的盲点你请统计背景的人来一样会有盲点
: 为什麽这样说呢?
: 举例来说,你今天把"所有"身高资料切成一段一段画长条图,发现身高愈高体重也愈高
: 所以你下结论,身高与体重呈正相关
: 你可能会担心的盲点是(以下是我从原PO文章的猜想,有错请更正)
: 我只是画个图这样就能下这个结论吗?如果未来新的资料进来一样适用吗?
: 身高与体重这样的斜率够显着吗? 诸如此类的问题
: 事实上对於这些问题,统计背景的人也无法回答
: 因为统计背景处理的问题是
: 抽了"一些"资料出来,这些资料所画出来的东西
: 跟你用"所有"资料画出来的东"一不一样"
: 所谓显着也只是在回答这个问题
: 综合以上所述,不难看出为什麽推文提到生技领域SAS独大
: 因为生技领域主要处理的就是古典统计的问题,这也是SAS强大的地方
其实我觉得生技领域,或者说 -omics 领域处理的并不是只有古典统计,
重点还是在统计推论,诸不见新药研发第三期新闻都在报 p-value?
SAS/SPSS 与 R/python 的差别,我想还是应用领域。
在美国许多统计系所毕业生的去处是制药产业/Clincal trial,
这些产业长期以来以SAS为主,而SAS又是间大公司,也有能力处理FDA验证的问题,
可以参考这篇
https://webptt.com/cn.aspx?n=bbs/Bioindustry/M.1487842866.A.77E.html
其他跟统计相关领域很多以 R 为主,毕竟是 open source,使用者也多,
许多生统方法的论文都直接提供 R 语法。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 210.242.157.68
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1488434841.A.2F2.html
1F:→ f496328mm: SAS主要是用在生统医学方面 因为有FDA认证 03/02 15:45
2F:→ f496328mm: 所以才卖那麽贵阿 药厂都是砸钱下去做 03/02 15:45
3F:→ f496328mm: 一般人用 R PYTHON 比较多 03/02 15:46
5F:→ Wush978: 不过R 要取代SAS最大的困难在人, 谁没事会想把自己跑若干 03/03 00:41
6F:→ Wush978: 年的程式从SAS换成R? 出错谁顶? 03/03 00:41
7F:→ Wush978: 但是反过来看,新的单位就很有机会用R了,因为没包袱 03/03 00:43
8F:→ jayfei2000: ☺ nice reply 04/03 00:20
9F:推 TsaiTao: 长知识推 07/13 00:01