作者peter0726 (江 谢)
看板R_Language
标题[问题] 用 R 做卡方检测
时间Wed Apr 19 11:04:15 2017
[问题类型]: 程式谘询
[软体熟悉度]: 入门
主要用 perl 处理资料,偶尔用R作分析
[问题叙述]:
我现在有两笔资料要比较其组成比例有没有差异
问过其他人後知道要用卡方
资料大致上长这样
要比较 A、T、C、G 的组成在 A 跟 B 之间是否有差异
A T C G
SampleA 1937 373 14788 238
sampleB 2590 395 17686 274
想请问一下要怎麽在R上面做到卡方检定?
目前 google 查到的方法是这样
a <- c(1937,373,14788,238)
b <- c(2590,395,17686,274)
chisq.test(rbind(a,b))
在上面列出来case时结果跟我在网路上找到的计算器结果相同
(
http://www.socscistatistics.com/tests/chisquare2/Default2.aspx)
可是到了另一个 case
A T C G
SampleA 1595826 308 450 76
sampleB 1576617 362 428 59
上面的写法跑出来的p-value是 0.06327
可是计算器上给的结果是 The p-value is < 0.00001
想请问一下正确的做法是怎麽样
[环境叙述]:
R version 3.3.2 (2016-10-31)
Platform: x86_64-redhat-linux-gnu (64-bit)
Running under: CentOS release 6.7 (Final)
locale:
[1] C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.163.96.158
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1492571058.A.9D8.html
1F:推 clansoda: 把所有资料弄成一个table 然後chisq.test() 04/19 11:19
2F:推 dumb0101: 参数Correction不用预设看看? 04/19 11:58
3F:推 fred1541: 那是生物DNA? 04/21 09:39
4F:推 Steven87: 对table直接summary会自动帮你做卡方检定 04/21 12:14