作者marki (marki)
看板Statistics
标题[问题] 请问chi-square的假设
时间Tue Jun 22 12:59:01 2021
各位前辈好
假设小弟有一个dataset, 总共有120个病人
其中有80个病人得了A病,60个病人得了B病。也就是说有部分的人同时有A病和B病
所以Dataset会长得像这样
病人编号 A病 B病 高血压 糖尿病
1 1 0 1 0
2 1 1 1 1
3 1 0 0 1
4 0 1 0 0
5 0 0 1 1
都是binary data
我想要看得A病和得B病的高血压有没有差异,请问
1) 我可以利用下面的表计算chi-square吗?
A病病患 B病病患
高血压 + 20 15
高血压 - 60 45
这个问题是在於因为chi-square可以检定独立性。可是我不确定如果两组病患之间
已经有部分是重复的,可是chi-square做起来显着,那我可以下结论说"A病和B病得
高血压的比例是不同的"吗?这样有违反任何chi-square的假设吗?
2) 承上,如果不行的话,有建议可以做甚麽其他的检定吗?
3) 承上,如果我有A, B, C三个病,所以除了检定三个病中高血压的比例外还需要做
post-hoc,那应该怎麽做呢?
以上
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.116.253.195 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1624337943.A.C8E.html
※ 编辑: marki (140.116.253.195 台湾), 06/22/2021 12:59:31
1F:→ andrew43: 快速的办法:分成 A+B- A-B+ A+B+ 三类病人。 06/22 14:36
2F:→ andrew43: 之後进行两两群病人间的2*2卡方并校正p值,就是多重比较 06/22 14:39
3F:→ andrew43: 题外话,如果同母体也能抽到 A-B- 样本,会更理想。 06/22 14:42
4F:→ marki: 谢谢andrew大大 这关系下一个表格的变数跑出来会不显着orz 06/22 21:29
5F:→ yhliu: 卡方检定是常态近似检定, 这例人数会不会太少? 06/23 10:17
6F:→ yhliu: 如果不担心常态近似的误差, 依 1F 所述分3组, 当作3个独立 06/23 10:19
7F:→ yhliu: 样本: A+B+,A+B-,A-B+, 实隙上要比较的是 A+ = A+B+∪A+B- 06/23 10:22
8F:→ yhliu: 与 B+ = A-B+∪A+B+ 之高血压比例, 适用不完全成对之相依样 06/23 10:24
9F:→ yhliu: 本的平均数差异检定(比例也是算术平均数). 即 06/23 10:26
10F:→ yhliu: z = (Xbar-Ybar)/√(Var(Xbar)+Var(Ybar)-2Cov(Xbar,Ybar)) 06/23 10:28
11F:→ andrew43: 这样本数用老师的z值可能不行。3x2交叉表用exact或per 06/23 17:35
12F:→ andrew43: mutation法若没显着大概就结束了。 06/23 17:35