作者marki (marki)
看板Statistics
標題[問題] 請問chi-square的假設
時間Tue Jun 22 12:59:01 2021
各位前輩好
假設小弟有一個dataset, 總共有120個病人
其中有80個病人得了A病,60個病人得了B病。也就是說有部分的人同時有A病和B病
所以Dataset會長得像這樣
病人編號 A病 B病 高血壓 糖尿病
1 1 0 1 0
2 1 1 1 1
3 1 0 0 1
4 0 1 0 0
5 0 0 1 1
都是binary data
我想要看得A病和得B病的高血壓有沒有差異,請問
1) 我可以利用下面的表計算chi-square嗎?
A病病患 B病病患
高血壓 + 20 15
高血壓 - 60 45
這個問題是在於因為chi-square可以檢定獨立性。可是我不確定如果兩組病患之間
已經有部分是重複的,可是chi-square做起來顯著,那我可以下結論說"A病和B病得
高血壓的比例是不同的"嗎?這樣有違反任何chi-square的假設嗎?
2) 承上,如果不行的話,有建議可以做甚麼其他的檢定嗎?
3) 承上,如果我有A, B, C三個病,所以除了檢定三個病中高血壓的比例外還需要做
post-hoc,那應該怎麼做呢?
以上
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.253.195 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1624337943.A.C8E.html
※ 編輯: marki (140.116.253.195 臺灣), 06/22/2021 12:59:31
1F:→ andrew43: 快速的辦法:分成 A+B- A-B+ A+B+ 三類病人。 06/22 14:36
2F:→ andrew43: 之後進行兩兩群病人間的2*2卡方並校正p值,就是多重比較 06/22 14:39
3F:→ andrew43: 題外話,如果同母體也能抽到 A-B- 樣本,會更理想。 06/22 14:42
4F:→ marki: 謝謝andrew大大 這關係下一個表格的變數跑出來會不顯著orz 06/22 21:29
5F:→ yhliu: 卡方檢定是常態近似檢定, 這例人數會不會太少? 06/23 10:17
6F:→ yhliu: 如果不擔心常態近似的誤差, 依 1F 所述分3組, 當作3個獨立 06/23 10:19
7F:→ yhliu: 樣本: A+B+,A+B-,A-B+, 實隙上要比較的是 A+ = A+B+∪A+B- 06/23 10:22
8F:→ yhliu: 與 B+ = A-B+∪A+B+ 之高血壓比例, 適用不完全成對之相依樣 06/23 10:24
9F:→ yhliu: 本的平均數差異檢定(比例也是算術平均數). 即 06/23 10:26
10F:→ yhliu: z = (Xbar-Ybar)/√(Var(Xbar)+Var(Ybar)-2Cov(Xbar,Ybar)) 06/23 10:28
11F:→ andrew43: 這樣本數用老師的z值可能不行。3x2交叉表用exact或per 06/23 17:35
12F:→ andrew43: mutation法若沒顯著大概就結束了。 06/23 17:35