作者pocession (阿宗)
看板Statistics
標題[問題]一個關於資料判讀的問題
時間Fri Jun 16 16:54:34 2006
這個不是課本上的習題
我目前在讀統計想了解一下實驗資料的可信度
我有一個問題關於實驗結果的認定
假定一個森林經過長時間的調查發現某一種樹木遭寄生蟲感染的比例為0.4
而今年某研究團隊經過10次採樣 每次採樣20棵 發現感染的樹木數如下:
12,8,10,13,14,16,12,9,12,10(樣本平均數為11.6,樣本標準差為2.41)
第一個我想了解的是以上這10筆資料有沒有不太對的?
假設新的感染率p = 11.6/20 = 0.58 ~ 0.6,查二項式分佈的表可發現
P[X = 9] = 0.071 > 0.05 P[X = 15] = 0.075 > 0.05
因此 我推論 本次的資料在9 ~ 15間是沒問題的,根據這樣,我把上述的10筆資料
其中的8和16刪掉,因此新的樣本平均數為11.5,樣本標準差為1.69
第二個我想了解的是,是不是我取樣的這八筆資料的平均值為11.5,
是否代表了新的感染率就為 11.5/20 = 0.575
因此我以 p = 0.6 P[u-2Std < X < u + 2Std] = P [8 < X < 15] = 0.892 < 0.95
所以我認定今年的採樣數據並沒有支持此種樹遭寄生蟲的感染率有升高的趨勢
請問我以上的流程有沒有問題?
因為我的統計才剛看 並沒有很熟
有錯的請大家多多指正
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.129.74.128