作者saltlake (SaltLake)
看板Statistics
標題[問題] 線性回歸參數和應變數之估計
時間Tue Apr 18 18:59:59 2023
對於線性回歸問題,通常我們只考慮取一組樣本以估計該模型
的參數。
y(i) = b0+b1*x(i), i = 1 to k, k 是該組樣本的點數
利用 x 的樣本點來估算參數,b0 和 b1。
可既然 x 乃隨機變數,表示倘我們另取他組樣本做估計,所得
的參數估計值會有變化,而用該參數組模型所得預測值也會如此
。
那麼我們是否可透過下面方法估計這些參數和預測值的信心區
間?
取多組 x 的樣本,每組樣本可以給我們對應的參數組之值:
b0(j), b1(j); j = 1 to q, q 乃 x 樣本的組數
計算個別參數的樣本平均值︰ avg_b0 = sum( b0(j), j = 1 to q)/q
avg_b1 = sum( b1(j), j = 1 to q)/q
當然我們也可計算得到個別參數的樣本誤差: SE_b0, SE_b1
然後我們可得到信心區間的估計如下:
CI_b0 = avg_b0 +- SE_b0*Z(alpha)
CI_b1 = avg_b1 +- SE_b1*Z(alpha)
alpha 乃信心水準而 Z 是隨機變數(如標準常態分布或學生分布)
但是預測值 y 的信心區間的估計就麻煩了,因為它是對應到「固定」的
x 的值。
y(i,j) = b0(j)+b1(j)*x(i,j), i = 1 to k, j = 1 to q
所以不能用上面的方法估計 y(i,j) 的信心區間。
那麼如何得到這個估計區間呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.51.187 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1681815601.A.430.html
1F:→ andrew43: 我優先會把組別當成另一個自變數。它和x有沒有交互作用 04/18 22:29
2F:→ andrew43: 可以再測試。 04/18 22:29
3F:→ andrew43: 但還是要先知道實驗設計比較好。 04/18 22:30
這裡的實驗,限制在打算測試新藥劑量(x)和療效(y)之間的關係。
所以不同的組別,是指不同家醫院對院內患者得到的樣本組。
當藥品的適應症沒有地區性,例如某些地區的人特別好發等,組別應該
和藥效(y)以及劑量(x)沒有關係。
※ 編輯: saltlake (114.24.51.187 臺灣), 04/18/2023 22:52:14
4F:推 andrew43: mixed model 04/19 08:27
請問混和模型的意思是?
5F:噓 F04E: mixed model 04/20 08:17
6F:噓 F04E: 要先知道實驗設計比較好 04/20 14:54
※ 編輯: saltlake (114.24.64.134 臺灣), 04/20/2023 21:31:45
7F:→ andrew43: 同時考慮固定和隨機因子的模型。有時叫做階層、混合、 04/20 22:26
8F:→ andrew43: 多重水準之類的。 04/20 22:26
9F:→ andrew43: 例如你的資料可能可以考慮以各組別為隨機因子,且考慮 04/20 22:28
10F:→ andrew43: 組別間與x的隨機斜率 04/20 22:28
11F:推 andrew43: 查查mixed model random intercept random slope,教學 04/20 22:33
12F:→ andrew43: 很多,看看圖可以大致了解其作用。 04/20 22:33