作者saltlake (SaltLake)
看板Statistics
标题[问题] 线性回归参数和应变数之估计
时间Tue Apr 18 18:59:59 2023
对於线性回归问题,通常我们只考虑取一组样本以估计该模型
的参数。
y(i) = b0+b1*x(i), i = 1 to k, k 是该组样本的点数
利用 x 的样本点来估算参数,b0 和 b1。
可既然 x 乃随机变数,表示倘我们另取他组样本做估计,所得
的参数估计值会有变化,而用该参数组模型所得预测值也会如此
。
那麽我们是否可透过下面方法估计这些参数和预测值的信心区
间?
取多组 x 的样本,每组样本可以给我们对应的参数组之值:
b0(j), b1(j); j = 1 to q, q 乃 x 样本的组数
计算个别参数的样本平均值︰ avg_b0 = sum( b0(j), j = 1 to q)/q
avg_b1 = sum( b1(j), j = 1 to q)/q
当然我们也可计算得到个别参数的样本误差: SE_b0, SE_b1
然後我们可得到信心区间的估计如下:
CI_b0 = avg_b0 +- SE_b0*Z(alpha)
CI_b1 = avg_b1 +- SE_b1*Z(alpha)
alpha 乃信心水准而 Z 是随机变数(如标准常态分布或学生分布)
但是预测值 y 的信心区间的估计就麻烦了,因为它是对应到「固定」的
x 的值。
y(i,j) = b0(j)+b1(j)*x(i,j), i = 1 to k, j = 1 to q
所以不能用上面的方法估计 y(i,j) 的信心区间。
那麽如何得到这个估计区间呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.24.51.187 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1681815601.A.430.html
1F:→ andrew43: 我优先会把组别当成另一个自变数。它和x有没有交互作用 04/18 22:29
2F:→ andrew43: 可以再测试。 04/18 22:29
3F:→ andrew43: 但还是要先知道实验设计比较好。 04/18 22:30
这里的实验,限制在打算测试新药剂量(x)和疗效(y)之间的关系。
所以不同的组别,是指不同家医院对院内患者得到的样本组。
当药品的适应症没有地区性,例如某些地区的人特别好发等,组别应该
和药效(y)以及剂量(x)没有关系。
※ 编辑: saltlake (114.24.51.187 台湾), 04/18/2023 22:52:14
4F:推 andrew43: mixed model 04/19 08:27
请问混和模型的意思是?
5F:嘘 F04E: mixed model 04/20 08:17
6F:嘘 F04E: 要先知道实验设计比较好 04/20 14:54
※ 编辑: saltlake (114.24.64.134 台湾), 04/20/2023 21:31:45
7F:→ andrew43: 同时考虑固定和随机因子的模型。有时叫做阶层、混合、 04/20 22:26
8F:→ andrew43: 多重水准之类的。 04/20 22:26
9F:→ andrew43: 例如你的资料可能可以考虑以各组别为随机因子,且考虑 04/20 22:28
10F:→ andrew43: 组别间与x的随机斜率 04/20 22:28
11F:推 andrew43: 查查mixed model random intercept random slope,教学 04/20 22:33
12F:→ andrew43: 很多,看看图可以大致了解其作用。 04/20 22:33