作者saltlake (SaltLake)
看板Statistics
标题[问题] 变异数和信心区间宽度
时间Wed Jan 12 11:54:15 2022
取得一个样本之後,如果它的变异数小,那麽它的
精确度或者说可靠度比较高。
那如果我们做统计推论,根据样本算出的信心区间
的宽度比较窄,是否表示估计的平均值落於较窄区
间而更可靠? 或者说,信心区间的宽度有什麽统计
上的意义?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.24.72.32 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1641959657.A.3B7.html
1F:→ Pieteacher: 这是要用比较的,两个不同treatment 的 interval 宽 01/12 17:48
2F:→ Pieteacher: 度不同但是 coverage probability 一样,就会选择窄一 01/12 17:48
3F:→ Pieteacher: 点的 01/12 17:48
这边还有个问题是,即使是同一种处置,根据每次抽样所得的样本所计算的
信心区间宽度也会不同。换言之这信心区间宽度本身也是随机变数。
所以问题其实有二,首先最基本的是,抽样所得信心区间宽度的数值
有什麽统计意义。其二是,怎样估计这个信心区间宽度?多次抽样估
计後取平均值吗?
※ 编辑: saltlake (114.24.72.32 台湾), 01/12/2022 22:44:14
4F:推 locka: 关於统计意义,我的理解是:样本平均值介於上界跟下界之间 01/13 01:37
5F:→ locka: 的机率(例如在95%的信心水准下,代表算100次的样本平均值有 01/13 01:37
6F:→ locka: 95次会在这个区间中)。至於需不需要真的算100次样本平均然 01/13 01:37
7F:→ locka: 後再把每一次的上下界平均,取得一个平均的上下界,答案是 01/13 01:37
8F:→ locka: 不用(应该)。因为只要是对同一个母体做随机抽样,则做成对t 01/13 01:37
9F:→ locka: 检定应该会发现无法拒绝虚无假说,所以虽然每一次抽样本算 01/13 01:37
10F:→ locka: 出来的样本平均值跟上下界有所变化,但基本上不会相差太多 01/13 01:37
11F:→ locka: ,所以不用拘泥於每一次算出来的上下界不一样这件事。(就算 01/13 01:37
12F:→ locka: 你取上下界的平均好了,也不过就是一个值,而且跟任何一次 01/13 01:37
13F:→ locka: 抽样的上下界结果比较也是无法拒绝虚无假说) 01/13 01:37
换言之,每次取样计算信心区间的意义,仅在於查看该此样本平均值是否落於
区间内。倘是者则统计显着,反之则否。
这其实和每次取样计算 p 值的功用相同,只看该值是否小於显着水准以判定
是否统计显着。
这样看来,每次取样计算信心区间和计算 p 值的目的和公用完全一致。但是
文献上有争执论文应该 1. 给信心区间 2. 给 p 值 3. 给两者。
其中第一种认为给信心区间「能做出给多统计解释」。但从上面讨论实在看不出。
※ 编辑: saltlake (114.24.72.32 台湾), 01/13/2022 09:29:44
14F:→ andrew43: 区间是否包括假设值,和区间的上下界值为何,是解释不 01/13 11:11
^^^^^^^^^^^^^^^^
这是假说检定
15F:→ andrew43: 同事情。 01/13 11:11
16F:→ andrew43: 不同在於你倾向假说检验还是参数估计。 01/13 11:12
所以是说,如果用样本计算出信心区间,除了可检查假设值是否在区间内而
检定假说,还可进一步从区间宽度判断样本参数的可靠度? 例如参数是准确度
,则其信心区间窄表示这个样本对该参数的估计比较可靠?
※ 编辑: saltlake (114.24.72.32 台湾), 01/13/2022 12:27:18
17F:→ locka: 感觉好像也不是说比较可靠耶(搔头),只要是在同样的信心水 01/13 12:36
18F:→ locka: 准下,宽或窄都一样可靠啊。只能说根据抽样资料的分布情形 01/13 12:36
19F:→ locka: ,窄的表示样本平均值的变异比较小,用来估计母体参数的变 01/13 12:36
20F:→ locka: 异也比较小,应该是这样…吧? 01/13 12:36
21F:推 wieldthewave: 其实我觉得信赖区间可以对统计结果多做解释是对的, 01/13 14:24
22F:→ wieldthewave: 毕竟他可以直接对母体平均给出上下界,但pvalue就是 01/13 14:24
23F:→ wieldthewave: 单纯对假设检定给出有没有拒绝而已。就是信赖区间除 01/13 14:24
24F:→ wieldthewave: 了可以看有没有拒绝之外,也可以再推论一些东西 01/13 14:24
25F:→ andrew43: 一个民调的95%区间20%+/-3%,这叫估计不叫假说检定。 01/13 14:34
26F:→ andrew43: 20%+/-3%不包括25%,因此拒绝H0:theta=25%,这才叫检定 01/13 14:36
27F:→ andrew43: 另一个方法对同母体可得95%区间为+/-1%,那叫更可靠。 01/13 14:38
28F:推 recorriendo: 信赖区间不是母体平均的上下界 95%也不是母体平均 01/13 15:49
29F:→ recorriendo: 落在这个区间里的机率! 01/13 15:49
31F:→ recorriendo: 这篇的讨论看一下吧 你的问题还有上面推文正好就是 01/13 16:01
32F:→ recorriendo: 他指出的三大fallacies 01/13 16:01
33F:推 ll6a: 95%就代表Type 1 Error是5%,可靠程度就是95%信赖水准或是5 01/13 17:43
34F:→ ll6a: %显着水准,跟宽窄没关系 01/13 17:43
35F:→ ll6a: 也不能说跟宽窄没关系,你信赖水准越高当然也就越宽不过这 01/13 17:50
36F:→ ll6a: 没什麽意义,我说你0-200岁一定会死,虽然是一定准但有意义 01/13 17:50
37F:→ ll6a: 吗 01/13 17:50
38F:→ ll6a: 也就是说在大家比较接受的95%信赖水准,宽窄是根据你的随机 01/13 17:52
39F:→ ll6a: 误差大小,但实验比较care的是你的随机误差是否符合线性模 01/13 17:52
40F:→ ll6a: 型而已 01/13 17:52
意思是: 目标变数 = X (随机变数) + e (随机误差)?
如果误差是二次或其他函数,目前统计课本的公式不能用?
41F:→ ll6a: 符合线性模型代表你的实验因素是有显着影响,不符合的话你 01/13 18:01
42F:→ ll6a: 就需要找非实验因素控制从错误的随机误差切一块出来来达成 01/13 18:01
43F:→ ll6a: 线性模型 01/13 18:01
※ 编辑: saltlake (114.24.72.32 台湾), 01/13/2022 20:47:12