作者evilove (愿意感动就是一种享受)
看板Statistics
标题Re: [问题] 研究样本比研究母体结果更精确?
时间Mon Oct 15 02:21:32 2018
延续这个问题
y大提到非抽样误差在普查中不容易控制的问题
如果放在问卷调查中的确比较好理解
请问如果是一家公司针对它本身会员资料库进行分析
假设会员资料库是母体
这样还会有非抽样误差的问题吗?
※ 引述《kiyounin (OWOOO)》之铭言:
: 觉得可能是很小白的问题,不过跟同学讨论之後得不出结果,
: 所以想说来板上问问看。
: 讲义上面在提到「研究时取样的好处」时有一个叙述如下:
: 根据样本取得的结果大多数时後会比根据母体取得的结果更准确(accurate)。
: 其他的比如研究样本比研究母体更便宜更有可行性更快速等等之类的都可以理解,
: 但得到的结果会比研究母体更精确这个叙述有点看不太懂。
: (这个地方老师很快就带过去了,并没有针对这句叙述多做说明。)
: 不知道是我对於accurate这个英文字的解释不对或是如何。
: 为什麽研究样本会比研究母体更精确呢?
: 一般来讲,不是都是说研究样本会有误差吗?
: 在这里先谢谢愿意一起讨论或解答的版友~~
: 单纯听老师上课时此处并未多做着墨,听过去觉得好像都懂,没想到回头过来看讲义时却
: 出现奇妙的问题QWQQ
: https://i.imgur.com/YP0jx28.jpg
: 补一下讲义翻拍照片,是第四项。
: 开始担心难道我除了数学不行以外英文也不行了吗QWQQQ
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 69.140.102.182
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1539541294.A.521.html
1F:→ myty383: 取决於取得资讯的过程中是否会产生误差 10/15 03:22
2F:→ myty383: 例如,早期电脑没有那麽强大的年代,收集资讯就已经是很 10/15 03:23
3F:→ myty383: 难的事情,在加上人工整理资料,普查一定很容易产生误差 10/15 03:23
4F:→ myty383: 但现在电脑普及後,如果有必要我相信可以设计的十分精准 10/15 03:25
5F:→ myty383: 的收集,加上确认资讯正确性的成本也许可以很低,所以可 10/15 03:25
6F:→ myty383: 能可以大大降低非抽样误差 10/15 03:25
7F:→ myty383: 非抽样误差是非常case by case 的问题,情境和细节改变基 10/15 03:26
8F:→ myty383: 本上差异就很大 10/15 03:26
9F:→ yhliu: 没有. 这时如果需要抽样, 大概只有当此资料库非常钜大时. 10/16 06:56
10F:→ yhliu: 当然, 前提是 "假设会员资料库是母体" . 10/16 06:58
11F:→ evilove: 谢谢两位大大的释疑 10/17 01:32
12F:→ yhliu: 资料库的资料是否符合事实和电脑科技不必然有直接关系. 举 10/17 15:08
13F:→ yhliu: 个简单的例子, 健保资料库的疾病资料与真实的患病情形乖离 10/17 15:10
14F:→ yhliu: 多少和电脑技术的发展毫无关系, 它是和健保医疗执行的力度 10/17 15:13
15F:→ yhliu: 有关, 例如没病去诊所开药, 有病者没去就医等等. 所以我强 10/17 15:15
16F:→ yhliu: 调: "假设会员资料库是母体" 那除非因嫌资料库太大不便分 10/17 15:17
17F:→ yhliu: 析, 否则不必抽样. 当然钜量资料的计算也是一项需要技巧的 10/17 15:18
18F:→ yhliu: 事. 就算计算个简单算术平均, 面对数以亿计的资料, 普通计 10/17 15:20
19F:→ yhliu: 算方式都可能出问题. 10/17 15:21
20F:→ myty383: y大我只是举某个例子,当然很多东西要真实面对问题才会知 10/17 17:49
21F:→ myty383: 道 10/17 17:49
22F:→ yhliu: 资料数位化的现代, 资料库中的资料与事实的差距有两方面, 10/18 08:41
23F:→ yhliu: 一是传统的调查误差错抽样,非抽样), 二是数位化过程的误差. 10/18 08:43
24F:→ yhliu: 前者, 与电脑科技几乎是无关的; 後者, 反倒是在许多情形电 10/18 08:45
25F:→ yhliu: 脑科技昌盛的现在反而可能错误机率大些. 何妁以故? 早期资 10/18 08:48
26F:→ yhliu: 料电脑化是人工看着书面资料输入到卡片, 而後转成磁带或磁 10/18 08:50
27F:→ yhliu: 碟档, 用的是专业打卡人员, 而且采一打卡一验卡方式避免错 10/18 08:51
28F:→ yhliu: 误. 而现在, 专业集中输入采用直接 key in 成磁碟档/磁带档 10/18 08:54
29F:→ yhliu: 若采用 double key in 或一打一验方式则如同以前, 但占若只 10/18 08:56
30F:→ yhliu: 是一次键入动作, 甚或非专职者从事此工作, 则难免犯错. 另 10/18 08:58
31F:→ yhliu: 现在更多资料库来自分散式现场输入, 虽因各种原因患错机率 10/18 09:01
32F:→ yhliu: 不高, 也难说绝无错误可能. 10/18 09:02
33F:→ yhliu: 不过, 资料电脑化或称数位化过程在任何时代错误机率都是极 10/18 09:04
34F:→ yhliu: 低的. 所以使用资料库资料, 所需考虑的其实主要还是资料与 10/18 09:06
35F:→ yhliu: 涉及的事实之间因不实或遗漏而产生的差距. 如果把资料库看 10/18 09:08
36F:→ yhliu: 成是普查结果, 这事实上就是非抽样误差. 不过, 如果抽样资 10/18 09:10
37F:→ yhliu: 料是从资料库产生, 抽样只是多了抽样误差, 却未改变非抽样 10/18 09:12
38F:→ yhliu: 误差. 10/18 09:12