看板Statistics
标 题Re: [问题] 网路身分机率问题
发信站无名小站 (Wed Nov 8 01:18:49 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
> ※ 引述《yhliu (老怪物)》之铭言:
> > 某统计学教本一个问题概略如下:
> > 网路上有些人会以假性别从事网路活动.
> > 假设有 10% 机率会使用假性别.
> > 今某人约了4女2男见面,
> > 问实际性别也是 4女2男的机率是多少?
> > 当然, 这里必须有个假设: 所约的人不具特殊性.
> > 换个方式来说:
> > 假设网路上每个人都有 10%机会谎称性别,
> > 而且相互独立.
> > 我的问题是: 这样的题目是可解的吗?(题目所给条件足够?)
> > 如果是约 6女3男, 而问实际是 4女5男的机率呢?
有人看出来了: 事实上该教本的上列习题所给讯息是不完
整的. 而教师在教学时若不注意到这点, 所教给学生的,
只是错误且误导的解答罢了! 能不慎乎?
在一切都很理想的假设下, 再假设上网人口女性比例为π
而男性比例为 1-π. 则由贝氏定理可算出
P(假性别|网路身分为男性)
= 0.1(1-π)/[0.1(1-π)+0.9π] = p1
P(假性别|网路身分为女性)
= 0.1π/[0.1π+0.9(1-π)] = p2
因为是以 "约了4女2男见面" 为基础计算, 也就是已知的
是其网路身分. 这就像在病检问题, 已知的是病检结果而
非是否真的有病与否. 因此, 应以 p1, p2 为计算基础而
非原来的 0.1.
所以, 就原题而言, 是两个二项分布随机变数组合问题:
令 X = 网路身分男性用假性别人数 ~ bin(2,p1)
Y = 网路身分女性用假性别人数 ~ bin(4,p2)
所问为
P[X=Y] = P[X=Y=0] + P[X=Y=1] + P[X=Y=2]
而如果是 "如果是约 6女3男, 问实际是 4女5男的机率",
则 X~bin(3,p1), Y~bin(6,p2), 所问为
P[Y-X=2] = P[X=0,Y=2] + P[X=1,Y=3]
+ P[X=2,Y=4] + P[X=3,Y=5]
--
H E L P !!! 统 计 专 业 版 需 要 你 !!! 来 贴 文 吧 !!!
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
★本文未经本人同意请勿转载; 回覆请勿全文引用, 请仅留下直接涉及部分。
--
夫兵者不祥之器物或恶之故有道者不处君子居则贵左用兵则贵右兵者不祥之器非君子
之器不得已而用之恬淡为上胜而不美而美之者是乐杀人夫乐杀人者则不可得志於天下
矣吉事尚左凶事尚右偏将军居左上将军居右言以丧礼处之杀人之众以哀悲泣之战胜以
丧礼处之道常无名朴虽小天下莫能臣侯王若能守之万物将自宾天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦将知止知止可以不殆譬道之在天 163.15.188.87海
1F:推 qqwerty:题目的症结点应该是"假设有10%机率会使用假性别"这句话, 11/09 11:42
2F:→ qqwerty:会让人误会而产生错误的计算... 11/09 11:43