ask-why 板


LINE

※ 引述《souldragon (依法不依人)》之铭言: : 班佛定律老实说很冷门 我看了1,20本经济或统计的书也没啥人引用过 : 有人说可以用来检验选举或帐目有无人为篡改 条件是随机资料要有3000笔以上 : 随机资料和随机抽样意思差不多 就是不能有外部人为干预下自然产生的结果 : 比如统计样本至少要有1068才能反应母体 那3000这数字是怎麽得出来的? : 若有这限制 也无法用来检验选举作票 因为每投票所的人口不到3000 : 通常都在2000以下 投票率七成则在1500以下 数据永远不到3000笔 : 至少每个投票所母数要有5000 投票率六成以上才能符合门槛值 : 样本数量根本未达标 还有人用这理论在检验 不是很奇怪?? 这定律原意是 当有很多笔数据时,1开头的数据会占个三成左右,2345依次递减 那,一坨数据里面要有接近什麽%数的1开头这种事,需要的是这坨数据够大坨 而不是这坨数据里面每个资料值都超过3000 举帐目造假的例子来说 是卖场要有3000笔以上的销售资料才能用它来验算 而不是3000元以上的帐单才能应用这个定律 ~~ 但这个定律除了数据要够大坨之外,数据的跨度也要够大才适用 一样用帐目造假为例 如果大卖场的结帐金额跨度从几十块到上万块(两个零到四个零), 那麽一百多/一千多/一万多占比高是符合定律描述的 但一个平价便当店,跨度才从五十块到几百块(一个零到两个零) 那麽5678开头的结帐单比1开头的多也不是什麽奇怪事 另一种情形是数据的产出本身就有刻意控制范围 假设一开始为了平均投票所负担而故意让各票所间的选民数在一定范围内 那麽看首数很显然的也没有太大意义 ~~ 回到选举造假的问题, 从维基百科附的新闻连结来看,当初抓舞弊的不是首数而是末两位数 (虽然我不确定看尾数还算不算班佛定律,人家是看首数,不过不管啦...) 此时理论上就是全随机了 几千几百几十「七」和几万几千几百几十「三」的机率应该都是10% 几千几百「八十九」和几万几千几百「六十四」的机率也应该都是1% 但,人类在乱掰数字时很常不小心有偏好 在伊朗的某场选举之中,一百多个数据里7结尾的票所有17%,5结尾的只有4% (相较之下美国每次投票看尾数,都不会有14%以上或6%以下的特定尾数) 统计上出现这麽大偏差的机率只有4% 另一个检查方式是看末两位是否相邻(37/29算不相邻,21/22/23算有相邻) 人类乱掰两位数也很容易有偏好,理论值是七成不相邻 但上面那场伊朗选举只有62%,看起来大概也是掰出来的可能性比较大 综上两点,任何一场正常选举产出上面那个结果的可能性只有 1/200 加上当选人在反对派强势地区的票数也高的不合理 大概就是有造假无误了 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.136.190.152 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/ask-why/M.1636474062.A.5FC.html
1F:→ su31tak: 啊,回到标题,3000这个数在wiki上面被打citation needed 11/10 00:08
2F:→ su31tak: 也没查到三千哪来的就是了 11/10 00:08
3F:→ xiaoa: 你们是在鸡同鸭讲吗?我看他都误解自己的问题了,你还指点 11/12 20:06
4F:→ xiaoa: 得津津有味 11/12 20:06
5F:→ souldragon: 楼上 误解的是你吧 乱入王 11/12 22:46
6F:→ souldragon: 这理论完全没解释 "样本数下限" 和 "数据范围得多大" 11/12 22:55
7F:→ souldragon: 3000这数字你知道怎麽来的?说得自己好像很懂 秀一下 11/12 22:56
8F:→ xiaoa: 概率性的统计,通常会希望positive result和negative resul 11/13 14:35
9F:→ xiaoa: t都发生最少7~8次,统计的信赖区间才会够小。但是够小本身 11/13 14:35
10F:→ xiaoa: 就是个模糊概念,有些人做出只有4~5次,他也照样可以发pape 11/13 14:35
11F:→ xiaoa: r。只不过信赖区间比较大、统计的准确性比较低,paper的威 11/13 14:35
12F:→ xiaoa: 信度也就比较低。举例来说,投硬币就要头花各出现7~8次, 11/13 14:35
13F:→ xiaoa: 那麽大约就需要投20次,或最少需要投15次。要降低次数,扩 11/13 14:35
14F:→ xiaoa: 大信赖区间、降低数据的可靠性,只丢10次也可以。如果是万 11/13 14:35
15F:→ xiaoa: 分之一发生的概率,那就需要做7~8万次左右的抽样。班佛定 11/13 14:35
16F:→ xiaoa: 律比较复杂,它不是二元的概率分布,但将之简化成1和非1, 11/13 14:35
17F:→ xiaoa: 也是可以。那麽概率就是大约3成。大概数据只要25~30笔就差 11/13 14:35
18F:→ xiaoa: 不多了。我昨天随便Google了一下,也就说需要50笔左右。也 11/13 14:35
19F:→ xiaoa: 就两倍於我的推论。後来我想了想如果把2、3也考虑进去,要 11/13 14:35
20F:→ xiaoa: 求抽样50确实就合理(抽样出123的概率,才能看出班佛定律的 11/13 14:36
21F:→ xiaoa: 趋势嘛)。至於跨度,配合pansci那篇文章里有一张取了log後 11/13 14:36
22F:→ xiaoa: ,粉红色区间宽度都变得一样的图,会比较好理解。它就表现 11/13 14:36
23F:→ xiaoa: 出1和非1的数据分布跨度,而且是标准化的(每个颜色间隔都固 11/13 14:36
24F:→ xiaoa: 定)。我现在想不到对应的数学理论或模型。但是同样用概率 11/13 14:36
25F:→ xiaoa: 来说,我们从前面0开始,走到数据的後段x,会经历过多少次< 11/13 14:36
26F:→ xiaoa: 1>的区间。假设同样要求经过<1>的次数也是7~8次。那麽就是 11/13 14:36
27F:→ xiaoa: 从0到8。那就是10^0到10^8这样的跨度。好像有点大,可能10^ 11/13 14:36
28F:→ xiaoa: 0到10^5就差不多了。总之,我只是用最简单的概率模型2项分 11/13 14:36
29F:→ xiaoa: 布硬套在班佛定律身上推算的,肯定不准确,但是其中的数学 11/13 14:36
30F:→ xiaoa: 逻辑是比较接近的,所以推算的结果不会差得太远。如果你深 11/13 14:36
31F:→ xiaoa: 入研究有关班佛定律的数学模型,肯定可以算出指定的信赖区 11/13 14:36
32F:→ xiaoa: 间、统计检定范围内,需要的样本数和数据跨度是多少。 11/13 14:36
33F:→ xiaoa: 简单了说吧,最最最简陋的统计要求要3笔数据,才能定算出 11/13 14:52
34F:→ xiaoa: 有意义的平均值。为什麽要3笔,背後的逻辑就是要算出平均 11/13 14:53
35F:→ xiaoa: 值。那麽,要做出统计检定p数值接近0.05需要多少样本?p=0. 11/13 14:53
36F:→ xiaoa: 005又是多少样本。这需要把统计模型丢进另一个统计模型去 11/13 14:53
37F:→ xiaoa: 推算。而这,已经有人做过了。所以他会告诉你,大约多少个 11/13 14:53
38F:→ xiaoa: 样本数,你大概率(95%? 99.5%? 99.95%?)可以得到p<=0.05或0 11/13 14:53
39F:→ xiaoa: .005或0.0005。这就是其背後的逻辑。样本跨度也可以有自己 11/13 14:53
40F:→ xiaoa: 的模型,同样是大概率(95%? 99.5%?),让数据体现出其自然 11/13 14:53
41F:→ xiaoa: 的样貌。 11/13 14:53
42F:→ xiaoa: 还有你的臭嘴,最好给我道歉 11/13 14:53







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Soft_Job站内搜寻

TOP