作者LPH66 (信じる力 奇迹起こすこと)
看板Math
标题Re: [机统] 1-100任选n数的平均绝对值差?
时间Wed Mar 11 18:48:00 2020
※ 引述《HeterCompute (异质运算)》之铭言:
: 1-100之中任选n数不重复,将其排序之後,
: 由大到小依序取其差,请问差的平均为何?
: ex:取3数1 55 99,那其差为44 54,平均就是49
: → XII : (100-n)/(n-1) 03/06 09:58
: → XII : 上面笔误,应该是 (100-n)/(n+1)+1=101/(n+1) 03/06 10:00
: → HeterCompute: 可以说一下怎麽思考的吗,和我算的一样,但我是sigm 03/06 10:12
: → HeterCompute: a算很久求的 03/06 10:12
: 推 LPH66 : 考虑 n 红 100-n 白的排列, 红球即为所选 03/06 11:45
: → LPH66 : 所求为平均被红球切开的白球长度 +1 03/06 11:46
: → LPH66 : 一共 100-n 球被切成 n+1 段 03/06 11:46
: → LPH66 : 由此即得此算式 03/06 11:47
: → HeterCompute: 感谢 03/06 12:18
: 推 cutekid : 推 L 大解释。上面的例子,应该是 (44+44)/2=44 03/06 14:45
: → yyc2008 : 看不太懂,可以请L大再详述一下吗?我只知道最大数-最 03/06 16:09
: → yyc2008 : 小数的所有情况的平均,不懂为何可转换为红切白长度 03/06 16:10
: → yyc2008 : 两红球之间的白球数就是一种差 03/06 16:12
: 推 LPH66 : 连续所选两数差 = 对应红球位置差 = 其所夹白球数+1 03/06 17:51
: → LPH66 : 所以每个差就是一段连续白球, 所求是 n-1 段的平均 03/06 17:51
: → LPH66 : 那因为这 n+1 段白球每段都不比别段特别 03/06 17:53
: → LPH66 : 所以这平均就是连续白球长度平均 = (100-n)/(n+1) 03/06 17:53
: → LPH66 : (再 +1 补偿种树问题端点相减与间隔数的差) 03/06 17:54
: 推 yyc2008 : 谢谢LP大,很清楚,我了解了 03/09 01:17
: → ColacoToT : 为何结果会是只跟n有关啊?说来跟ex结果不同了吧? 03/09 15:51
: → HeterCompute: 题目要的是平均,我只是随便举例,当然不同 03/09 19:20
: → ColacoToT : 题目与举例不是只有n未知已知的差别吗? 03/09 21:06
: → HeterCompute: 应该说题目要的是平均的"期望值",这样就没争议了 03/09 22:38
: → ColacoToT : 那还是有个问题,L大的叙述是得n+1段平均吗? 03/10 14:54
: → ColacoToT : 请问为何不是n-1段?n个数的差应该只有n-1个吧? 03/10 14:54
: → HeterCompute: 因为n-1段没办法直接求,但是除了考虑n-1段以外的头 03/10 16:53
: → HeterCompute: 和尾变成n+1段时不失一般性(可以想一下为什麽) 03/10 16:54
我用一点数学语言重述这个做法
令 n+1 个随机变数 X0, X1, ..., Xn 表示选出的 n 个数加上 0, 101 共 n+2 个数
照样排好再做相邻数差依序得到的 n+1 个差
容易知道
(1) X0 + X1 + ... + Xn = 101 这应该没什麽问题
一点题外话是这里直接考虑差就不会碰到用球考虑时的种树问题差 1 的问题了
也就是说, n+1 段白球其实是 X0 - 1, X1 - 1, ..., Xn - 1 个球
白球总数是 100-n 所以除完之後才要再加 1
(2) X0, X1, ..., Xn 这 n+1 个随机变数的分布相同
这即是「每一段都不比别段更特别」的意思
也是上面推文的「考虑 ... n+1 段时不失一般性」的意思
注意到这只是单个随机变数的分布相同而已, 它们之间并不是独立的
证明的提示: 可以尝试证明对固定的 k, 所有 Xi = k 的组合都能一一对应
这一点用球想会比较容易看得出来
从这里容易得到 E(X0) = E(X1) = ... = E(Xn) = 101/(n+1)
而原题要求的是 E(Y), 其中 Y = (X1+X2+...+X{n-1})/(n-1)
那由期望值的线性即知 E(Y) 也会等於 101/(n+1)
所以推文在问除以 n-1 去哪里了, 它在这里, 和 n-1 个相同的值抵消了
====
这个分布其实是可以写出来的:
P(Xi = k) = C(100-k,n-1)/C(100,n)
直接从这里求期望值大概就是原 PO 一开始说的用一堆Σ去算的过程
这样因为要在一堆二项式系数里面算会比较吃力没错
====
至於後来延伸的 n-1 个差的中位数期望值和标准差期望值
这应该就要考虑到这 n+1 个随机变数的联合分布了
不过初看起来似乎并不好求的样子...
--
Ace Snake Santa Clover Junpei June Seven Lotus 9th man cabin kitchen casino
shower operating room laboratory T H E chart captain quarter confinement
torture room steam engine room cargo chapel library study incinerator Gigantic
Q director office security N O N A R Y archives control laboratory
pec treatment garden pantry gaulem bay rec room crew quarters infirmary lounge
elevator Tenmyouji Quark Dio G A M E S Luna Phi Sigma Alice Clover K
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.217.174.68 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1583923683.A.381.html
1F:推 HeterCompute: 感谢解释,後来中位数的期望值我有用计算机帮我硬解 03/11 19:06
2F:→ HeterCompute: 要列出公式解应该不太实际 03/11 19:07
3F:→ HeterCompute: 标准差後来因为我觉得不是常态分布的话,数字算出来 03/11 19:09
4F:→ HeterCompute: 也无法说出什麽意义,我就放弃了,不过感觉应该用 03/11 19:10
5F:→ HeterCompute: sigma硬解也行 03/11 19:10
6F:推 Vulpix : 中位数的公式应该是没救的。不过我想近似值应该还是 03/12 05:09
7F:→ Vulpix : 在 100/n 附近吧。然後平均的期望值那边,虽说是一 03/12 05:11
8F:→ Vulpix : 堆Σ,但其实两层就够,而且满快的。 03/12 05:12
9F:→ Vulpix : C(99,n-1)*1+C(98,n-1)*2+...+C(n-1,n-1)*(101-n) 03/12 05:14
10F:→ Vulpix : = C(100,n)+C(99,n)+...+C(n,n) = C(101,n+1) 03/12 05:15
11F:→ Vulpix : 只用到 C(100,n)+C(99,n)+...+C(n,n) = C(101,n+1) 03/12 05:15
12F:→ Vulpix : 这种公式。 03/12 05:16