作者genie2 (新挑战)
标题Hello Kitty 磁铁收集的数学
时间Fri Nov 4 11:11:56 2005
※ [本文转录自 genie2 信箱]
(这是游森棚教授在 "二00五年台湾资讯科技、数学科普、娱乐数学融入数学教学研讨
会"数学科普单元的演讲稿, 於台湾省教师研习中心.
原文可看
http://umath.nuk.edu.tw/~senpengeu/2005_Kitty.pdf )
Hello Kitty 磁铁蒐集是前阵子的全民热, 不论以行销学, 以社会学, 以心理学的角度来
看, 都值得探讨. 但是其实这其中有很多有趣的数学呢! 而数学的立论基础是最结实的.
这篇短文我们来谈谈 Hello Kitty 中的数学.
一. 蒐集一整套
Hello-Kitty 磁铁按照年代一共有 31 张, 後来追加 3 张隐藏版, 最後又出现一个
Hello Kitty 游台湾 7 张, 所以全套一共是 41 张. 只要消费 77 元就可以得到一张磁
铁. 但是拆开之前不知道这一次拿到的是否已经有了, 为了蒐集一整套各不相同的磁铁
, 就要不断的消费. 相当多的商品采取这样的行销策略, 比如扭蛋, 魔法牌,口袋怪兽卡
片.
大家最关心的是, 到底要花多少元可以蒐集到全套?
当然, 在运气极端好的状况之下, 只要买 41 次就可以蒐集到全套, 虽然这显然是很不可
能的事. 在运气极端背的状况之下, 买 100000 次也蒐集不到全套, 这看来也是很不可能
的事. (在其他商品有可能会发生. 比如 "青眼白龙", 或 "被封印的黑暗大法师"...).
因此我们要先相信厂商, 假设 7-11 制造每一种磁铁的数量都一样, 然後所有这些磁铁很
随机地散布在全省各个角落. 意思是说, 每一次拿到不同磁铁的机率是一样的. 我们假设
一套有 n 个.
因此我们问, 平均 要花多少钱可以蒐集到全套?
令 X 为蒐集到一套时所要买的次数. 我们要算 X 的期望值 E(X) (期望值 就是 平均).
每买一次, 如果拿到的是之前没有的磁铁, 我们就说这次的购买"成功". 因此成功了 n
次就是已经蒐集了一套了.
令 X_i 表示从第 i 次成功之後, 一直到第 i+1 次成功时所要购买的次数. 比如说, X_5
表示从已经有五个不同的磁铁开始算起, 直到拿到第六个不同的磁铁时一共要买的次数.
显然, 蒐集一套要买多少次=蒐集到第一个要买多少次+蒐集到第二个要买多少次+... +蒐
集到最後一个要买多少次, 就是说 X=X_0+X_1+X_2+...+X_{n-1}.
我们要求 E(X). 但 E(X) 是线性的(即, 加减可以拆开), 因此
E(X)=E(X_0)+E(X_1)+E(X_2)+... +E(X_{n-1}),
(这个式子意思是说, 平均蒐集一套要买多少次= 平均蒐集到第一个要买多少次 +
平均蒐集到第二个要买多少次 + ... +平均蒐集到最後一个要买多少次).
所以只要把每一个 E(X_i) 算出来再相加就可以. 用例子来说明. 比如要算 E(X_5): 此
时手上有 5 个不同的了,要算平均要买多少次可以拿到第 6 个. 这样想: 因为每一个磁
铁出现的机率是相同的, 因此每次有 5/n 的机率会拿到旧的, (n-5)/n 的机率会拿到新
的. 换句话说, 买 n 次, 平均可以拿到 5 的旧的, n-5 个新的. 再换句话说, 每买 1
次, 平均可以拿到 (n-5)/n 个新的. 再换句话说, 每拿到 1 个新的平均要买 n/(n-5)
次. 因此 E(X_5)=n/(n-5). 同理, E(X_i)=n/(n-i).
因此 E(X) = E(X_0)+E(X_1)+E(X_2)+...+E(X_{n-1}) = n(1+1/2+1/3+...+1/n) . 所以
我们算出来, 如果一套有 n 个, 在每个磁铁出现的机率都相同的条件下, 平均我们要购
买 n(1+1/2+1/3+...+1/n) 次可以蒐集到整套. 这是有趣的结果呢!
二. 分析
我们到底算出什麽? 现在来分析一下. 已经知道在运气最好的情形下, 蒐集一套 41 个
Hello Kitty 要花掉 77*41= 3157 元. 但是我们刚刚算出, 平均 要花
77* 41(1+1/2+1/3+...+1/41) 元才能蒐集到一套. 这到底是多少? 利用 Maple 软体打
入 77 *evalf(41*sum('1/k', 'k'=1..41)) 得到 13584.36. 这是说, 平均要花 13584
元才能蒐集到一套!!
假设全台湾有 50000 个人在蒐集 Hello Kitty, 平均一共消费 50000*13584
=679,200,000 元, 六亿七千九百万. 因此报纸上说 "Hello Kitty 带来十亿商机" 绝非
夸张之词. 现在我们有数学的佐证了, 可以看到不管当初是误打误撞或是精心设计, 这个
企画实在是太聪明了. (事实上,根据媒体报导, 短短三个月内一共送出了四千万个磁铁.
老师们可以算算看消费额是多少.)
我们不一定要用 Maple 来算. 大一微积分里有一个重要的定理, H_n ~ln n.因此利用对
数表是可以估计的.
三. 明智? 不明智?
因为 7-11 总公司给各分店的磁铁是 500 个包装成一包, 理论上里面会有完整的一整套
500 个全买要 500*77= 38500 元. 因此前阵子有媒体这样报导: "这位消费者为了确
保自己能凑到全套完整版的 Hello Kitty 磁铁,经过仔细精算後,一口气花下 38500 元
买酒及高单价预购商品,就能买到一整盒里面共有 500 枚的 Hello Kitty 磁铁. Hello
Kitty 果然能令人为她疯狂!"
你觉得呢? 我们来想一想. 既然平均花 13584 元能蒐集到一套, 那这位消费者花了
38500 是非常不智的. 但是真的是这样吗? 我们只是算出 "平均" 花 13584 元能蒐集
到一套, 但是这位消费者 ``保证" 可以蒐集到一套. 万一我们运气非常背呢?
因此除了算购买次数 X 的平均 , 我们还要算标准差. 高等数学上我们通常算标准差的平
方, 称为变异数, 记号是 Var(X). 变异数也是线性的, 所以
Var(X)=sigma{i=0~n-1}Var(X_i). 令 p_i:=(n-i)/n 为做 X_i 时成功的机率. 利用变
异数的定义 Var(X):=E(X^2)-E(X)^2 可得 Var(X_i)= (1-p_i)/(p_i)^2 经过一番计算後
可得 Var(X) = n^2 * sigma{i=1~n}(1/n^2)-nH_n
当 n=41 时, 用 Maple 算出 Var(X)=2548.2, 因此标准差是 根号{Var(X)}=50.48. 根据
50-68-95 法则, 往上两个标准差, 右端剩下的只有 <2.5% 没有涵盖.意思是: 虽然原来
平均买 176 次可以蒐集到一套, 可是如果没蒐集到, 再多买 101 次, 都还蒐集不到一
套的机率 <2.5%.而多买的这 101 次要花掉 77*101=7777 元, 连同一开始的平均花
13584 元, 总共也才 21361 元. 这已经是很倒楣的情况了. 如果运气坏到还蒐集不到一
套, 再往上买一个标准差, 这时候是 50-68-95-99.7, 表示花了 21361+ 77*50.5=25250
元, 有 >99.8% 的机会可以蒐集到一套.
如果还蒐集不到, 那... 不是运气太差, 是运气太好, 应该去买乐透. 所以呢, 那位花了
38500 元的先生/小姐绝对没有'仔细精算',以数学的观点来看, 他至少浪费了一万多元.
四. 难以蒐集的磁铁
如果我是厂商, 我大概会让某些磁铁出现的机率少一点. (这就是集五个字送轿车的原理,
第五个字怎麽都集不到).现在假设有 n 种不同的磁铁, 第 i 种出现的机率是 p_i. 那
我们求 E(X),即平均要买多少次可以蒐集到一套?
我们已经从高中数学跨到高等数学了. 这是在机率论上一个非常有名的问题, 称为 The
coupon collecting problem.任何一本大学机率论的课本里都可以找到. 当然, 标准差也
是可以算的, 在此节省篇幅从略.
五. 最新发展
理论上, 上面已经解决了所有的问题, 但是数学家之所以有趣就是永远好奇, 永远可以挖
出一些新想法.
多出来的给别人, 这是正常的人性. 所以有数学家问了一个非常有趣的问题: 如果家里有
两个小孩,哥哥每次有重复的磁铁就顺手给弟弟 (从头到尾只有哥哥购买), 请问, 当哥哥
已经蒐集到一套时, 弟弟平均还缺多少个不同的磁铁?比如 Hello Kitty, 在看下去之前
, 你能估计一下当哥哥蒐集到一套的那一刻, 弟弟还缺多少张不同的磁铁? 十张? 十五张
?
答案非常漂亮: 假设有 n 种不同的磁铁, 则在哥哥蒐集到一套的那一刻, 弟弟还缺
1+1/2+1/3+...+1/n张! 数学内在的美丽真是不可思议的. n=41 时这个结果是 4.3, 就
是说, 平均只差不到五张就已经可以集到第二套了! 这实在相当违反直觉.
数学家把问题再一般化, 现在假设有 n 种不同的磁铁, 第 i 种出现的机率是 p_i, 而且
家里有 k 个小孩, 规则同上:只有老大一直买磁铁, 一有重复的就给老二, 而老二一有重
复的就给老三, 如此下去. 则在老大蒐集到一套的那一刻, 其他兄弟各缺多少张?
我们已经跨入数学研究的前线, 这个问题称为 Collector's brotherhood problem, 一直
到 2001 年才由 数学家 Foata, Han, Lass, Zeilberger 等人解决! 有兴趣的老师可以
参考他们的论文 [1,2]
再接下去呢? 我想我会考虑一下如何让某些磁铁出现的机率小一点又不会小到让消费者绝
望, 这应该牵涉到一点赛局理论了.
六. 後记: 数学科普
数学科普是非常不容易的, 因为如果(作者/读者)不花时间去(解释/了解)数学的符号和论
证, 就只剩下 "讲故事". 而讲故事可能就丧失了数学之所以是数学, 以及数学之所以迷
人的最大原因: 理解并欣赏藉由数学独特的语言(符号)来探索论证的过程, 以及发展理论
的美丽. 如果大家能从这篇短文中体会到 ``大学数学" 距离日常的教学并不会那麽遥远,
而且体会到数学之美, 那 Hello Kitty 就更可爱了.
[1] D.Foata, G-N.Han and B.Lass, Les nombres hyperharmoniques et la fratrie
du collectionneur de vignettes, Seminaire Lotharingien de Combinatoire B47a
(2001), 20 pp.
[2] D.Foata, D.Zeilberger, The Collector's Brotherhood Problem Using the
Newman-Shepp Symbolic Method, Algebra Universalis 49 (2003), 387-395.
--
※ 发信站: 批踢踢兔(ptt2.cc)
◆ From: 59.104.30.34
--
※ 发信站: 批踢踢兔(ptt2.cc)
◆ From: 218.166.32.114
1F:→ genie2:这篇很酷,如果我在大学教机率我期末考就出这个推 10/30 02:38
2F:→ genie2:还有那个 variance 的估计有点问题,那个数值是假设推 10/30 02:38
3F:→ genie2:X_i 是 normal distribution 算出来的,但问题它明明不是推 10/30 02:39
4F:→ genie2:借我转一下推 10/30 02:39
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 128.125.124.207
※ 编辑: genie2 来自: 128.125.124.207 (11/04 11:12)
5F:→ genie2:这篇是我从朋友的板看来的,蛮有趣的 11/04 11:12
6F:→ genie2:要是我在大学教机率就出这题 11/04 11:12
7F:→ genie2:大家觉得那个variance的地方有没有问题?我觉得不能用 11/04 11:15
8F:→ genie2:一个标准差下面有多少这个来估计……那个明明就是normal 11/04 11:16
9F:→ genie2:distribution才有,而且这里只有一个random variable 11/04 11:16
10F:→ genie2:大数法则也用不上 11/04 11:17
11F:推 ISSC:应该是central limit theorem 12/01 13:44
13F:→ ISSC:X1,X2,...Xn independent, n够大则和就会长得像normal 12/01 13:46