作者sandra80032 (频语儿)
看板NobuOnline
标题Re: [嘴炮]关於沉默二三事
时间Sun Oct 26 18:07:17 2008
回应这篇,我只是想对「命中率试验」来做个回应。
因为推文里说不清楚,所以另发一篇。其实这篇跟沉默本身没什麽关系 XD
※ 引述《Hughgland (阿修修)》之铭言:
: 因为我自己没去做实验,所以用【嘴炮】当标题,以下内容不是绝对,欢迎大家分享经验
: 和指正。
: 【沉默】<<<<<目前能确定的是和智力相关,但相关程度多少,以及是否有其它能力影响,
: 一直都众说纷纭。
: 这里先提供朋友药师(A)某次和武士(B)的试装结果。
: (因为是听闻,确切数据可能有误差,请大家参考一下)
: A的能力:1.智41X 2.智5XX
: B的能力:智40X魅40X
: 据说A的魅力不管哪种装都差B约20。
: 结果=>1.被沉默率约7成 2.被沉默率不到5成
: 虽然到底测试几次不清楚,但这结果其实能够说明的不只是真的沉默与智力是正相关,
: 更重要的应该是:【沉默】是种机率性技能,不管怎样都不太可能有所谓必中或必不中。
: 於是乎【沉默】有智力适性值或是不用把智力撑太高的说法(?)
有牵涉到「命中率」相关的东西,实测上比较辛苦。
并不是说无法测试,
而是要取样的次数相当多,你才能证明智41X跟智5XX有「显着差异」。
取样次数的多寡相当相当重要,
所以做实验的人要相当的有耐心 XD
(先说,我对愿意做这测试的人是很有敬意的,不是恶意想批判 >"<)
因为我们不知道这个实验的人到底实验几次,那我们就假设20次、50次来看看!
1.假设各做20次:
智410:沉中10次(五成)
智500:沉中14次(七成)
然後有人下结论说「智410跟智500使用沉默的命中率有显着差异!」
→这个结论的可信度只有0.8
2.假设各做50次
智410:沉中25次(五成)
智500:沉中35次(七成)
然後有人下结论说「智410跟智500使用沉默的命中率有显着差异!」
→这个结论的可信度有0.959
习惯上,结论的可信度要高达0.95才能算是有说服力的实验。
也就是说大概要各做50次(两组共100次),才算是有说服力。
不过玩个游戏而已,也许不用那麽严谨,
大概取35次(两组共70次)就OK了,35次的可信度是0.91。
(至於可信度是怎麽计算的我就略过不写了,
欲知详情,请翻你的统计学课本,假说检定^_<)
如果原文中的那位武士,是各做超过35次以上的实验,然後得到5成、7成这个结果的话,
那我会相信智410跟智500真的有差 XD
不过请注意,以上的检定只是检定「智410跟智500使用沉默有无显着差异」
只是证明有差,可是还是不能证明差多少喔! (绝对不是7成-5成=2成喔 XD)
如果想证明智410跟智500的沉默率有差1成的话,大概各要实验1~200次左右吧!
(也就是武士一共要沉200~400次)
所以有关命中率的技能很少人实测就是这样,
想要做到高可信度,实验次数用"百次"来做单位的,费时又费力。
取样次数不足,实验结果就很容易被大家怀疑。
很少人想做这种吃力又不讨好的事情 XD
-------
我之前有个大计画,想作工匠灵巧装VS非工匠灵巧装,生产上的差异。
因为工匠装从破天时代就有了,
可是确切效果却到现在都还没有个定论。
我是争霸才回锅的,想爬文找有关工匠装的文章,
结果资料却少得可怜,而且一切都只是大家的猜测,没有人正式实验过 >"<
所以想自己实验看看...
不过想归想,一想到要先花大把银子把我的工匠装搞好就...Orz
嗯...等我以後有闲再说、有钱再说 (远目)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.182.183
1F:推 mimi9126:测半天,哪天工程师心血来潮改一个位元就全报废了= =a 10/26 18:10
2F:→ sandra80032:还是有用啊 先测数据放起来 等哪天大家怀疑机率被改 10/26 18:12
3F:→ sandra80032:就再测一次 然後就可以PO [黑特] 死闇荣偷改机率! 10/26 18:12
4F:→ sandra80032:要不然很多人常常怀疑某某机率被改 PO文上巴X说被改了 10/26 18:14
5F:→ sandra80032:下面的回文就是"你运气不好啦"vs"真的耶有被改"loop 10/26 18:14
6F:→ sandra80032:结果到底有没有被改没人知道 因为从来就没有人测过 XD 10/26 18:15
7F:→ sandra80032:不过一楼说的也是大家懒得测的原因之一啦 XD 10/26 18:17
8F:推 sunrise2003:测这种机率性的东西 我认为样本数的多寡真的很关键 10/26 22:44
9F:→ sunrise2003:虽然统计上 有30次的样本就会被认为是可信的 10/26 22:44
检定机率的状况比较特别
在统计上,通常要100次以上的大样本才能作分析...
不像平均值,只要实验20~30次就好
所以我才说命中率相关的测试挺麻烦的
我内文中说的50次、35次,其实严格来讲算是不行的
只是因为游戏而已,所以降低标准一点 XD
10F:→ sunrise2003:但是测一千次的结果 就算条件A比条件B多成功50次 10/26 22:45
11F:→ sunrise2003:还是很难让人认为A比B多了5%的成功率吧..... 10/26 22:46
确实是没有办法 就算做一千次 而A条件比B条件多50次
统计上也只能指出他们有"差异"
而不能说出「A条件比B条件多5%」 (这样的结论绝对是错的)
实际上想测出刚好多5%还蛮难的 XD
※ 编辑: sandra80032 来自: 140.113.182.183 (10/26 23:47)
12F:→ Hughgland:题外话,原PO是把沉默和被沉的人看错了吗0.0? 10/27 00:04
13F:→ sandra80032:哦 对 我看错了 XD 我还想说武士智500真神 10/27 00:16