作者Manstein (exposure)
看板Dodgers
标题Re: [情报] 洋基的开书考
时间Tue Oct 3 02:56:57 2023
我在 MLB 版 po 出了美国乡民答案,2700 多人的答案,
有空可以去看看。
首先以下当然是我个人的答案,不包对,又不是补教协会。
这份考卷大概是第一关拿来大量筛掉不适的应徵者用的,
我想应该不用全对才能进到面试下一关,但是起码也得对
个九成五就是了。不过也不用太过紧张,很多题前面都加注
「若没有其他资讯」,也就是说你不用自行脑补各种状况,
沙盘推演,只要就题面作答就好了。
就题目来说,这很显然是要考你对棒球数据分析的基本认知
题目大概就几个观念:
1)基本的数据推论 -- 大样本,长期的数据结论要比短期,
小样本的数据解释能力强,信赖区间低。除非:
a.两组数据结论并无二致
b.或者所使用的数据已经经过检验为无用的。
2) 包括上面 b 项,这份试题是在测验你的知识程度,要
了解你对棒球数据分析从 Bill James 以降大概到本世纪
第一个十年间所做出的结论,这些结论大概都是已经翻过来
倒过去经过无数检验,因此可信度都是没有问题的。
3) 最後当然还是要测验你对进阶棒球数据定义的熟稔度,
不然上班来开会铁定鸡同鸭讲。
(萝卜汁: 拜托,你一份问卷连一题考左右病的都没有,
怪不得你洋基连季後赛都进不去)
棒球数据分析的结论很多是反直觉的,这也是当然的,人
类天生就爱好直观、简单的解释,这跟演化有关,从已知
用火拜自然神到现在是没有什麽变化。
※ 引述《Manstein (exposure)》之铭言:
: ※ [本文转录自 Baseball 看板 #1b6TNVsO ]
: 作者: Manstein (exposure) 看板: Baseball
: 标题: [情报] 洋基的开书考
: 时间: Mon Oct 2 04:26:04 2023
: 美国有位乡民去年去应徵各球团的工作(初阶工作),据他表示
: 没有人理他。但是洋基倒是回了他电子邮件,并附上网址表示
: 请先做答然後回传,他做完以後回传然後想当然耳没有再听到
: 回音,事隔一年,他把这个试题网址 po 出来给美国乡民评价
: 一下到底洋基垫底是不是因为高层的脑袋都糨糊,从试题中可
: 知一二。
: 原网址最後面有附,试题网址现在还有效,不过出题的顺序是
: 随机给的,跟我下面翻译的顺序一定不一样。翻译当然是我翻的,
: 大家将就一下。
: 1.以下哪位球员在到盗垒尝试上(stolen base attempts)
: 是比较有价值的球员?
: 跑者A: 42 SB, 23 CS (注CS=Caught Steal)
: 跑者B: 12 SB, 2 CS
这是考一般结论。一般认为盗垒的成功率必须要有七成五或者
起码七成以上,才会对球队攻击面有所助益。跑者 A 不符,
跑者 B 及格。不放心的话可以用 SBR 去算一下不过这个差太多
了我想就不用了。原本的结论是要用 RE 去推,不过当然不用
搞到那麽麻烦,你只要知道这个结论就可以了。
: 2.若无其他资讯,你会派以下哪位捕手明天先发?(捕手
: 防御率表示该捕手蹲捕时的投手防御率)
: 捕手A: .850 OPS, 4.25 捕手防御率(Catcher ERA)
: 捕手B: .700 OPS, 3.50 捕手防御率
捕手防御率是一个基本上无用的东西,研究的结果是你要嘛
就要看得更细(用相同投手对照),不然就是直接看一下能够
直接观察而且有精密指标的(补逸、挡球、Framing 等等),
夯部啷当通通炒一锅算 CERA 杂讯量太大,没有意义。
FG 上面有一篇文章提过一个经典的研究,假设有 A/B 两捕手,
假设今年他们都仅蹲过本队的三位先发投手,没有其他投手,
两人蹲捕局数相同,三位投手在分别使用 A/B 时防御率都
完全相同,那麽直观的想,两位捕手的 CERA 应该也会完全
一样,对吗?
结果是反直觉的不对,两人 CERA 会不同,而且不是微差,
是颇有不同,这是因为三位投手分配到搭配的局数不同。
这也就是我们在计算死亡率时要进行年龄标准化的原因(
听不懂没关系,反正就是要校正就对了)。
不过有人研究的结论是说,长期(这个是真的长期了)来说,
如果自己跟自己比较的话,捕手的经验值对於提升(应该说
是压低) CERA 的确是有助益,这大概也就是为什麽你可以
看到几个老捕手老的连球棒都拿不动了都还是照蹲不误。
: 3.若无其他资讯,你会比较想要以下哪位打者来你的球队?
: 打者A: .240/.280/.550
: 打者B: .260/.420/.410
: 打者C: .320/.350/.480
我们这种身经百战的台湾人一眼就可以看出来出题者玩的花招,
他把三个打者 OPS 都调到一样。这个也是考基本观念,如果
没有其他资讯,打者三围哪一项最重要?结论当然是 OBP,这
可是远古从豆爷时代就发展出来的概念。
: 4.下面哪位投手你比较喜好来你的球队?
: 投手A:每次都投 4.2 局无失分
: 投手B: 每次都投 6.0 局失两分
这个是要考你会不会误入传统数据的窠臼当中,投 B 每场都
获得 QS,但连传统派都不会太在意,因为 QS 是一个武断
(Arbitrary)的门槛式数据,这种数据的解释力很低,可以略过。
投 A 是防御率为零的投手!
: 5.以下何者为影响 wOBA 但不影响 xwOBA
: a.接触(击球)品质(Quality of contact)
: b.比赛水平(Quality of competition)
: c.面对击球之防守(Defense on batted balls)
: d.打席的杠杆/影响力(Leverage of plate appearance)
这题基本上就是考定义,xwOBA 就是拿来消除防守水准差异
(当然还有其他)用的,写太快可能会误选 A,xwOBA 就是
拿来看击球品质的,当然影响。
: 6.下面哪位投手你比较喜好来你的球队?
: 投手A: 3.50 FIP, 65 QS%
: 投手B: 4.50 FIP, 100 QS %
同样的概念。如果只有 FIP 和 QS,应使用 FIP。
: 7.是或否: 开局投手(opener) 用几场还行,但是一年用
: 40-50 场的话这种策略是行不通的。
Why not? 这题就是要考你是否会受到传统观念的束缚,
没人有做过不代表不应该做或者做了会失败。
: 8.A 队与 B 队目前队上都有一位 2-WAR 的三垒手,他们
: 都有机会用一年 15M 的薪水签下一位 5-WAR 的三垒手。
: A 队目前明年预估可以赢 70 场,B 队可赢 88 场。在
: 无其他资讯的状况下,哪支球队会得利於这位三垒手较多?
: a. A队
: b. B队
: c.两队一样多
5-2=3,这很容易,基本上是在考 WAR 的定义。我知道有人
会辩解说 88 胜雇人进季後赛的胜算较高,同学,题目没有
提的,请不要自行脑洞。
: 9.若无其他资讯,以下哪位打者你会让他先发今天的比赛?
: a.本季.240/305/475 (414打席)对战本日投手 13-18 4HR
: b.本季.305/325/375 (389打席)对战本日投手 5-20 2HR
: c.本季.225/520/550 (403打席)对战本日投手 1-15 7K
这题也是很容易的,全季的 OPS 胜过任何小样本,我知道
很多人看到 13-18 4HR 就高潮啦,这也是无可厚非啦,但是
这 OPS 差了几乎两百点,这出题就是要告诉你这没什麽好比的。
: 10.是或否 AVG with RISP (译:跑者在得分位置时的打击率)
: 是测量打者天分的好指标因为好打者总有办法打回分数。
你下次再听到有人重复这种大悲咒的时候麻烦套个紧箍咒到他头上。
: 11.打者三围中,下列何者对他的进攻价值最重要?
: a.打击率
: b.上垒率
: c.长打率
同样概念。OBP 为先。
: 12.以下何者会造成球员的 xwOBA 高於他的 wOBA
: a.打出好些强劲的出局球
: b.打出好些软弱的一垒安打
: c.击球分布在整个球场(spraying the ball to all parts of the field)
: d.对联盟平均来说面对相对较弱的对手
: e.打出好些灌水全垒打,在其他球场都会被接杀
同样,进阶数据定义与概念。强劲出局求正常或者大概率会形成安打,这人
运气略嫌不好,xwOBA 会还他公道。
: 13.评估一名 2A 球员时,下面哪一项数据最重要
: a.防御率
: b.胜败纪录
: c.K/BB (三振/四坏)
你要是有朋友选 B 请你跟他绝交。K/BB 是常用数据。
: 14.你的先发投手本季 FIP 为 3.20。今天这场比赛他已经面对了
: 18 人次,五局没有失分,而今天比赛是非赢不可。他今天已经投了
: 71 球,而你在牛棚里面有休息充足的五个牛棚投手 FIP 在 3.20
: 到 3.40 之间,而场上目前比数为 1 比 0 领先,如果没有其他资讯
: ,第六局你会怎麽做?
: a.不换投
: b.换投
这是 Snell 案例。这题比较不直观,这时我们就要用台湾人身经百战
的考场小智慧来解题。他先讲先发 FIP 3.2,又讲五个牛 FIP 都再
3.2-3.4 间,他是在告诉你这样的资讯 -- 这六名投手水准差不多,
所以答案不在这些投手之间的水准差异。
那其他还有什麽资讯? 他已经丢了 71 球,而且他已经丢了 18 人次,
这是很明显地暗示,因为 18 人次就两轮,换句话说六局上来就是新
一轮一棒打起。研究显示在没有其他资讯的状况下,投手第三轮的压制
力都会开始下降。因此,换投是正确的。
我知道一定有很多人 argue 啊但是牛上来放火了啊(更别提帮本队获得冠
军了),Well 话不能这样讲,这玩意儿跟指数型投资一样,你要每天搞
今日老师特选股,长期下来,你的绩效几乎可以确定是落後的。你要怪
就怪之前没烧香....吧?
: 15.以下何数据对於评估救援投手来说最有用?
: a.K%
: b.K/9
: c.LOB%
两个 K 数据容易混淆,这也是定义问题,想清楚了就明白。K/9 高的
投手 BB/9 H/9 不一定低,但 K% 越高表示投手直接拿到出局数的机率
越高(与其交给神秘的 BABIP 大神)
: 16.是或否: 球队必须在强力打者和接触型打者(contact hitters)
: 中取得平衡以赢得世界大赛。
同样的,考你是否会陷入传统派思维?
: 17.若无其他资讯,在必赢不可的第九局你会派哪位打者上来?
: a. .750 OPS .350 avg w/RISP (皆本季,起码 500 打席)
: b. .800 OPS .250 avg w/RISP (同上)
两数据样本一大一小,一可靠一运气多,选择是很明显的。
: 18.没有其他资讯的话,你会想要以下哪位打者?
: a. .300/.450/.600
: b. .000/1.000/.000
这大概是最能代表豆爷不死的考题了。
: 19.下列何种战术状况下三垒有人打带跑是聪明的决策?
: a.无人出局
: b.一人出局
这个详细也是要去用 RE 算,但是你只知道结论那也无妨,
答案是 b。简单的来说,a 状况下下打跑你会让本局的得分
期望值(超过一分的期望值)大幅下降,因此亏本。
: 20.下述打击数据中何者最稳当(robust) (全面的价值考量)
: (i.e., value-driven all-encompassing)?
: a.wOBA
: b.wRC+
: c.OPS
: d.TB
: e.OBP
这就是考你对数据如何产生以及定义了。robust 这个字虽然
有稍微念过学术的人都知道而且大概很常用,但是中文很不好
翻。答案自然是 wRC+,三围一并考量而且加上校正。
: 21.没有其他资讯状况下,下面哪位球员你会先发明天必胜
: 不可的比赛?
: A球员: 850 OPS, 最近 35 打席 2 安打
: B球员: 800 OPS, 最近 35 打席 13 安打
同样的问题,这跟 17 题是一样的。
: 22.没有其他资讯下,你明年会请哪位球员加入球队?
: A投手: 60IP, 90K, 10BB, 3.00ERA, 0SV, 5BS
: B投手: 60IP, 60K, 30BB, 2.50ERA, 20SV, 0BS
: C投手: 60IP, 90K, 40BB, 2.75ERA, 50SV, 5BS
你简单算一下防御率和 K/BB 就知道总和来说 A 投手是最好的,
SV/BS 都是解释力奇低的数据。
: 23.以下哪一项数据可以清楚显示某打者的 .350 打击率是
: 该校正回归了?
: OPS
: OPS+
: wOBA
: BABIP
: OPB
: SLG
这大概是数据派最早的反直觉结论了。答案给 D。
: 24.没有其他资讯下,哪位球员你会先发世界大赛第七战?
: A投手:2.50 FIP (例行赛200IP), 5.50 FIP (季後赛 20 IP)
: B投手:4.50 FIP (例行赛200IP), 1.50 FIP (季後赛 20 IP)
你要相信两百 ip 的结论还是 20 ip 的结论,我知道很多人要
argue 什麽疲劳啊近况啊受伤啊,题目就已经说了,没有其他
资讯,不要再牵拖了。
: 25.下面各数据中何者最稳当(robust) (全面的价值评量
: (i.e., value-driven all-encompassing)?
: WHIP
: FIP
: ERA
: QS%
: LOB%
虽然 FIP 也不是完美(事实上是离完美差很多),但是都比其他
的要高明。
: 26.是或否 一支顶尖救援投手对一只已经有其他五个顶尖
: 救援投手的球队比较没有价值,他对另一只天分相同但仅有
: 一支顶尖救援投手的球队比较有价值(假设两支球队都用
: 五人轮值每人平均每场都投五局)
: 是:因为第一支球队没有那麽多高杠杆/关键局数分给救援
: 投手
: 否:顶尖牛棚永远不嫌多,而且第一支球队可能会有伤兵。
这题基本上考一个观念,situational 的资讯除了特例或者少数
状况以外,几乎没有任何解释力或者价值,高杠杆局数/情势
的出现是一种贝式的产物,你很难「事先安排」答案选否。
不过这题萝卜汁铁定不会答错「啊本队不是永远都是牛不够多....」
不过如果他是问这样一个五头牛和一个同样 2WAR 的野手的
话,那麽你就要思考一下了,答案要选野手。因为防守有最低
值为零,但进攻没有最大值。
: 27.无其他资讯下,五战三胜的季後赛你比较想对到谁?
: A. 例行赛 98-64,例行赛对战本队 1 胜 5 败
: B. 例行赛 92-70,例行赛对战本队 6 胜 0 败
98 vs 92 胜这种差距太小,没有解释力(区间实力的差别
很容易就可以让结果扭曲,当然现在赛程重排好多了),
你不放心的话还可以上网找个 two-proportional test
calculator 简单算一下。大数字没有用自然是用小的,
而且对战成绩你真的乱做用无母数的话还会得到显着....
: 28.一位 23 岁的新秀投手在 5 场大联盟等级先发中缴出
: ERA 1.50 的成绩,没有其他资讯下,你认为该投手明年
: 大联盟最有可能的成绩会
: 是?
: 1.00 ERA
: 1.50 ERA
: 2.00 ERA
: 2.50 ERA
: 2.75 ERA
: 3.00 ERA
5 场球是没有什麽解释能力的(当然这个门槛在那里很难说,
但他当然也不会考你这个,反正 5 场显然过小),他明年的
成绩「在没有其他资讯下」(很重要我们再说三次)自然最
可能的落点自然是联盟平均,联盟平均是多少?不知道没关系,
反正一定超过 3,选 3.00 就对了。
: 29.你认为球员逃脱权(opt-out)对球员有利,还是对球队有利,
: 还是双方都有利?
: A. 对球员有利
: B. 对球队有利
: C. 双方都有利
当然是对球员有利,不然为什麽要有 team-option, 还有 dual-option?
: 原文:
: https://www.reddit.com/r/baseball/comments/16w6hy6/
: i_applied_for_a_baseball_operations_job_with_the/
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 47.151.240.39 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Dodgers/M.1696273019.A.FDD.html
1F:→ pokey: 太强了@@...很多都不会XD 10/03 08:34
2F:推 mangojocker: 这次流出的试题真的很有趣 可以研究一阵子 10/03 11:57
3F:推 Nikagnef: 有趣 感谢分享 10/03 23:09
4F:推 joua101: 推个 10/04 20:19
5F:推 skmonkey: 推 10/04 20:52