作者b1236711 (藍琦)
看板Badminton
標題[分享] 全英熱身賽有用嗎? 打幾場比較好?
時間Fri Feb 27 15:42:15 2026
為了統計全英熱身賽有沒有用, 做了一個數學模型
先把選手的 Elo積分 當作基礎戰鬥力
假設全英前一週的比賽場數 會提供不同的 Buff (若得到負數則是 Debuff)
上週打 1 場 → 戰鬥力 +A
上週打 2 場 → 戰鬥力 +B (從原始 Elo 往上加, 不是先+A 再+B)
上週打 3 場 → 戰鬥力 +C
上週打 4 場 → 戰鬥力 +D
上週打 5 場 → 戰鬥力 +E (打到決賽)
再把歷史數據丟進迴歸模型去 fit 這五個參數 (Logistic Regression)
得到這套戰鬥力調整值後, 最後驗證有沒有比只看 elo 更準 (算 log loss)
[男單]
上週打 1 場相當於 Elo + 82
2 場相當於 Elo +182
3 場相當於 Elo +209 (八強)
4 場相當於 Elo +258 (四強)
5 場相當於 Elo +288 (決賽)
Log loss 0.606→0.573 代表這個指標讓模型變好 5.4%, 已經算顯著差異
這個數據怎麼看?
1. Elo 調整值越來越高
代表鎖定在這種 過年休息→s300熱身→第二週全英的節奏下
「多打找手感」的優勢目前還大於連續出賽的疲勞
2. 如果兩個實力相當的人在全英相遇 (Elo相近)
其中一個人上週休息
另一個人上禮拜去熱身賽打了八強, Elo +209 等於勝率憑空上升到 77%
3. 雖然 4~5場 可能小樣本或倖存者偏差, 但前幾場的趨勢是可以參考的
[女單]
上週打 1 場相當於 Elo +124
2 場相當於 Elo + 78
3 場相當於 Elo + 57 (八強)
4 場相當於 Elo + 33 (四強)
5 場相當於 Elo + 49 (決賽)
Log loss 0.417→0.403 代表這個指標讓模型變好 3.4% 也很高了
這個數據怎麼看?
1. 與男單的情況不同, 女單反而是越早跑越好, 每多打一場都在扣血
一樣拿原本五五開, Elo 接近的兩個人來比
上週一輪遊 vs 上週認真打到四強, 前者直接拿到了 63% 的勝率優勢
2. 可能會注意到 Log loss 比男單低很多, 經過換算
女單的比賽看 Elo 就決定了 66%
男單則差不多只有 55%
3. 打到第五場回升可能是過擬合或 ID 差距
4. 既然提到 ID 差距就順便算一下霸王色霸氣
假如球衣上印的是八大或安洗瑩
站到球場就先 +125 分, 比什麼熱幾場都多...
[結論]
熱身賽要打, 十個數值都是正的, 正多正少而已
--
第一次看到 Elo 的人可參考:
https://zh.wikipedia.org/zh-tw/%E7%AD%89%E7%BA%A7%E5%88%86
取用的是 2018, 2019, 2022, 2023, 2025 五年的數據
(再往前熱身賽變成六輪, 疫情停辦兩年, 2024全英前一週是 s750)
如果有什麼地方解釋得怪怪的或是其他有興趣的指標可以討論看看 0.0
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.161.142 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Badminton/M.1772178137.A.610.html
1F:推 Lavaro : 頗有意思的數據! 02/27 17:44
2F:推 comesome : 覺得不能這樣看 男單很戰國 女單就固定那幾個 02/27 19:45
3F:→ b1236711 : 願聞其詳 (?) 是男單不能還是女單不能 02/27 20:43
4F:推 Dazzium : ??????? 02/28 15:07
5F:推 gandalf2 : 也可能說實力高的人可以連續兩週狀態好實力壓制奪冠 03/01 01:00
6F:→ b1236711 : 實力高就是elo高, 這個數據是表示實力外的影響 03/01 18:08
7F:→ b1236711 : 也許就是狀態 狀態怎麼來=>熱身來 03/01 18:09
8F:→ b1236711 : 不過主要是看那些中段選手能不能一兩輪變兩三輪 03/01 18:23
9F:→ b1236711 : (強者樣本少很難說) 03/01 18:23
10F:推 locka : 想小聲問個問題:選手有辦法自己決定熱身賽打幾場/ 03/02 09:25
11F:→ locka : 幾輪嗎?照大大的意思是,熱身賽打越多場對正賽幫助 03/02 09:25
12F:→ locka : 越大,所以選手應該要多打幾輪;但如果打得贏誰不會 03/02 09:25
13F:→ locka : 繼續往下打? 03/02 09:25
如果數據有效, 我想對男單的意義是: 不需要故意省力打 (女單則相反)
14F:→ locka : 我會覺得打到第五輪Elo+288的數值意義是,代表當下該 03/02 09:25
15F:→ locka : 選手的實力已經比Elo排名強,只是還沒有反應到Elo上; 03/02 09:26
16F:→ locka : 而不是只要熱身賽打五場我的能力就能比自己的 03/02 09:26
17F:→ locka : Elo加288的buff 03/02 09:26
不過女單卻沒有發現一樣冠軍加爆的情形(?)
的確 Elo 需要是穩定的才能有效代表實力, 而冠亞軍很有可能 Elo 持續上升中
如果真的要拆解這個數據可能可以擴大追蹤全英前後的 Elo 變化
雖然少數人的 Elo 可能還沒穩定, 但覆蓋比較多選手的 0~3 場應該相對平滑
而這個區段仍有兩個重要的線索:
1. 有打比沒打好
2. 女單固定下降, 男單固定上升 (也稍微提升了對 4~5 場數值的信心)
感謝提出這些有意義的討論~~
數據不會說話 人才會說話 我也一直在想哪邊可能不完備/有漏洞
※ 編輯: b1236711 (1.161.161.142 臺灣), 03/02/2026 16:45:20
18F:推 locka : 女單沒有加爆的原因不就是因為女單強的只有少數幾個 03/02 17:21
19F:→ locka : 人嗎?(我跟二樓大大看法一致) 打到冠亞軍時幾乎都 03/02 17:21
20F:→ locka : 是固定的人,所以第五輪原本的 Elo 排名就已經能反 03/02 17:21
21F:→ locka : 映該選手實力水準,於是在你的模型裡加的分就不多 03/02 17:21
22F:→ b1236711 : 其實滿有道理的 XD 所以我覺得 4-5 場不用太認真看 03/02 23:05
23F:推 locka : 我會覺得這個模型的問題是ABCDE變數彼此不是相互獨 03/03 11:12
24F:→ locka : 立的,也就是「打5場的一定至少贏了4場、打4場的一 03/03 11:12
25F:→ locka : 定至少贏了3場…」,以統計的角度來說這樣用在logis 03/03 11:12
26F:→ locka : tic model很奇怪,用log loss進步百分比來判斷模型 03/03 11:12
27F:→ locka : 有效性也不是很嚴謹(所謂達到顯著差異是有明確定義 03/03 11:12
28F:→ locka : 的)不過在機器學習領域好像都不用管這些,反正fit 03/03 11:12
29F:→ locka : 出貼近結果的模型就好(茶) 03/03 11:12
30F:→ b1236711 : 其實我是故意設計成獨立的 如果出來有連續性就更有 03/03 16:39
31F:→ b1236711 : 信心(?) 03/03 16:39
32F:→ locka : 欸抖…我是說你的變數沒獨立,不是有獨立XD 03/03 17:31
33F:→ b1236711 : 這幾個數字的性質上是有關的 但我在建模型的時候 03/03 21:54
34F:→ b1236711 : 4場的就是4場的人 2場的就是2場的人 是當獨立變數 03/03 21:54
35F:→ locka : 你沒有看懂我為什麼說他們不是獨立變數… 然後你說 03/04 00:29
36F:→ locka : 的也不是獨立變數的意思… 03/04 00:29
37F:→ locka : 不過我想是我的問題,我一直在用統計的角度思考(my 03/04 00:30
38F:→ locka : bad),但對機器學習領域來說本就無須這麼嚴謹,模型 03/04 00:30
39F:→ locka : 預測力最重要~ 03/04 00:30
40F:→ locka : 還是建議多思考變數選擇的邏輯,並請小心解讀 insig 03/04 00:30
41F:→ locka : ht… anyways, good job!! 03/04 00:30