作者nekowang (猫)
看板SakaTalk
标题[乃木] 数据乃团 (一) - 资料说明 (长文)
时间Wed Aug 3 03:53:08 2022
闲到蛋疼拿乃团来练习 Tableau…
https://public.tableau.com/app/profile/yi.pin.wang/viz/Nogizaka46Analysis/Main
请使用 FHD 萤幕观看以免跑版或阅读困难;排版不佳请担待,以後再改进。预设进入在英
文页面,请自行切换到中文页面。
共四个页面,包含内容如下:
「出演资料」:各曲的队型与站位,以及各成员的出演纪录。
「基本数据」:各成员的出演累计与占比数据,如出演曲数、 C 位曲数、出演率、点将率
、聚光率等。
「进阶数据」:各成员的爱将指数、爱将指数+、工作马指数
「相关图表」:白石军团 vs. 西野军团、生田军团 vs. 斋藤军团、各表题期别组成人数推
移图
本篇主要是说明各种名词定义与计算公式,数据的探讨会另开篇章说明。
文长,可以先看其他数据探讨的文,有需要再回头来参照。
简单地说就是参考棒球数据的计算来量化了成员的单曲专辑出演纪录,以便需要研 (ㄅㄧˇ
) 究 (ㄓㄢˋ) 营运对谁比较有爱时,有一个可以共同参照的基准。
那怎样算是营运对该成员有爱呢? 通常大家都围绕在选拔与 C 位在讨论,不过一张单曲有
7 首歌,若只看表题 1 首而当其他 6 首为无物,似乎也有偏颇。所以基於「选拔」的精神
是「点将」,以及「表题 C」的精神是「聚光」,来一并衡量表题曲以外的歌曲可以如何代
表营运对成员的偏爱程度。
从「点将」的本义来说,就是营运明确指明一成员来出演某首歌,而非用「期别」或「同选
拔」这样大范围框列方式指派。另外,一首歌如果点了太多人出演,也会丧失特别点人的意
义。所以暂定 10 人为上限,将非表题非 Under 非框列且人数在 10 人以内的歌曲称为「
特选小组」歌曲。有被选入表题曲或特选小组歌曲才会认定是被营运「点将」。
而「聚光」则是以 C 位为判定基准。不过除了表题 C 是官方公告外,其他曲的 C 目前暂
时只能参考日文维基资讯认定。另外独唱曲与二重唱曲虽然没有 C 位认定,但因为实质效
果跟 C 位一样,所以也被纳入计算;又因为表题 C 最多 2 人,所以也只算到二重唱。最
後,为了尊重表题 C 的地位,表题 C 的权重会是其他曲 C 位的 2 倍。
基於以上设定,来计算以下几项数据,做为营运对成员偏爱的评量依据:
1. 点将率 (Promotion%, PP) = 期间内的 (表题 + 特选小组) / 成员对应的新发行曲数;
概念上同打击率,不过是营运 (打者) 对该成员 (投手) 的打击率。
2. 聚光率 (Spotlight%, SP) = 期间内的 (表题 C + 任何 C + 独唱/二重唱) / 成员对应
的新发行曲数;概念上同长打率。
3. 爱将指数 (Preference Index, PI) = (点将率 + 聚光率) x 1,000;概念上同 OPS 。
4. 爱将指数+ (PI+) = 当期爱将指数 / 当期平均爱将指数 x 100;概念上同 OPS+ 。另外
成员的生涯 PI+ 是依所经历时期的对应新发行曲数做加权平均而得。
5. 工作马指数 (Workhorse Index, WI) = (点将率 - 聚光率) x 1,000;没有对应的棒球
数据项目,含义上是判断营运对常点将成员的定位。若某成员常常被点将但都轮不到站 C
,那就是被营运当成好用又没想力推的工作马。
在爱将指数中,各种歌曲产生的推力权重范例如下:
表题 Actually… 的中西 => 3 (表题 + 表题 C + C)
Unit ざぶんざざぶん 的筒井 => 2 (特选小组 + 二重唱)
Unit 価値あるもの 的久保 => 2 (特选小组 + C)
表题 Actually… 的山下 => 1 (表题)
Unit 価値あるもの 的金川 => 1 (特选小组)
Under 届かなくたって… 的佐藤枫 => 1 (C)
Unit 絶望の一秒前 的井上和 => 1 (C)
Unit 他人のそら似 的任一人 => 0
在上面的计算公式中,所谓「成员对应的新发行曲数」,指的是在某一时期内,成员有参加
的专辑/单曲中有多少新发行的歌曲。单曲内基本上都是新发行的歌曲,但专辑内就含有旧
歌,这些旧歌必须排除在计算外。
至於何谓「参加」,定义是:只要营运在录音时可以选择该在团成员,就算是有参加。所以
:
1. 北野 20 单病休,营运想点将都没法点,所以在计算北野的数据时, 20 单的 7 首曲要
从分母扣除。
2. 宣告毕业而不参加接下来要发行的某单或某专,若全不参加,则该单的内含曲数要扣除
;若参加其中任何一首,则该单的内含曲数仍要计算。所以北野的 29 单与卫藤的 4 专都
要计算对应的曲数。
3. Under 专辑「仆だけの君」虽然选拔成员因“资格不符”而未出演里面任何一首新发行
歌曲,但因为这是营运的选择,所以选拔成员会被视为「参加」。
4. 「世界中の隣人よ」有毕业生参与,对这些毕业生而言,专辑「Time Flies」的所有内
含曲数都不列入计算。
5. 若成员毕业後隔一单/专的专辑纳入该成员先前录制的曲子,则该专辑仅计算该成员毕业
前录制的歌曲。例如白石在专辑「Time Flies」中,只计算有出演的「世界中の隣人よ」和
没出演的「ゆっくりと咲く花」,其他 5 曲则不列入计算。 (Route 246 是特例,原则上
白石宣告的毕业日期是早於 Route 246,但因疫情延後毕业而导致 Route 246 线上发行时
看起来还在团)
前面公式中还提到「时期」的设定,除了避免计算上以单曲/专辑为单位会样本太小而失真
,还有考量整体环境变化的影响。像是前 13 单都是内含 6 曲,是 14 单後才变为内含 7
曲,或是因人员变动而导致营运变更受推人选及单曲/专辑内的歌曲类别等设定。因此基本
上分成 1 – 8 单、9 – 16 单、17 – 22 单、4 专 – Time Flies、29 单 – 目前 这
5 个时期。前面二个时期因为二期成员是陆陆续续上台,所以直接将 前 16 单对半切,後
面的时期都是以三期生後各期别的第一首歌曲为切分点。
若依营运在各时期所给出的机会,计算出各时期的平均爱将指数分别为:
165.2, 147.3, 100.2, 99.0, 113.5
由此可知理论上经校正後的爱将指数+能适切评估营运在一时期中对成员的偏爱程度。
用第一时期 1 – 8 单的白石为例:
参加曲数 P = 49
表题曲数 T = 8
特选小组曲数 SU = 7
表题 C 曲数 TC = 1
C 位曲数 C = 3
独唱/二重唱曲数 SD = 2
所以白石的相关数据为:
点将率 PP = (8 + 7) / 49 = 30.61%
聚光率 SP = (1 + 3 + 2) / 49 = 12.24%
爱将指数 PI = (30.61% + 12.24%) x 1,000 = 428.6
爱将指数+ PI+ = 428.6/165.2 x 100 = 259.4
工作马指数 WI = (30.61% - 12.24%) x 1,000 = 183.7
最後补充一些细节:
1. 4 单因为「指望远镜」还多了个出演成员不同的「指望远镜~アニメ版~」,所以 4 单
的内含曲数算 7 首。
2. 12 单多了 7-11 盘,因此内含曲数也是 7 首。
3. 一些只以影片形式存在但没出现在单曲/专辑的 CD 内的歌曲例如伊藤万理华的「はじま
りか」不列入计算。
4. 有成员影像但没唱的歌曲亦不视为该成员出演该曲,如池田与川﨑不算出演「絶望の一
秒前」,也因此没参加 29 单。
5.「ボーダー」虽然只有身为研究生的 6 人,不过因为名义上是框列二期成员,所以列为
期别曲而非特选小组。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.79.164.222 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/SakaTalk/M.1659469991.A.767.html
1F:推 nofriendsqq: 先推 08/03 05:40
2F:推 kl606045: 好文推 08/03 08:24
3F:推 linchen1121: 推 08/03 09:48
4F:推 AsukaMiku: 推 感谢整理 08/03 09:51
5F:推 limi123789: 推 08/03 10:19
6F:推 ssaume: 资料库整理辛苦了ww 好文推一个 08/03 14:05
7F:推 m381249: 大大是在写论文吧 好强 08/03 14:21
8F:推 singzion333: 推!!! 08/03 15:51
9F:推 TLinHe: 优质推 08/03 16:26
10F:推 Akikiri: 优质推 08/03 18:43
11F:推 anthonylee: 认真推 08/03 23:28