作者gyboy38 (boy都不boy了)
看板Coffee
标题[讨论] 建立一套基於「相对排序」的咖啡评分系统
时间Thu Dec 4 09:00:30 2025
大家好,我是初心者咖啡gyboy。
最近在思考,如何建立一个具有参考价值的「评分系统」,只针对我自己品项的封测。
虽然像 Coffee Review (CR) 或是 SCA 的评分系统很专业,
但对於大部份的消费者(包含我自己)来说,
没受过专业训练,喝一口就判断这杯是 85 分还是 86 分,其实非常困难。
「打分数很难,但比较谁好喝,似乎容易多了。」
基於这个想法,我试着设计一套「将排序转化为分数」的方式。
核心概念是:不打绝对分数,只做相对排序。
日前我请Line群组内喝过我们家豆子的朋友协助做了一次封测,
google表单如下,您如果有喝过也可以协助填写,分数会滚动调整:
https://forms.gle/sHUkz6Xvo6Ceu9jQ7
以下是计算逻辑,简单写出来,大家帮我想想看,
这样的统计方式是否有盲点?看能不能修正得更好。
计算逻辑(1):
由於不见得每位朋友都喝过所有的品项,
所以这套系统「未列入排名的品项,就不列入计分」。
计算逻辑(2):
找出该名测试者排名列表的「中间值」品项,作为基准,设为0分。
比中间值好喝的,依序 +1, +2, +3...
比中间值难喝的,依序 -1, -2, -3...
最终分数 = 总得分 / 实际评分人数
【举例说明】
状况一:小明只喝过3支,给出的排名是 A > C > D
C 是中间值:得 0 分
A 比 C 好:得 +1 分
D 比 C 差:得 -1 分
状况二:小美喝过5支,排名是 B > C > E > D > A
E 是中间值:得 0 分
C (+1)、B (+2)
D (-1)、A (-2)
【结算】
A 品项: 小明给 +1,小美给 -2。 总分 (1 - 2) / 2位评分者 = -0.5 分
B 品项: 小明没喝过(未评),小美给 +2。 总分 2 / 1位评分者 = 2 分
为什麽要设计成「两面刃」机制,拿下大量负分的品项会没人买吧?
我的想法在於「避免分数膨胀」与「强迫取舍」。
以google地图的1~5星评分来说,店家没什麽大问题通常会给4~5星,
导致监别度丧失,何况还有五星好评送小菜 =.=
对我来说,这个评分就一点意义也没有了。
当你觉得某支豆子超好喝,给它 +3 分的同时,依照排序逻辑,
你势必得把某支豆子排到後面,给出一个 -3 分,是一个零和游戏。
你不可能让所有豆子都拿高分,评分者必须诚实面对自己的喜好排序。
即便是身为烘豆师的我,把自己所有品项拿来排,
不管我多爱某支豆子,我最多也只能给出 +3,同时我也必须忍痛给出一支 -3。
每一支品项都是我从大量样品杯测,谨慎出手买进的,当然不会有不喜欢的。
但排名就是这样。
大家可以想像,当参与评分样本数够多时,这个分数会非常有公信力,
可以说是残酷擂台,因为合计之後能拿到正分的品项,
代表它必须是大部分人心目中的「前段班」。
第一波封测的计算结果:
以我们家比较多人喝过的「衣索比亚 吉茶 水洗」 来说,
他在这次的封测评分中,只拿下 -1.7 分(3)。
後面的(3),表示总共有3个人给出排名,对这个品项产生影响力。
这代表在受测者的心中,吉茶普遍被排在比较後面的名次。
虽然我觉得吉茶也算满不错的衣索比亚 水洗豆了。
类似群众募资的概念,只是我需要的是你舌头的支援 (听起来怪怪),
系统建立起来之後,就会有一个比「老王卖瓜」更客观的参考依据。
不知道大家对於这套「排序转积分」的逻辑,
有没有什麽盲点,或不合理的地方? 欢迎给我建议,谢谢大家。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.223.59.75 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Coffee/M.1764810033.A.792.html
1F:→ hesione: 范围小 大家喝过的东西都差不多可以 但范围大时间一长 等 12/04 09:07
2F:→ hesione: 於要人记得之前所有喝过的给出"相对"高低 这大概比单纯 12/04 09:09
3F:→ hesione: 给分的信度还低 12/04 09:09
4F:→ hesione: 问题如果只针对单一厂商/店家的商品 那意义也不大 12/04 09:11
5F:推 soulivee: 先有话语权,资本力量支持,做这些才有人买单 12/04 09:30
6F:推 jakkx: 就算是哈曼曲线也只是厂商做大众化产品的依据。不过这对"你 12/04 12:32
7F:→ jakkx: 的客群"倒是应该有统计上的资料意义 12/04 12:33
8F:推 masonyrs: 推用心 买过几次评价都很不错 12/04 13:42
9F:→ gyboy38: 感谢各位大大的建议与鼓励,之後google表单的统计,会调 12/05 07:55
10F:→ gyboy38: 整为最近的5~7个品项。这个系统主要是给原有的熟客做参 12/05 07:56
11F:→ gyboy38: 考,可惜没办法做到像CR那样能,同时适用於熟客、新客户 12/05 07:56
12F:→ gyboy38: 。 12/05 07:56