作者wang19980531 (中立评论员)
看板DataScience
标题[讨论] youtube版权审核机制
时间Sun Jun 7 22:47:43 2020
Youtube版权审核包括音乐、影像两个部分,
音乐的部分好像调高调低音就会抓不到,
但影像部分不论缩放、翻转都还会被判定侵权,
有人知道类似的作法吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.214.163.255 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1591541265.A.F54.html
1F:推 sssh: 我觉得很合理啊XD 06/08 05:27
2F:推 kaltu: 影像spatial data在机器学习上缩放旋转本来就是很常用的dat 06/14 11:01
3F:→ kaltu: a augmentation 06/14 11:01
4F:→ kaltu: 通常model也会强调这部分的robustness 06/14 11:01
5F:→ kaltu: 音乐的话,现在主流其实还是基於傅立叶的手法,例如 Shazam 06/14 11:01
6F:→ kaltu: 是用声谱去做 fingerprinting 06/14 11:01
7F:→ kaltu: YouTube很有可能在商业上跟Shazam合作使用同一份fingerprin 06/14 11:01
8F:→ kaltu: t库 06/14 11:01
9F:→ kaltu: 那你从声谱的原理上就看得出来这是对音高敏感的技术 06/14 11:01
10F:推 kaltu: 用声谱的优点是音乐这种temporal data,在Y轴上不同频率如 06/14 11:18
11F:→ kaltu: 果因为等化器特效、使用者麦克风和场所喇叭的频率响应、现 06/14 11:18
12F:→ kaltu: 场的噪音等因素 06/14 11:18
13F:→ kaltu: 而使得某些频率被遮蔽,那X轴拉长了依然可以match 06/14 11:18
14F:→ kaltu: 如果要让Y轴不只频率遮蔽还要加入对频率平移(调高调低)的ro 06/14 11:18
15F:→ kaltu: bustness 06/14 11:18
16F:→ kaltu: 感觉是变成除了在X轴做sliding window search之外对Y轴也要 06/14 11:18
17F:→ kaltu: 做一遍? 06/14 11:18