作者Artx1 (Eji.Warp)
看板Vocaloid
标题Re: [分享] VocaListener paper 读後心得
时间Mon Jun 2 19:38:04 2008
(续前文)
话说上面应该会有一个问题:ぼかりす怎麽去判断你唱歌到底是唱得好还是唱得差?
方法是和ミク的一个设定值一样:ぺントの深さ/长さ。
这个值指的是你在唱准一个音前的变动程度大小与时间,
理论上越专业的人会唱得越准,但是又不可能完全没有延迟地唱准,那就会变成机器音。
(大家都知道ミク这个值预设是20%,不改的话是天大的音痴XD)
比方说,如果从低音到高音,通常会稍微拉高过一点点音准再拉回来,
这个部份就是图上的オーバーシュート。
後面ビブラート则是抖音;
中间的微细变动则是在"唱准的时候"能不能稳定保持在准确的音上。
所以答案就出来了:
1. 在某个延迟之内唱准一个音
2. 唱准之後的音维持得好
3. 长音抖音的有无
这些参数就可以决定所谓的"专业级与否"。
-----
也就是说,只要是"现实派"的唱法,ぼかりす就可以利用这些参数来判定出
合理的歌唱能力。当然在判定音高的时候会先做曲线的平滑化、还有动态变化
的分离等等,所以这都是做成参数用的判定准则。
还包括了这个音本身和歌词的判别(用来判定歌词输入内容、node音高)。
说起来因为是现实派,所以ぼかりす是个很不容易判定价值高低的技术。
它综合了太多东西,本身是希望实现几乎傻瓜的歌唱回应调节技术,
同时可以满足人声的调节与Vocaloid的操作技术。
但是,说起来直接把输入的歌声"被调教过"後产生的资料拿出来,
就应该会是某个程度上颇为漂亮的歌声,为什麽还是要用Vocaloid呢?
说起来,这个对输入资料进行调教的功能,就和一般DAW软体的Auto-tune软体一样。
[大部分的偶像歌手通常都用这种东西来产生"听起来很漂亮"的CD,
依赖久了上现场就会爆掉。XD
不过Auto-tune最近已经快到连现场的麦克风输入都来得及做校正了,
所以即使是唱现场其实也能开外挂的意思XD]
而经过这种"偶像歌手级的对待",其实大部分的人唱出来的声音都可以到达
某个相当的境界,那麽何必要用Vocaloid呢?
其实这就已经要牵扯到角色市场的奥秘了XD
说穿了就是萌上了,所以非要ミク唱不可对吧!
总之,以目前在nico上对ぼかりす、ぼかんないです><会有一点反感的人,
这种人通常都会有所谓的「ボカロ耳」,听习惯介於机械声、但却又没有
真人一样自然,稍微有点デフォルメ的ミク声,这其实就和写实画风比起来,
通常漫画是采用没那麽写实,有点变形的画风一样。
所以ぼかりす和ぼかんないです><
(从这篇论文来说,VocaListener所做的调教和职人等级的调教并没有什麽差异,
过程都是反覆听、比对、然後朝某个"目标"去调教)这一类的波形追随手法,
都是朝现实派的努力方向,只是音乐的其中一个范畴而已。
这就是VocaListener会以目前这个形式出现的最主要原因:
真的是因为她现在是流行,所以很多技术与话题性都是为了她而被提出来的,
包含这个原本可能会被埋葬的非主流技术。
所以如果要以辅助目前的流行为前提的话,可能还是要考虑以某些特定的方式释出
(比方说以搭配Vocaloid为前提),而不能用传统的付费软体工具来贩卖;
毕竟这里面又有一些和现行工具功能重叠的部分,而现行工具大多是要卖钱的,
比方说Auto-tune5本身就要价399美金,那麽你如果免费释出,
那不就代表Auto-tune的厂商就要来找上门理论了?
----
所以因为品质太好结果太像人、不够萌(?!)所以不受现行的ミク爱好者族群喜爱、
然後做好人做得太彻底又会被其他人盯上,只能说中野伦靖先生这篇神论文真的
是个大烫手山芋XD
不过以产品本身来推测,由於VocaListener内建VSTHost
(用来和ミク连接来以即时输出),应该会是个单独运作的软体,
输出的档案可能只有VSQ和WAV,其余参数和控制介面可能都会封在内部,
以避免和其他软体互相冲突;不过这时候就只有最低程度的功能,
只是个调教工具+变声器而已。
由於VocaListener本身可以从一个Vocaloid的VSQ汇入生成其他Vocaloid的参数,
其实某种意味上存成VSQ意义不大,最好是存成自己的参数变化格式才方便;
比较好的状况是VocaListener-plus的情感参数可以用资料库的方式拉出来,
彼此交换存档,参数本身可以拿来定义"歌手的风格",
长期下来就会有很多很有趣的资料累积起来。(就像MMD的舞步资料一样)
然後尽量不要输出"使用者自己唱出来的声音被工具调教过的结果",
这样就不会和现行的高价工具定位冲突,不然可能会被迫要订在很高的价位,
或者是与特定的产品包在一起(如最後变成卡拉OK伴唱机的功能,
让卡拉OK伴唱机里面内建Vocaloid等等),
当然这就是用来打进一般user的市场,就与nico目前的状况与需求渐行渐远了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.204.3.179
1F:推 gcsyokan:推精心研究文+口+ 不过...看得到吃不到w只能乖乖用MMV了 06/02 21:16
2F:推 kitsunesaru:推EJI大的研究文^ ^)b 06/03 09:23
3F:→ miau9202:既然如此,还是需要『再调教』嘛…以为可以完全取代人工 06/04 00:58
4F:推 sdarktemplar:过至少是有草稿去修 是从头自己来 06/04 00:59
5F:→ Artx1:算是完全取代了老实说,因为人工只剩下"哪边听起来不对" 06/05 00:22
6F:→ Artx1:这个动作,然後引擎会自己调出几个不同的候补,让user听 06/05 00:22
7F:→ Artx1:这样的话调教过程就没有"职人技"了,代表只要知道 06/05 00:22
8F:→ Artx1:听起来长什麽样子,第一次摸的人都可以做到调教 06/05 00:23