作者Artx1 (Eji.Warp)
看板Vocaloid
标题[闲聊]新的歌声合成系统「Sinsy」
时间Sat Dec 26 04:17:06 2009
内容为个人blog转载与增补,还请包涵。
http://www.nicovideo.jp/watch/sm9190295
【Sinsy】耳のあるロボットの呗【歌わせてみた】
号称是HMM-based的歌声合成系统,主打免调教。
应该与上回的技术讲习会「音声・歌唱合成の现状と将来」上出现的
德田惠一先生(名古屋工业大学)有关。
http://www.asj-tokai.jp/lecture
技术讲习会「音声・歌唱合成の现状と将来」
原始开发者是酒向慎司先生,不过他已经转到东大了,
所以先前听说03年之後就没什麽进展....VOCALOID真的刺激到不少东西。
http://hil.t.u-tokyo.ac.jp/~sako/doc/rencon.pdf
HMM-based Singing-Voice Synthesizer
HMM-based最大的优点就是全靠语料库自行搜寻,几乎不需要人手介入就可以生成歌声,
合成过程是一种最短路径搜寻而不是音源合成,所以可资调整的参数和音色的相关性
似乎会很低,操作起来与现有的VOCALOID、UTAU都有很大的差异,而和前一段时间
release出来的VOICEROID语音生成软体会很像。
(应该说,HMM-based语料库式合成在语音合成领域现在已经是主流)
HMM-based最大的问题在於与音源不同,几乎没有调整空间这点。
(所以与其说不需调教不如说没办法调教)、只能用类似对人声wav进行调整的工具
来作业、还有收录虽然有自动化的空间却非常冗长这点。
好处则是多语言支援、可以同时进行歌声与语音的合成等等部份,
以及有机会做到加入情感表现的部份。(和sampling比起来比较容易作multi-layer)
控制介面也有很大的机会做得很单纯,而不是像现在VOCALOID一样很贴近MIDI参数,
会很适合初学者使用。
因为收录是对收录者的一般歌唱作手动的字母标记,然後透过累积相当数量,
来训练、达到统计规模,後半的自动化程度会越来越高,但是数量可能要上百首,
这点会远大於现有的这几种音源合成系统。
所以Sinsy(已经快被叫做「绅士」了?!)到底有多少能耐还蛮有待观察的。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.204.43.10
※ 编辑: Artx1 来自: 123.204.43.10 (12/26 04:18)
1F:推 FeAm:Ejiさん介绍乙-(正好在找相关资料 12/26 04:39
3F:推 kitsunesaru:被叫做"绅士"也太惨了吧XD 感谢介绍~ 12/27 15:10
4F:推 domonsan:名称叫起来已经很"绅士"了,这也没辨法啊 = w =" 12/28 23:16