作者Artx1 (Eji.Warp)
看板Vocaloid
標題[閒聊]新的歌聲合成系統「Sinsy」
時間Sat Dec 26 04:17:06 2009
內容為個人blog轉載與增補,還請包涵。
http://www.nicovideo.jp/watch/sm9190295
【Sinsy】耳のあるロボットの唄【歌わせてみた】
號稱是HMM-based的歌聲合成系統,主打免調教。
應該與上回的技術講習会「音声・歌唱合成の現状と将来」上出現的
德田惠一先生(名古屋工業大學)有關。
http://www.asj-tokai.jp/lecture
技術講習会「音声・歌唱合成の現状と将来」
原始開發者是酒向慎司先生,不過他已經轉到東大了,
所以先前聽說03年之後就沒什麼進展....VOCALOID真的刺激到不少東西。
http://hil.t.u-tokyo.ac.jp/~sako/doc/rencon.pdf
HMM-based Singing-Voice Synthesizer
HMM-based最大的優點就是全靠語料庫自行搜尋,幾乎不需要人手介入就可以生成歌聲,
合成過程是一種最短路徑搜尋而不是音源合成,所以可資調整的參數和音色的相關性
似乎會很低,操作起來與現有的VOCALOID、UTAU都有很大的差異,而和前一段時間
release出來的VOICEROID語音生成軟體會很像。
(應該說,HMM-based語料庫式合成在語音合成領域現在已經是主流)
HMM-based最大的問題在於與音源不同,幾乎沒有調整空間這點。
(所以與其說不需調教不如說沒辦法調教)、只能用類似對人聲wav進行調整的工具
來作業、還有收錄雖然有自動化的空間卻非常冗長這點。
好處則是多語言支援、可以同時進行歌聲與語音的合成等等部份,
以及有機會做到加入情感表現的部份。(和sampling比起來比較容易作multi-layer)
控制介面也有很大的機會做得很單純,而不是像現在VOCALOID一樣很貼近MIDI參數,
會很適合初學者使用。
因為收錄是對收錄者的一般歌唱作手動的字母標記,然後透過累積相當數量,
來訓練、達到統計規模,後半的自動化程度會越來越高,但是數量可能要上百首,
這點會遠大於現有的這幾種音源合成系統。
所以Sinsy(已經快被叫做「紳士」了?!)到底有多少能耐還蠻有待觀察的。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.204.43.10
※ 編輯: Artx1 來自: 123.204.43.10 (12/26 04:18)
1F:推 FeAm:Ejiさん介紹乙-(正好在找相關資料 12/26 04:39
3F:推 kitsunesaru:被叫做"紳士"也太慘了吧XD 感謝介紹~ 12/27 15:10
4F:推 domonsan:名稱叫起來已經很"紳士"了,這也沒辨法啊 = w =" 12/28 23:16