作者skylm (NA)
看板TW-language
標題Re: 台灣本土語言互譯及語音合成系統
時間Fri May 20 15:03:26 2005
剛剛去玩了一下, 發現我想錯了.
他並不是有語法標記的語料庫.
他只是在提供發音.
之所以斷成這樣:
資訊 工程 學 研究所
應該只是因為他有這些詞的錄音.
這跟語法的標記大概無關.
他還有文白可以選.
板大是選了白話音吧.
如果選文讀,他就念hak8.
總之他就只是提供發音.
至於什麼時候該念那一種音,
他就無能為力了.
這個就需要加上語法的標記才做得到.
附帶一提,
oh8 不見得是動詞喔.
"大學"在廈門跟南洋都是叫做 toa7-oh8
他們來念"資訊工程學"的話,
我相信應該也是有許多人會念成
chu1-sin3 kang1-theng5 oh8 吧
只是台灣習慣念成 hak8.
※ 引述《skylm (NA)》之銘言:
: ※ 引述《Richter78 (The Enigma)》之銘言:
: : 我剛剛輸入「資訊工程學研究所」
: : 結果被斷句成:
: : 資訊工程 學 研究所
: : 那個「學」被當成動詞唸成 oh8
: : XDDD
: 可見這個斷詞的系統還不夠成熟.
: 我不知道他背後有多大的語料庫作基礎.
: 但是這個斷法看起來,
: 這個系統在語意訊息的標記上是不足的.
: 所以"資訊工程"可以當成學習的主體.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.219.2
1F:推 Richter78:原來如此 Orz 218.166.58.239 05/20
2F:推 Asvaghosa:他們沒有文言音? 11/28 15:43