作者skylm (NA)
看板TW-language
标题Re: 台湾本土语言互译及语音合成系统
时间Fri May 20 15:03:26 2005
刚刚去玩了一下, 发现我想错了.
他并不是有语法标记的语料库.
他只是在提供发音.
之所以断成这样:
资讯 工程 学 研究所
应该只是因为他有这些词的录音.
这跟语法的标记大概无关.
他还有文白可以选.
板大是选了白话音吧.
如果选文读,他就念hak8.
总之他就只是提供发音.
至於什麽时候该念那一种音,
他就无能为力了.
这个就需要加上语法的标记才做得到.
附带一提,
oh8 不见得是动词喔.
"大学"在厦门跟南洋都是叫做 toa7-oh8
他们来念"资讯工程学"的话,
我相信应该也是有许多人会念成
chu1-sin3 kang1-theng5 oh8 吧
只是台湾习惯念成 hak8.
※ 引述《skylm (NA)》之铭言:
: ※ 引述《Richter78 (The Enigma)》之铭言:
: : 我刚刚输入「资讯工程学研究所」
: : 结果被断句成:
: : 资讯工程 学 研究所
: : 那个「学」被当成动词念成 oh8
: : XDDD
: 可见这个断词的系统还不够成熟.
: 我不知道他背後有多大的语料库作基础.
: 但是这个断法看起来,
: 这个系统在语意讯息的标记上是不足的.
: 所以"资讯工程"可以当成学习的主体.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.219.2
1F:推 Richter78:原来如此 Orz 218.166.58.239 05/20
2F:推 Asvaghosa:他们没有文言音? 11/28 15:43