作者linmarkyu (飞影)
看板EZsoft
标题[请问] 有关於语音档转文字的软体
时间Fri Sep 23 16:22:51 2016
除了麦克风输入转文字外
想请问各位版友
是否有其他的语音档(EX:开会或简报的录音档案)转文字的软体?
因有现成的语音档 想从语音档里读档成文字
毕竟以现况来说是 一边听录音档 一边自行缮打至Word
但因为录音档理的内容 有时候会听不清楚而暂停 甚至重复听取
这样会耗太多时间了 想说以电脑软体来辅助的话 应该可以节省时间
即使电脑的辨识能力可能不是很正确 那也没关系 辨识不正确 再自行修正即可
目前我在网路上爬文 得知的是这种的
https://speechnotes.co/zh/
後来又爬文到 有网友找到我要的点
就是
http://www.mobile01.com/topicdetail.php?f=512&t=4838622
该网友ID是:ahwaiyuen98
他提到说:音讯档转换输入PC LINE IN、可以转换就行 line on laptop
到底是什麽意思呢!?
依他图示所列 一个录音档播放
在该网页上按下麦克风 就是没出现转档文字 想请教各位版友 不知问题点在哪呢!?
还有 若有其他的语音档转文字的软体
还要烦请各位版友为我解惑了 谢谢! 再次感谢电脑软体版版友的答覆与指教!(鞠躬
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 163.30.93.1
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/EZsoft/M.1474618983.A.7D8.html
1F:→ CHiDo: 人都听不清楚的部份,电脑更难辨识。 09/24 05:35
2F:→ CHiDo: 倒不如让人戴耳机听,然後用麦克风复诵给电脑辨识。 09/24 05:36
3F:→ eva19452002: 楼上中肯 09/24 07:13
如果可以我也希望 (泪
但该录音档是经由会议上的委员谈话
故很难给予委员戴上耳机 用麦克风对话到电脑上
尔後若有机会 会徵求委员的意愿 不然真的只能用听打方式来记录电脑了
4F:推 newclicker: ahwaiyuen98的意思应该就是j557558说的耳机孔与麦克 09/24 08:56
5F:→ newclicker: 风孔(或Line in孔)用3.5公对公音源线对接的方式,这样 09/24 09:00
6F:→ newclicker: 网页的麦克风功能才能清晰收到录音档的声音来语音辨识 09/24 09:02
原来如此 我会再试试看 若有疑问 会再请教n大了! (感恩
※ 编辑: linmarkyu (111.251.17.151), 09/26/2016 00:20:40
7F:→ CHiDo: 是教你听录音档委员讲的话,由你复诵给电脑辨识。 09/26 08:46
8F:→ CHiDo: 委员听自己录音再复诵给电脑?乾脆让他打讲稿给你就好。 09/26 08:51
原来您的意思是这个
这样的话 由我再复诵给予电脑辨识 也不是跟听打类似吗?
虽然这样做也会比较快一些 但我觉得这样感觉与听打类似 只是做法不同
不过 还是感谢您的建议 这个方法 我会详细考虑 或许这个方法会比听打好一些!
9F:推 spfy: 如果你的需求是"先经由电脑做完整语音辨识 再由人力修改错误 09/26 09:41
10F:→ spfy: 这样可以试试看(前提是语音档本身够清晰 否则你会修到疯掉) 09/26 09:42
11F:→ spfy: 如果只是希望由电脑语音辨识来修正连人力都听不清楚的部分 09/26 09:43
12F:→ spfy: 那效果应该很差 09/26 09:43
基本上 我听录音档时 多少会有些杂音
毕竟一个会议室 隔音效果没这麽好
但有听不清楚的地方 以重复听取多次且放慢速度
勉强还可以辨识出来 所以 我想修正程度的部分 应该不会太大
但还是希望经由电脑语音辨识 节省听打与复诵之时间
若是别无他法之时 我会以C大的方式试试
用自己复诵方式 来给电脑语音辨识 这样多少会省去听打的耗时!
最後 也谢谢楼上各位大大的回覆 昨日与前天本来要即时回覆
但因为碍於昨日台风天与前天的忙碌之困扰 拖到今日才回覆
也没想到小软体版 还会有版友查看与回覆 真的很感谢以上版友
您们的意见与建议 我会再加以试试 再次感谢楼上各位大大们的回覆! (再度敬礼
※ 编辑: linmarkyu (59.115.81.112), 09/28/2016 14:43:33
13F:→ jans0204: 如果是含卤蛋的委员 你只好认命了 11/27 01:11
14F:→ jans0204: 这是TTS的逆向工程 以现在的技术 也才刚启蒙而已 11/27 01:19
15F:→ jans0204: 而且也只在欧美的拼音字稍有点进展 还要发音标准才行 11/27 01:24
16F:→ jans0204: youtube的字幕并不是即时口译 而是有人先处理好字幕 11/27 01:28
17F:→ jans0204: 联合国各国语言的即时口译 也是口译室的口译人员为之 11/27 01:32
18F:→ jans0204: 至於机器人(宠物)听懂人语 则是有限制的语句pattern 11/27 01:38
19F:→ jans0204: 这根本不是人工智慧 只是资料库的配对处理 11/27 01:40
20F:→ jans0204: 语音助手 在winxp前就有了 至今一样也是资料库的搜寻 11/27 01:45
21F:→ jans0204: 这也是win10迟迟推不出中文语音助手 因为没人去建立 11/27 01:48
22F:→ jans0204: 庞大的资料库 日文的发音字不超过100个也是如同欧美的 11/27 02:00
23F:→ jans0204: 拼音字组合 但中文的发音字则有近万个(加上四声) 11/27 02:04
24F:→ jans0204: 加上组句(context)处理 语意加语法 够庞大的资料库 11/27 02:13
25F:→ jans0204: 这还要委员们的发音标准才可行 所以认命吧 不变才是最好 11/27 02:18
26F:→ jans0204: 用mp3splt-gtk 它可设多个段点 方便你听取 把它当播放器 11/27 02:26