作者waakye (-----)
看板youtuber
标题Re: [讨论] 上字幕的流程问题
时间Thu Jul 15 15:11:20 2021
首先 我是网页搜寻到这篇文的
平常没来这版,不过因为网路上讨论很少
就稍微回覆一下,做个笔记顺便让之後需要的人能够方便些
你遇到的就是文字还有语音转换的问题
这要分两个部分讲
第一个部分是文字转语音TTS (Text to Speech)
先推荐一个软体
Balabolka
网址在此
http://cross-plus-a.com/balabolka.htm
(有中文版)
安装完之後打开 把文字放进去就可以叫他念了
他所调用的语音引擎是windows内建的
假如系统是WIN10新版本,可以调用SAPI5的语音
预设的繁体中文语音是涵涵(微软会把语音取名子)
如果想用另外两个SAPI5的语音(雅婷.志威)
请参考这里
https://class.kh.edu.tw/19061/bulletin/msg_view/400
下载REG登录档 装好之後就有了
以上是Balabolka调用本机(不连网)的语音引擎
假如是想要用线上语音引擎
在Balabolka->工具->Use online TTS services
快速键shift+ctrl+D
就可以使用一堆的线上TTS
而且可以直接转存声音档
Google TTS1 TTS2是免费的 直接把文字打进去就能用
Google Cloud TTS要收钱
但是效果真的比较好
免费体验网址在这
https://cloud.google.com/text-to-speech
注册方式请参考
https://www.youtube.com/watch?v=y_vQvAqgqgA
收费标准
免费:每月免费100万字(WaveNet)
收费:每100万字 16美元
小量使用通常不会收到钱
另外Google Cloud TTS里面的standard语音和Google TTS2是一样的,不要浪费额度去开
另外一个是Micosoft Azure TTS
一样是收钱
体验网址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/text-to-speech/
注册方式:
https://www.youtube.com/watch?v=WZi0fhJtLJI
收费标准
免费:每月免费50万字(神经网路)
收费:每100万字 NT$480.868
然後里面的涵涵.雅婷.志威是电脑WIN10就有内建可以调用 不要浪费额度去开
至於其他线上TTS 不成气候 不推
第二部分
语音转文字
一样是GOOGLE还有AZURE两家
体验网址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/speech-to-text/#features
https://cloud.google.com/speech-to-text?hl=zh-TW
我拿上面文字转语音的音档去喂
成功率挺高的,就是有些字会识别成同音字,这要手动修正一下
但是拿演讲的录音档输入进去
辨识就是很糟糕了
有在用pyTranscriber应该就知道体验的结果
反正就是目前的语音转文字 必定还要花时间去修正
不过顺便提一下
之前在看有话好说的节目,节目使用交大的AI软体,准确率几乎是100%
连来宾突然讲台语照样输出
不过目前没有公开,花钱也买不到,假如公开在台湾腔转文字就是打爆GOOGLE和AZURE
※ 引述《h07860251 (无法显示)》之铭言:
: 最近尝试做影片
: 计画是使用GOOGLE语音+自动上字幕
: 结果实际使用完全跟想像的不一样
: 超级不顺利
: 首先
: 为了生成GOOGLE语音
: 事先用记事本纪录了脚本
: 然後尝试使用网路上说的两种方法
: 第一种是使用GOOGLE翻译网页让他朗读+电脑录音软体录制
: 缺点:网页有字数限制(看起来是限制5000字)、而且耗时很久
: 第二种是像 Sound of Text 网页方法的但字数更短
: 或是说使用F12从Media 抓取的话 太长会被自动分段也不是很方便...
: 总之GOOGLE语音档会有一种没分割的完整档,或是小段小段的分割档
: 不是影片去搭配语音,就是语音去切割搭配影片
: 这两种要看状况,都有适合的时机
: 然後影片跟声音制作完成要去制作字幕的时候
: 使用网路上推荐的免费AI字幕生成(pyTranscriber)
: 结果正确率低到爆炸,GOOGLE语音比人声难辨识阿
: 而且该软体网路上说使用的是 Google 语音识别来产生的字幕
: 结果自己产出的语音自己的辨识系统分不出来....
: 为了调整正确率
: 使用网路上推荐的免费字幕编辑软体(Aegisub)
: 搭配使用起来因为已经有脚本了
: 原本想说应该只要复制贴上过去很快就结束
: 结果他断句怪怪的,又要细部微调
: 感觉做了很多无用功.......
: 最後要上传YOUTUBE
: 自己本身也习惯内建字幕
: 去网路上找合成影片跟字幕的软体
: 结果合成上去发现字体不一样
: 然後排版也不太一样... 应该是软体差异造成
: 只是没看到想用的免费软体....(大陆的先不要...)
: 感觉我整个流程绕了超级大圈
: 有没有什麽建议可以提供
: 在下感激不尽....
: -----
: 顺带一提,目前我使用Shotcut这款(免费软体)来剪辑
: 查了一下,这款是可以上文字,但是还没有支援SRT字幕等等功能
: 之前是有用过DaVinci Resolve (听说调色特别厉害)
: 只是他虽然说是免费的,但是还是跟付费版有差别
: 上网查了一些教学,结果是付费版才有的功能
: 大失望就换软体了...
: 最後再问一下
: GOOGLE语音是可以随便使用(包含商业使用)吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.239.186.13 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/youtuber/M.1626333090.A.FD7.html
1F:推 moonfly: 很有帮助,谢谢 07/15 23:29