作者Laviathan ()
看板AI_Art
标题Re: [分享] openai_whisper / faster-whisper /webui
时间Mon Jul 1 23:14:54 2024
借标题请教一下
今天faster-whisper发布新版本支援Silero VAD
可是我看他的范例是用mp3档,不是用串流
这样如果我要做即时逐字稿跟翻译的话
是不是只能用while反覆侦测有没有人在讲话?
※ 引述《blarc (blarc)》之铭言:
: 先感谢大大分享跟介绍!
: 最近使用fast-whisper-large-v2来翻译日综
: 有一些心得跟问题想请教
: 目前翻译的效果还可以, 至少可以看懂7成内容了, 但感觉还有改善空间
: 遇到一些人名/地名/专有名词会比较苦手
: 这部份我是利用Initial Prompt来改善
: 先把艺人名或节目介绍的地名先打上去, 翻译会比较倾向用你提示的内容
: 不过好像有224个token限制的样子
: 另外有时候会遇到一段翻译一直重复同一个句子长达几分钟
: 感觉像是卡住或是落入loop
: 我有试着把VAD - Max Merge Size 从90改成180或更高
: 或是去Full页面把Condition on previous text取消掉
: 可以减少这种重复句子的问题
: 最後有两个想请教的地方
: web-ui上有translate model和language栏位
: 这两个栏位的用途是? for translate task用的吗?
: 还是跟翻译成中文有关?
: 另外我透过修改config的方式下载其他model来做transcrbie
: ex: zh-plus/faster-whisper-large-v2-japanese-5k-steps
: arc-r/faster-whisper-large-v2-mix-jp
: 不过效果怎麽比原本faster-whisper-large-v2还差 @@
: 我以为这些model是为了加强日语辨识, 还是我还少做了什麽步骤吗?
: 谢谢.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.248.218.244 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1719846897.A.DD8.html
1F:推 SKYHas: 如果是串流yt 可以看看stream-translator-gpt这个专案 07/23 01:59