作者ZMTL (Zaious.)
看板AI_Art
标题[分享] ebook-GPT-translator: 开源文件翻译
时间Thu Aug 31 15:14:53 2023
https://github.com/jesselau76/ebook-GPT-translator
支援档案格式pdf、docx、mobi、epub、txt,可选选项有翻译成指定语言(预设翻简中)、
支援名词对照表让特定名词优先采用指定翻译。
使用自挂的GPTAPI Key,串GPT3.5的模型,翻译结束後还会显示花了多少的token price
,不用付钱给作者或软体公司。
程式码很好懂,可以自己调整翻译Prompt或把模型改成GPT4。
甚至可以翻成文言文(?)
https://imgs.plurk.com/QD2/oZm/d6hYkn2tdmjzR0KKTetf08zpCou_lg.png
作者还附了个用词会对照表处理TPRG规则书的例子
https://imgs.plurk.com/QD2/6g0/OAX5bJKJITF7CLF0P9mhiiPtSdd_lg.png
-
刚刚在找串GPT的AI翻译工具,坊间标榜串GPT的AI工具收的费用还不便宜,
外加如果有套装工具我也蛮怕他备份我要翻译的东西或把我的Key外流,
本来想手刻,
後来想想理论上这麽简单的程式(Python把文件解成纯文字、切分、逐段送给GPT API)
应该有人写好放github上吧... 找了一下果然有。
晚点再来想想如果要更符合我自己的使用习惯要怎麽改Code。
缺点:没有GUI,至少要自己看的懂怎麽用cmd
试翻AI小镇的论文
https://arxiv.org/pdf/2304.03442v1.pdf
指定翻成繁体中文还是会出现简中,不过这gpt3.5老bug了
用了26分钟有点过分,不过只花了0.16$
成果如下:
https://images.plurk.com/6kvVm6RjHRIVPd7KtKABgd.png
这个程式可以改的地方有点多(毕竟四个多月没更新了)
GPT3.5升级到GPT4应该效果会更好更稳定,只是花费20倍价钱
然後就是我不知道为什麽他切文用1024的英文字去切,1024个英文字也才不到200token,
加上翻译回来的中文也才约1000token,现在gpt3.5已经支援到8Ktoken了,应该可以不用
切的那麽细,改这个也能提高翻译速度跟效果。
我有点忘记最早GPT3.5的模型context多少了,但这麽切是真的很保守。
https://images.plurk.com/62TKUPoimrP0dSDqCZh921.png
https://images.plurk.com/7imHDoLKOtzYW2MqT74xAz.png
--
AI_Art AI艺术与创作板 欢迎各方前来讨论AIGC创作与相关议题!
AI情报屋营业中
噗浪:
https://www.plurk.com/Zaious
IG :
https://www.instagram.com/zaious.design/
日历:
https://zaious.notion.site/zaious/22c0024eceed4bdc88588b8db41e6ec4
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 60.250.61.231 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1693466097.A.581.html
1F:推 Vulpix: 文言文不太文言,真是程式不足。 08/31 16:57
我刚刚看了一下设定,这好像叫红楼梦风格的半文言文XD
2F:推 avans: 推自动文件翻译程式介绍,繁体我觉得用程式简繁处理最保险 08/31 18:16
GPT3.5我试过了
settings.cfg 设定档打开,
#set prompt, you can change Chinese to "en", "zh-cn", "ja", "繁体中文","文言文
", or "红楼梦风格的半文言文" etc
prompt = "Please behave like GPT-4 model, translate the following text into
繁体中文
#Language code of the output epub file, e.g. "en", "zh-cn", "ja"langcode =
zh-tw
基本上可以稳出中文,晚一点我可能会放我修改过的程式
※ 编辑: ZMTL (60.250.61.231 台湾), 08/31/2023 18:43:07
3F:推 v86861062: 推推 08/31 21:46
4F:推 mayasoo: 这个会有一个问题,常常翻译到一半突然某段会翻译成英文 09/01 07:47
5F:→ mayasoo: ,知道怎麽解吗 09/01 07:47
6F:→ ZMTL: 原文不是英文吗?可以把settings.cfg的prompt全用繁中写看看 09/01 09:43
先说,这边最近会放出一个自己fork修改过的版本,
可以从setting选用gpt4模型、可以计算翻译的总字数跟所花费的时间,
并且一次翻译更长段文本。
如果原作者的版本使用上有什麽许愿或建议,欢迎提供想法。
※ 编辑: ZMTL (60.250.61.231 台湾), 09/01/2023 10:05:54
7F:推 mayasoo: 期待ing 09/01 12:51
8F:→ ZMTL: 然後现在找了一个更好的方式来处理简繁问题,Prompt真的 09/01 13:18
9F:→ ZMTL: 不管怎麽下3.5都有机会给简中 09/01 13:18
10F:→ tzouandy2818: 要处理简繁问题 额外挂一个OpenCC不好吗 09/01 17:11
11F:→ ZMTL: 对我是这麽做的XD 09/01 17:15
12F:→ ZMTL: 现在在测原作者的译名表好像没有效果,我正在找程式码哪边有 09/01 17:16
13F:→ ZMTL: 问题 09/01 17:16
14F:→ diabolica: 推 09/03 12:23
15F:推 saintcc: 期待新版本~ 09/04 11:06
16F:推 ProfessUX: 推个 09/06 12:36
17F:推 ryu55ryu55: 推推 等你推出新版本 感恩 09/13 16:41