作者kumahead (观测代号1095)
看板C_Chat
标题[闲聊] 为了追停止代理的小说做了个翻译工具
时间Wed Feb 4 17:18:55 2026
如题
为了追停止代理的小说
我做了个AI翻译工具
几周前去了趟日本玩
逛书店时赫然发现
国中开始追的小说还在更新
就是号称罗马数字教学,女主存在感越来越稀薄的,男主金次的奇妙冒险,<<绯弹的亚莉
亚>>
台湾尖端出版只到39,日本已经出到44了
寻思现在AI翻译水准已经不差了,也买得到日文电子书
心一横,就买了39~44的日文电子书,回来开发个翻译工具
最初的想法很简单
让AI对照39集的中日版本,建立角色、招式、专用术语的翻译字典
再让AI参考字典对40~44进行翻译即可
自然踩了许多坑
* 许多句子会翻译失败
* 翻译夹杂着注解&思考过程
* 新角色&招式因为不在字典里,翻译会不连贯
最後花了数天改成以下流程:
1. 对照39集中日两版建立字典
2. 让AI扫一遍新书,抓出容易翻译不一致的名词加入字典
3. 手动调整字典里新词汇的翻译
https://i.mopix.cc/KYvGbx.jpg
4. 让AI将日文新书翻译一遍
https://i.mopix.cc/NRK0zG.jpg
5. 用UI对照原文,人工检查翻译品质,辅以AI& Google 翻译逐句修正
https://i.mopix.cc/QUlgcE.jpg
6. 合成电子书译本
https://i.mopix.cc/QgDm2R.jpg
根据我自己的阅读&语文能力,从头完成一本轻小说的翻译要花大约5小时上下
运气差的话在第5步骤会发现重大人物名称翻译问题
得修改字典後退回第4步骤重新跑一遍
====以下有雷====
比方说40集退回幼童的拉斯普京娜
自称チナ
一开始不知道是人名翻成“支那”
AI的译文里就不断出现中国人
还有42、43出现的,贝瑞塔创办的NGO的特工
Giusto 5号 的代号是The Father
一开始以为是义大利黑手党,翻成父亲
实际上是圣职者,要翻作神父
最头痛的是44集的地雷女
自称、称呼他人、讲话内容到处都是奇怪的变体简称
金次 kinji > 金P kinpi
响 hibiki > 响P hibipi
割腕 arm cut > 阿母卡 amuka
由於44集主角在男公关俱乐部卧底
一堆酒都不写全名,都是简称
AI的翻译品质明显下降
====防雷结束====
总之,小说翻译看完了後
为了让这工具能多派上用场
又花了几天改成多语种的翻译工具,不再局限於日翻中
兴许能成为小说推广工具?
发这边看看有没有出版社之类的有兴趣
或是有类似断更困扰的都可以留言或私我
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.70.138.212 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_Chat/M.1770196738.A.EC3.html
1F:推 laigeorge89: 你为什麽不要乾脆去学日文02/04 17:20
我自己的日文程度大约只能在日本自由行
读小说会超卡XD
2F:推 jorden0804: 学日文看小说要花的时间一定比搞ai 久02/04 17:21
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:24:12
3F:推 XFarter: 帮推 看起来是直接 call API?02/04 17:23
call API 太贵
借了一台dgx spark 本地跑LLM
4F:推 steven3QXD: 原来停止代理了喔02/04 17:24
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:25:10
5F:→ jackz: AI就是断更救星02/04 17:25
6F:推 ab100777: 之前看别人有问过说还会继续出,结果出了1本又没下文02/04 17:25
7F:推 a122771723: 推02/04 17:25
8F:推 arrenwu: 你能借到 DGX Spark也不容易啊XD 这台不便宜耶02/04 17:26
真的不便宜
但老实说不需要用那麽好
单纯开发时想测多种不同的模型才借
最後用的是Qwen2.5 32b int4量化
理论上可以用3090跑
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:27:52
9F:推 inte629l: 居然dgx跑千问 羡慕QQ02/04 17:26
10F:推 sokayha: ai翻日文小说的对话应该是缺主词的问题最大 加上幻觉问题02/04 17:26
11F:→ sokayha: 就变成连原文不在场的人都进来插话了 02/04 17:26
12F:推 sd2567: 你借得东西也不便宜啊02/04 17:26
13F:推 jorden0804: Ai再发展下去我看台湾出版社会完 进度慢又容易断尾02/04 17:26
14F:→ sd2567: 出版社早就死得差不多了 02/04 17:27
15F:→ jackz: 小说用API真的很贵 漫画还好02/04 17:27
16F:→ error405: 上个月腾讯有出开源翻译工具 02/04 17:28
17F:推 junorn: 那麽大量的字不用本地LLM跑真的不便宜...是TranslateGemma02/04 17:29
18F:→ junorn: 吗?02/04 17:29
19F:→ sokayha: 之前看地错新本有人丢ai翻的试看版 看了没几段满脑问号、 02/04 17:29
20F:→ sokayha: 自己对照完原文发现问题在哪後 就乖乖回去啃日文直到看完02/04 17:29
21F:→ sokayha: 那两本了 02/04 17:29
22F:→ junorn: 阿推完文才看到用的模型,抱歉 02/04 17:29
23F:推 arrenwu: DGX Spark 可以跑比 32B 强很多的模型吧 02/04 17:30
主要是希望能压低硬体需求
毕竟这台dgx spark 是借来的
这周就得还
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:31:05
24F:→ arrenwu: 长久地来说,看得懂日文当然是比较好的 因为日中转换总是02/04 17:30
25F:→ arrenwu: 避免地会因为语言结构不同而有失真的部分02/04 17:30
26F:推 XFarter: 如果有 Ground truth + 文意表的话02/04 17:31
27F:→ XFarter: 好像其实不太需要本地 LLM,用上下文窗口大一点的 LLM 含 02/04 17:31
28F:→ XFarter: 纠错的成本及效率,也许比直接架 Qwen 更好? 02/04 17:31
29F:推 ElfFail: 这个有没有办法翻译一些日文游戏的文本呀,之前一直很想 02/04 17:31
30F:→ ElfFail: 把梅露可物语的剧情补完但碍於没有翻译( 02/04 17:31
台版梅路可玩家+1
理论上做得到
但目前这个工具是用来处理epub电子书的
从游戏里抓文字档出来我还没研究过
我知道有些解决方案是加上ocr
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:34:11
31F:→ XFarter: 就算用 4090 甚至以上 GPU 跑模型,VRAM & RAM 太低的话 02/04 17:33
32F:→ XFarter: 单次 Response 的速度也挺慢的吧 QQ 02/04 17:33
33F:推 mk4188623: 如果说个别帮小说建立关键字的资料库呢?不知道可不可 02/04 17:33
34F:→ mk4188623: 行 02/04 17:33
35F:→ mk4188623: 这样至少翻译专有名词的时候不会出错 02/04 17:33
把步骤2、3拆出来单独用应该就可以了
36F:→ mk4188623: 但如果资料库内容有来自不同出版社的小说的话,02/04 17:33
37F:→ mk4188623: 版权问题感觉会很麻烦就是02/04 17:33
38F:→ XFarter: @Elffail 你有办法把文字表吐出来就可以 如果是 RM 类型02/04 17:34
39F:→ XFarter: 的游戏的话用 Mtool 甚至可以吐 json 的 Key value table02/04 17:34
40F:→ XFarter: 02/04 17:34
41F:推 a37805: 我从五十音不会到基本可以正常速度读大概花了一年 02/04 17:35
42F:→ a37805: 每天读日文4hr假日8hr以上 刚开始还要自己去买教材或是上 02/04 17:35
43F:→ a37805: 网找教材来读 给想要自学的参考 02/04 17:35
44F:推 ElfFail: 因为梅露可目前是已经有单机版本了,所以应该是能从里面 02/04 17:35
45F:→ ElfFail: 找到文本档案 不过这又是一个要去问的知识了( 02/04 17:35
46F:推 arcanite: 推02/04 17:35
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:36:26
47F:→ dnek: 勇者02/04 17:37
48F:推 NCTUwestbook: 推推 这个有办法结合日版的bookwalker吗02/04 17:38
只要能下载epub档就能用
49F:推 pttmybrother: 推 光是要做成电子书我就卡住了==02/04 17:38
我是直接从google 图书下载自己买的电子书XD
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:39:28
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 17:40:42
50F:推 XFarter: 像梅路可这种 Unity Engine 的话我记得好像也有现成的工 02/04 17:40
51F:→ XFarter: 具能汇出,比较知名的就 SakuraTranslator? 02/04 17:40
52F:→ XFarter: 但我没特别研究 大部分我有翻译需求的都是 RM 做的黄游..02/04 17:41
53F:→ XFarter: . 02/04 17:41
54F:→ XFarter: 这些文本翻译的汇入汇出工具 Mtool 其实非常成熟 02/04 17:41
55F:→ NoLimination: 我的经验是一次一万字比较稳 变翻变制作专用辞典 02/04 17:42
56F:→ NoLimination: 主词省略导致翻译搞错还是要自己校对一下 02/04 17:43
57F:推 sokayha: 看的都是acg相关的话 动画(听)->gal game(听+读)->なろう 02/04 17:46
58F:→ sokayha: 上的小说 这条路径学的会比较轻松且有动力就是了 02/04 17:46
59F:推 q16588188: Lunartanslator可以翻译一些unity的小黄游 02/04 17:46
60F:→ sokayha: holo en、holo id他们会日文的也几乎都这样学来的 02/04 17:47
61F:→ q16588188: 说错,LunaTranslator 02/04 17:47
62F:推 denny8437: 推 02/04 17:51
63F:→ xga00mex: 可以去看对岸sakura翻译相关的社群 02/04 17:55
64F:→ xga00mex: ai翻日文小说这块蛮成熟了02/04 17:55
65F:→ xga00mex: 不过问题还是跟你遇到的一样 躲不掉XD 02/04 17:56
66F:推 PSP1234: 我也是靠ai翻译追很多台版断尾的作品 02/04 18:00
67F:→ PSP1234: 只是精准度还是不够高 有些地方还是要配合原文02/04 18:00
68F:→ magamanzero: 话说古板在问AI有没有杀手级应用...我也只能笑笑w 02/04 18:02
69F:推 r30307: 可以问问GPT如何把AI翻译的演算法进一步优化(02/04 18:03
70F:推 akway: AI好用+102/04 18:06
71F:推 bag0831: 推,每次都有键盘语言家叫人学日文,真的躁==02/04 18:10
72F:推 leophior: 现在学日文不如学ai 还能自产小说色图 02/04 18:15
73F:推 avans: 推设计与分享 02/04 18:15
74F:推 windfeather: 推分享02/04 18:24
75F:→ s8018572: 想自己看 还要花5hr== 02/04 18:27
5hr里3hr是阅读&校正用时
2hr是AI 逐句翻译
或许AI翻译的回圈有优化空间,但现在有点懒
76F:→ s8018572: 这麽大量 除非你钱很多 用api跑 根本像烧纸钱一样 02/04 18:28
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 18:34:10
77F:推 awenracious: BW的可以吗 我也买了一些台版断尾日文小说 02/04 18:30
没用过bw不太清楚
印象中能下载epub ,那就可以用没问题
※ 编辑: kumahead (42.70.138.212 台湾), 02/04/2026 18:36:24
78F:→ BruceChang: 用api应该品质提升会减少那个校稿时间 02/04 18:36
79F:推 Armour13: 校正真的很费时,如果没有要分享给别人看,我都sakura翻一 02/04 18:42
80F:→ Armour13: 翻自己爽就好了 02/04 18:42
81F:推 Armour13: 不过亚莉亚这种长青树,去对岸社群找找可能有热心的小精 02/04 18:45
82F:→ Armour13: 灵用Ai翻好跟校正好的 02/04 18:45
83F:推 minipig0102: 哇 哇靠 02/04 18:49
84F:→ haseyo25: 应该说原文不是不能啃但是很烧脑没办法放松看 02/04 18:51
85F:推 bitcch: 个人经验翻译前的prompt也很重要 可参考些开源工具的写法 02/04 19:26
86F:推 rnmrn: 好厉害 推推 02/04 20:13
87F:推 Quietlake: 推开发,太厉害了 02/04 20:20
88F:推 NovaWolf: 我是有买GPT的API额度啦 换算流量费没很贵 跟Sakura一起 02/04 20:36
89F:→ NovaWolf: 使用当两边对照 02/04 20:36
90F:→ NovaWolf: 喔对了 我是用Luna Translator 02/04 20:37
91F:推 deolinwind: github找sakurallm 02/04 20:59
92F:推 WashiJoe: 有自订翻译字典和生成电子书版本真是帮了大忙了 02/05 04:23