作者kumahead (觀測代號1095)
看板C_Chat
標題[閒聊] 為了追停止代理的小說做了個翻譯工具
時間Wed Feb 4 17:18:55 2026
如題
為了追停止代理的小說
我做了個AI翻譯工具
幾週前去了趟日本玩
逛書店時赫然發現
國中開始追的小說還在更新
就是號稱羅馬數字教學,女主存在感越來越稀薄的,男主金次的奇妙冒險,<<緋彈的亞莉
亞>>
台灣尖端出版只到39,日本已經出到44了
尋思現在AI翻譯水準已經不差了,也買得到日文電子書
心一橫,就買了39~44的日文電子書,回來開發個翻譯工具
最初的想法很簡單
讓AI對照39集的中日版本,建立角色、招式、專用術語的翻譯字典
再讓AI參考字典對40~44進行翻譯即可
自然踩了許多坑
* 許多句子會翻譯失敗
* 翻譯夾雜著註解&思考過程
* 新角色&招式因為不在字典裡,翻譯會不連貫
最後花了數天改成以下流程:
1. 對照39集中日兩版建立字典
2. 讓AI掃一遍新書,抓出容易翻譯不一致的名詞加入字典
3. 手動調整字典裡新詞彙的翻譯
https://i.mopix.cc/KYvGbx.jpg
4. 讓AI將日文新書翻譯一遍
https://i.mopix.cc/NRK0zG.jpg
5. 用UI對照原文,人工檢查翻譯品質,輔以AI& Google 翻譯逐句修正
https://i.mopix.cc/QUlgcE.jpg
6. 合成電子書譯本
https://i.mopix.cc/QgDm2R.jpg
根據我自己的閱讀&語文能力,從頭完成一本輕小說的翻譯要花大約5小時上下
運氣差的話在第5步驟會發現重大人物名稱翻譯問題
得修改字典後退回第4步驟重新跑一遍
====以下有雷====
比方說40集退回幼童的拉斯普京娜
自稱チナ
一開始不知道是人名翻成“支那”
AI的譯文裡就不斷出現中國人
還有42、43出現的,貝瑞塔創辦的NGO的特工
Giusto 5號 的代號是The Father
一開始以為是義大利黑手黨,翻成父親
實際上是聖職者,要翻作神父
最頭痛的是44集的地雷女
自稱、稱呼他人、講話內容到處都是奇怪的變體簡稱
金次 kinji > 金P kinpi
響 hibiki > 響P hibipi
割腕 arm cut > 阿母卡 amuka
由於44集主角在男公關俱樂部臥底
一堆酒都不寫全名,都是簡稱
AI的翻譯品質明顯下降
====防雷結束====
總之,小說翻譯看完了後
為了讓這工具能多派上用場
又花了幾天改成多語種的翻譯工具,不再侷限於日翻中
興許能成為小說推廣工具?
發這邊看看有沒有出版社之類的有興趣
或是有類似斷更困擾的都可以留言或私我
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.70.138.212 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_Chat/M.1770196738.A.EC3.html
1F:推 laigeorge89: 你為什麼不要乾脆去學日文02/04 17:20
我自己的日文程度大約只能在日本自由行
讀小說會超卡XD
2F:推 jorden0804: 學日文看小說要花的時間一定比搞ai 久02/04 17:21
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:24:12
3F:推 XFarter: 幫推 看起來是直接 call API?02/04 17:23
call API 太貴
借了一台dgx spark 本地跑LLM
4F:推 steven3QXD: 原來停止代理了喔02/04 17:24
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:25:10
5F:→ jackz: AI就是斷更救星02/04 17:25
6F:推 ab100777: 之前看別人有問過說還會繼續出,結果出了1本又沒下文02/04 17:25
7F:推 a122771723: 推02/04 17:25
8F:推 arrenwu: 你能借到 DGX Spark也不容易啊XD 這台不便宜耶02/04 17:26
真的不便宜
但老實說不需要用那麼好
單純開發時想測多種不同的模型才借
最後用的是Qwen2.5 32b int4量化
理論上可以用3090跑
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:27:52
9F:推 inte629l: 居然dgx跑千問 羨慕QQ02/04 17:26
10F:推 sokayha: ai翻日文小說的對話應該是缺主詞的問題最大 加上幻覺問題02/04 17:26
11F:→ sokayha: 就變成連原文不在場的人都進來插話了 02/04 17:26
12F:推 sd2567: 你借得東西也不便宜啊02/04 17:26
13F:推 jorden0804: Ai再發展下去我看台灣出版社會完 進度慢又容易斷尾02/04 17:26
14F:→ sd2567: 出版社早就死得差不多了 02/04 17:27
15F:→ jackz: 小說用API真的很貴 漫畫還好02/04 17:27
16F:→ error405: 上個月騰訊有出開源翻譯工具 02/04 17:28
17F:推 junorn: 那麼大量的字不用本地LLM跑真的不便宜...是TranslateGemma02/04 17:29
18F:→ junorn: 嗎?02/04 17:29
19F:→ sokayha: 之前看地錯新本有人丟ai翻的試看版 看了沒幾段滿腦問號、 02/04 17:29
20F:→ sokayha: 自己對照完原文發現問題在哪後 就乖乖回去啃日文直到看完02/04 17:29
21F:→ sokayha: 那兩本了 02/04 17:29
22F:→ junorn: 阿推完文才看到用的模型,抱歉 02/04 17:29
23F:推 arrenwu: DGX Spark 可以跑比 32B 強很多的模型吧 02/04 17:30
主要是希望能壓低硬體需求
畢竟這台dgx spark 是借來的
這週就得還
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:31:05
24F:→ arrenwu: 長久地來說,看得懂日文當然是比較好的 因為日中轉換總是02/04 17:30
25F:→ arrenwu: 避免地會因為語言結構不同而有失真的部分02/04 17:30
26F:推 XFarter: 如果有 Ground truth + 文意表的話02/04 17:31
27F:→ XFarter: 好像其實不太需要本地 LLM,用上下文窗口大一點的 LLM 含 02/04 17:31
28F:→ XFarter: 糾錯的成本及效率,也許比直接架 Qwen 更好? 02/04 17:31
29F:推 ElfFail: 這個有沒有辦法翻譯一些日文遊戲的文本呀,之前一直很想 02/04 17:31
30F:→ ElfFail: 把梅露可物語的劇情補完但礙於沒有翻譯( 02/04 17:31
台版梅路可玩家+1
理論上做得到
但目前這個工具是用來處理epub電子書的
從遊戲裡抓文字檔出來我還沒研究過
我知道有些解決方案是加上ocr
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:34:11
31F:→ XFarter: 就算用 4090 甚至以上 GPU 跑模型,VRAM & RAM 太低的話 02/04 17:33
32F:→ XFarter: 單次 Response 的速度也挺慢的吧 QQ 02/04 17:33
33F:推 mk4188623: 如果說個別幫小說建立關鍵字的資料庫呢?不知道可不可 02/04 17:33
34F:→ mk4188623: 行 02/04 17:33
35F:→ mk4188623: 這樣至少翻譯專有名詞的時候不會出錯 02/04 17:33
把步驟2、3拆出來單獨用應該就可以了
36F:→ mk4188623: 但如果資料庫內容有來自不同出版社的小說的話,02/04 17:33
37F:→ mk4188623: 版權問題感覺會很麻煩就是02/04 17:33
38F:→ XFarter: @Elffail 你有辦法把文字表吐出來就可以 如果是 RM 類型02/04 17:34
39F:→ XFarter: 的遊戲的話用 Mtool 甚至可以吐 json 的 Key value table02/04 17:34
40F:→ XFarter: 02/04 17:34
41F:推 a37805: 我從五十音不會到基本可以正常速度讀大概花了一年 02/04 17:35
42F:→ a37805: 每天讀日文4hr假日8hr以上 剛開始還要自己去買教材或是上 02/04 17:35
43F:→ a37805: 網找教材來讀 給想要自學的參考 02/04 17:35
44F:推 ElfFail: 因為梅露可目前是已經有單機版本了,所以應該是能從裡面 02/04 17:35
45F:→ ElfFail: 找到文本檔案 不過這又是一個要去問的知識了( 02/04 17:35
46F:推 arcanite: 推02/04 17:35
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:36:26
47F:→ dnek: 勇者02/04 17:37
48F:推 NCTUwestbook: 推推 這個有辦法結合日版的bookwalker嗎02/04 17:38
只要能下載epub檔就能用
49F:推 pttmybrother: 推 光是要做成電子書我就卡住了==02/04 17:38
我是直接從google 圖書下載自己買的電子書XD
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:39:28
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 17:40:42
50F:推 XFarter: 像梅路可這種 Unity Engine 的話我記得好像也有現成的工 02/04 17:40
51F:→ XFarter: 具能匯出,比較知名的就 SakuraTranslator? 02/04 17:40
52F:→ XFarter: 但我沒特別研究 大部分我有翻譯需求的都是 RM 做的黃遊..02/04 17:41
53F:→ XFarter: . 02/04 17:41
54F:→ XFarter: 這些文本翻譯的匯入匯出工具 Mtool 其實非常成熟 02/04 17:41
55F:→ NoLimination: 我的經驗是一次一萬字比較穩 變翻變製作專用辭典 02/04 17:42
56F:→ NoLimination: 主詞省略導致翻譯搞錯還是要自己校對一下 02/04 17:43
57F:推 sokayha: 看的都是acg相關的話 動畫(聽)->gal game(聽+讀)->なろう 02/04 17:46
58F:→ sokayha: 上的小說 這條路徑學的會比較輕鬆且有動力就是了 02/04 17:46
59F:推 q16588188: Lunartanslator可以翻譯一些unity的小黃遊 02/04 17:46
60F:→ sokayha: holo en、holo id他們會日文的也幾乎都這樣學來的 02/04 17:47
61F:→ q16588188: 說錯,LunaTranslator 02/04 17:47
62F:推 denny8437: 推 02/04 17:51
63F:→ xga00mex: 可以去看對岸sakura翻譯相關的社群 02/04 17:55
64F:→ xga00mex: ai翻日文小說這塊蠻成熟了02/04 17:55
65F:→ xga00mex: 不過問題還是跟你遇到的一樣 躲不掉XD 02/04 17:56
66F:推 PSP1234: 我也是靠ai翻譯追很多台版斷尾的作品 02/04 18:00
67F:→ PSP1234: 只是精準度還是不夠高 有些地方還是要配合原文02/04 18:00
68F:→ magamanzero: 話說古板在問AI有沒有殺手級應用...我也只能笑笑w 02/04 18:02
69F:推 r30307: 可以問問GPT如何把AI翻譯的演算法進一步優化(02/04 18:03
70F:推 akway: AI好用+102/04 18:06
71F:推 bag0831: 推,每次都有鍵盤語言家叫人學日文,真的躁==02/04 18:10
72F:推 leophior: 現在學日文不如學ai 還能自產小說色圖 02/04 18:15
73F:推 avans: 推設計與分享 02/04 18:15
74F:推 windfeather: 推分享02/04 18:24
75F:→ s8018572: 想自己看 還要花5hr== 02/04 18:27
5hr裡3hr是閱讀&校正用時
2hr是AI 逐句翻譯
或許AI翻譯的迴圈有優化空間,但現在有點懶
76F:→ s8018572: 這麼大量 除非你錢很多 用api跑 根本像燒紙錢一樣 02/04 18:28
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:34:10
77F:推 awenracious: BW的可以嗎 我也買了一些台版斷尾日文小說 02/04 18:30
沒用過bw不太清楚
印象中能下載epub ,那就可以用沒問題
※ 編輯: kumahead (42.70.138.212 臺灣), 02/04/2026 18:36:24
78F:→ BruceChang: 用api應該品質提升會減少那個校稿時間 02/04 18:36
79F:推 Armour13: 校正真的很費時,如果沒有要分享給別人看,我都sakura翻一 02/04 18:42
80F:→ Armour13: 翻自己爽就好了 02/04 18:42
81F:推 Armour13: 不過亞莉亞這種長青樹,去對岸社群找找可能有熱心的小精 02/04 18:45
82F:→ Armour13: 靈用Ai翻好跟校正好的 02/04 18:45
83F:推 minipig0102: 哇 哇靠 02/04 18:49
84F:→ haseyo25: 應該說原文不是不能啃但是很燒腦沒辦法放鬆看 02/04 18:51
85F:推 bitcch: 個人經驗翻譯前的prompt也很重要 可參考些開源工具的寫法 02/04 19:26
86F:推 rnmrn: 好厲害 推推 02/04 20:13
87F:推 Quietlake: 推開發,太厲害了 02/04 20:20
88F:推 NovaWolf: 我是有買GPT的API額度啦 換算流量費沒很貴 跟Sakura一起 02/04 20:36
89F:→ NovaWolf: 使用當兩邊對照 02/04 20:36
90F:→ NovaWolf: 喔對了 我是用Luna Translator 02/04 20:37
91F:推 deolinwind: github找sakurallm 02/04 20:59
92F:推 WashiJoe: 有自訂翻譯字典和生成電子書版本真是幫了大忙了 02/05 04:23