看板StarTrek
标 题Re: [情报] ST-DS9第一季台视版徵打字员
发信站Deep Space Nine (Mon Mar 10 09:50:37 2008)
转信站ptt!ctu-reader!ctu-peer!ctu-gate!news.nctu!news.ntu!ds9
※ 引述《[email protected] (hhoo)》之铭言:
: sorry,回了这麽久前的文,看里面的连结也失效了
: 看样子是字幕已经打好了
: 不过我还是贴一下相关工具,可以撷取内嵌字幕
: esrXP 字幕抽取程式 http://ideasoft.hp.infoseek.co.jp/esrXP/
: ptt使用者可以去avencode版找
: xelnaga写的 □ [转贴][教学] 抽取内嵌字幕 esrXP教学
早先放出时就拟好了A,B计划,万一A计划没用就行B计划。
果然,如我想的一样A计划失败,目前正行B计划。 XD
B计划比较困难些,也是同样采OCR方式,但不是使用上述之方法,我有一套方式。
这计划就是用编辑程式取出每一字幕出现的画面成为图档。
由於字是黄色,又因影片大部份在字幕所在地的背景是黑色,所以:
1.先把字幕切出来
2.把N句对白贴成一个较大的图档
3,用图片编辑程式,利用改变色相方式,使字幕色偏方某一色(如红色,最好是亮色系)
4.图片反白(负片)处理,去掉比较大的杂点
5.OCR
当然其中还涉及图片DPI及字幕的明析度等等....
我曾经试过一句,OCR出来只有10%的错误(10个字有1字出错)
目前我取出14-20集的图档出来了,但我还没时间处理
每个RAR档平均55MB,平均620句对白,算很多对白了 XD
--
我自创的组织:
http://myweb.hinet.net/home1/asccpu/DDSC/DDSC.htm
--
※ 发信站: 深太空九号(ds9.twbbs.org)
◆ From: 61.229.86.80