作者piligo (霹雳狗)
看板EZsoft
标题[请问] 抽出PDF内嵌的字体
时间Thu Oct 13 23:29:42 2011
请教,最近遇到一份棘手的PDF电子档
http://ishare.iask.sina.com.cn/f/14375446.html
应该是为了防止复制所动的手脚
也就是内嵌的字体,是系统没有的字体,而且字体包了300多个
蛮好奇是哪套工具,可以做出这种机制的保护
另外想到的解决方法,除了OCR还想到抽取里面300多个字体出来
但爬了许久好像还没看到这种工具
另外,透过Foxit PDF Editor直接改原始档的字体也不能改
这种保护应该算跟内文本身就是图片同样难搞
谢谢
--
※ 发信站 :批踢踢实业坊(ptt.cc)
◆ From: 59.104.201.196
1F:→ oversky0:很有趣的保护。里面的字型内码和显示出来的字不一样。 10/13 23:50
2F:→ oversky0:像 b 这个字,copy 出来变成 F。 10/13 23:52
3F:→ oversky0:这样电子书就不能搜寻,等於癈了一半功夫。 10/13 23:53
4F:→ piligo:o大要传授一半功夫治疗PDF吗? OCR是最终疗法 XD 10/14 00:12
5F:推 feur:把他转成word 看看 10/15 08:29
6F:→ piligo:转成word状况一样 因为还是没字型可以对应 10/15 19:24
7F:推 ll1:原文书耶,好久没看到了 10/16 10:47
8F:→ rick65134:字形替换就无解了啦 整个都乱掉了 不可逆的替换 10/18 01:34
9F:→ firejox:找一台够能出取字体的扫描机... 10/18 20:29