作者piligo (霹靂狗)
看板EZsoft
標題[請問] 抽出PDF內嵌的字體
時間Thu Oct 13 23:29:42 2011
請教,最近遇到一份棘手的PDF電子檔
http://ishare.iask.sina.com.cn/f/14375446.html
應該是為了防止複製所動的手腳
也就是內嵌的字體,是系統沒有的字體,而且字體包了300多個
蠻好奇是哪套工具,可以做出這種機制的保護
另外想到的解決方法,除了OCR還想到抽取裡面300多個字體出來
但爬了許久好像還沒看到這種工具
另外,透過Foxit PDF Editor直接改原始檔的字體也不能改
這種保護應該算跟內文本身就是圖片同樣難搞
謝謝
--
※ 發信站 :批踢踢實業坊(ptt.cc)
◆ From: 59.104.201.196
1F:→ oversky0:很有趣的保護。裏面的字型內碼和顯示出來的字不一樣。 10/13 23:50
2F:→ oversky0:像 b 這個字,copy 出來變成 F。 10/13 23:52
3F:→ oversky0:這樣電子書就不能搜尋,等於癈了一半功夫。 10/13 23:53
4F:→ piligo:o大要傳授一半功夫治療PDF嗎? OCR是最終療法 XD 10/14 00:12
5F:推 feur:把他轉成word 看看 10/15 08:29
6F:→ piligo:轉成word狀況一樣 因為還是沒字型可以對應 10/15 19:24
7F:推 ll1:原文書耶,好久沒看到了 10/16 10:47
8F:→ rick65134:字形替換就無解了啦 整個都亂掉了 不可逆的替換 10/18 01:34
9F:→ firejox:找一台夠能出取字體的掃描機... 10/18 20:29