作者Hsins (迅雷不及掩耳盜鈴)
看板LaTeX
標題[心得] LaTeX 與 Word 格式轉換
時間Thu Jul 16 06:06:15 2020
如果使用 LaTeX 進行文章排版,但需要轉換 Word 格式的話,這篇可以稍微給
些概念跟幫助,但可能起不太到多大的作用…
【前言】
這邊不深入解釋兩者排版過程,只稍微提一下:
- LaTeX 是編輯 .tex 檔案撰寫 TeX 語法,最終透過不同發行版本將
他編譯成 .pdf 文件,
- Word 可以儲存成 .doc 或 .docx 文件,兩者本質上存在差異,互
相轉換的過程中有機率跑版。新版本都是使用 .docx 透過 XML 進
行編碼
兩者在儲存成 .pdf 文件之後基本上都無法逆推回原來的格式,尤其是碰到表格
、項目符號、文獻引用這類的非純粹文字格式內容。
也就是說:
轉換過程最多最多就是保持文字內容還在,其他部分內容都可能轉換失敗,需要
手動修改。
【Pandoc 使用教學】
不同的標註格式文件,有一個通用轉換的多平台 Command-Line 工具叫做 pandoc
由於沒有 GUI 介面,對於許多人來說可能不太友善。
一、安裝
微軟作業系統下可以用 scoop 或是 Chocolatey 安裝,也可以到官網下載編譯好
的 .msi 安裝文件無腦下一步。其他作業系統就採用常用的套件管理工具:
```
# mac OS
$ brew install pandoc
# Debian/Ubuntu
$ sudo apt install pandoc
# Arch Linux
$ sudo pacman -S pandoc
# Windows
$ scoop install pandoc
```
二、設定好文件樣式
先設定好 Word 的文件樣式方便轉換,並且儲存為一個範例文件
這個請參考:
https://www.youtube.com/watch?v=hU-1vofgS3g
三、格式轉換
```
# 直接轉換,不在意格式(基本上類似複製下來貼到記事本啦…)
# 格式: pandoc <input.tex> -o <output.docx>
$ pandoc main.tex -o main.docx
# 使用模板,按照範例文件規定格式轉換
# 格式: pandoc <input.tex> --reference-doc=<template.docx> -o <output.docx>
$ pandoc main.tex --reference-doc=template.docx -o main.docx
# 指定 .bib 導入參考文獻
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx -o main.docx
```
四、進階操作
上述大概可以轉個 50% 吧…更多一點的就必須給定 LaTeX 引擎
文獻引用和圖片標註可以透過 filter 處理,以下是我常用的處理方式
```
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx
--filter=pandoc-crossref
--pdf-engine=xelatex
-o output.docx -w docx
```
其中關於 pandoc-crossref 可以從下面網址取得
https://github.com/lierdakil/pandoc-crossref
直接到 release 頁面下載特定作業系統的進行安裝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.37.86 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/LaTeX/M.1594850778.A.9FE.html
2F:推 ssweet: 感謝提供 07/16 19:20
3F:推 st1009: 推推 07/17 07:10