作者Hsins (迅雷不及掩耳盗铃)
看板LaTeX
标题[心得] LaTeX 与 Word 格式转换
时间Thu Jul 16 06:06:15 2020
如果使用 LaTeX 进行文章排版,但需要转换 Word 格式的话,这篇可以稍微给
些概念跟帮助,但可能起不太到多大的作用…
【前言】
这边不深入解释两者排版过程,只稍微提一下:
- LaTeX 是编辑 .tex 档案撰写 TeX 语法,最终透过不同发行版本将
他编译成 .pdf 文件,
- Word 可以储存成 .doc 或 .docx 文件,两者本质上存在差异,互
相转换的过程中有机率跑版。新版本都是使用 .docx 透过 XML 进
行编码
两者在储存成 .pdf 文件之後基本上都无法逆推回原来的格式,尤其是碰到表格
、项目符号、文献引用这类的非纯粹文字格式内容。
也就是说:
转换过程最多最多就是保持文字内容还在,其他部分内容都可能转换失败,需要
手动修改。
【Pandoc 使用教学】
不同的标注格式文件,有一个通用转换的多平台 Command-Line 工具叫做 pandoc
由於没有 GUI 介面,对於许多人来说可能不太友善。
一、安装
微软作业系统下可以用 scoop 或是 Chocolatey 安装,也可以到官网下载编译好
的 .msi 安装文件无脑下一步。其他作业系统就采用常用的套件管理工具:
```
# mac OS
$ brew install pandoc
# Debian/Ubuntu
$ sudo apt install pandoc
# Arch Linux
$ sudo pacman -S pandoc
# Windows
$ scoop install pandoc
```
二、设定好文件样式
先设定好 Word 的文件样式方便转换,并且储存为一个范例文件
这个请参考:
https://www.youtube.com/watch?v=hU-1vofgS3g
三、格式转换
```
# 直接转换,不在意格式(基本上类似复制下来贴到记事本啦…)
# 格式: pandoc <input.tex> -o <output.docx>
$ pandoc main.tex -o main.docx
# 使用模板,按照范例文件规定格式转换
# 格式: pandoc <input.tex> --reference-doc=<template.docx> -o <output.docx>
$ pandoc main.tex --reference-doc=template.docx -o main.docx
# 指定 .bib 导入参考文献
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx -o main.docx
```
四、进阶操作
上述大概可以转个 50% 吧…更多一点的就必须给定 LaTeX 引擎
文献引用和图片标注可以透过 filter 处理,以下是我常用的处理方式
```
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx
--filter=pandoc-crossref
--pdf-engine=xelatex
-o output.docx -w docx
```
其中关於 pandoc-crossref 可以从下面网址取得
https://github.com/lierdakil/pandoc-crossref
直接到 release 页面下载特定作业系统的进行安装
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.37.86 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/LaTeX/M.1594850778.A.9FE.html
2F:推 ssweet: 感谢提供 07/16 19:20
3F:推 st1009: 推推 07/17 07:10