作者Gold740716 (项为之强)
看板Web_Design
标题Re: [问题] 每个段<p>入面的第一个<br>前面插入分号
时间Mon Oct 3 11:43:33 2016
闲闲的没事干,就随便做一做。
单纯用 regexp 的取代会太难写,
我是用 sed 。
======> fix_simicolon.sed <======
#!/usr/bin/sed -f
/<p class="calibre_11">/ {
:notmatch
#读取下一行
N
#若没有字串 '<br' 就跳到 :notmatch
/<br/ !b notmatch
#取代
s/<br/; <br/
}
========================================================
不太懂你的档案,
我是把 epub 解压後,
`OEBPS/Text/*.html` 全都改一遍。
最後再压缩成 ccged_ed.epub 。
sed 教学:
http://wanggen.myweb.hinet.net/ach3/ach3.html?MywebPageId=2016291456747925903#sed_and_awk
ccged_ed.epub :
http://wikisend.com/download/261386/ccged_ge.epub
这种问题在 linux/un*x 下会变得很简单。
※ 引述《Nitschke (下载至死)》之铭言:
: Thank thank everyone
: 一本德语字典
: 德语字典 .rtf file http://goo.gl/rhPkiL
: 德语字典 .ePub file http://goo.gl/2Aa3Eb
: 入面 每笔 单字 都被 "段落" 包住
: <p class="calibre_11">一笔单字</p>
: 我想在 每个"段落"入面 的 第一个 "breakline" 前面 插入 分号
: 请问需要下载甚麽
: 1. 工具 及
: 2. 方法 ?
: Find and replace all
: <p class="calibre_11">
: <span class="bold">
: 单字1
: </span>
: 不同的内容
: <br class="calibre1"/> //在第一个breakline前面插入分号
: 字义解释1
: <br class="calibre1"/> //其余的 breakline 不作更动
: 字义解释2
: <br class="calibre1"/> //其余的 breakline 不作更动
: 字义解释3
: </p>
: to
: <p class="calibre_11">
: <span class="bold">
: 单字1
: </span>
: 不同的内容
: ;<br class="calibre1"/> //在第一个breakline前面插入分号
: 字义解释1
: <br class="calibre1"/> //其余的 breakline 不作更动
: 字义解释2
: <br class="calibre1"/> //其余的 breakline 不作更动
: 字义解释3
: </p>
: ※ 编辑: Nitschke (61.18.110.123), 09/29/2016 09:45:49
: 推 Gold740716: :%s/<br class="calibrel"/;<br class="calibrel/g 10/02 10:25
: → Gold740716: myweb.ncku.edu.tw/~c34031328/upload/ccged_ge.rtf 10/02 10:44
: → Gold740716: http://wikisend.com/download/528924/ccged_ge.rtf 10/02 11:06
: → Hevak: 楼上你这样s///g转出去应该所有解释123前面都会加到分号吧 10/02 12:35
: → Gold740716: 好像是欸,没看清楚。 10/02 20:17
: ※ 编辑: Nitschke (61.18.110.123), 10/03/2016 08:42:12
: → Nitschke: 提供另一个.ePub file可作修改 http://goo.gl/2Aa3Eb 10/03 08:53
: → Nitschke: 谢谢两位 近来烦这个 搞到要上精神科 10/03 08:56
--
sent from mySQL.
--
※ 发信站: 梦之大地 (ccns.cc), 来自: 140.116.249.140
※ 文章网址: telnet://ccns.cc/
1F:推 foo: 这作者……02/30 22:66
2F:推 void: 奇文共赏!!02/30 28:19
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.116.165.150
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Web_Design/M.1475466218.A.E32.html
※ 编辑: Gold740716 (140.116.165.150), 10/03/2016 11:44:25
※ 编辑: Gold740716 (140.116.165.150), 10/03/2016 12:14:45
3F:推 Hevak: 原来可以这样用sed(笔记) 10/03 22:06
4F:→ Gold740716: sed 很强大的,而 awk 约等於 perl 的文字处理。 10/03 22:25
5F:→ Gold740716: 听说 ed 更强,也许我该先学 ed … 10/03 22:39
6F:→ Nitschke: Gold740716, 你打算送给我的救命档 我忘记下载 已经砍了 01/01 13:49
7F:→ Nitschke: 可以再放一次吗? 01/01 13:50