作者hpo14 (雨)
看板RegExp
标题Re: [问题] 该怎麽写(改善) 我的 Regexp
时间Sat May 11 02:52:24 2013
※ 引述《No (you stay there)》之铭言:
: ※ 引述《hpo14 (雨)》之铭言:
: 我用JavaScript测试的
: 但应该差不多,要是不能用中文的话,把中文转\uXXXX看看
: /cview\('(\d+)-(\d+)\.html',(\d+)[^第番]+(第\d+[卷话]|番外\d+)/
: ^^^ ^^^ ^^^ ^^^^^^^^^^^^^^^^^^^
: 共四个sub-group
感谢,非常好理解。
刚刚想说,预防还有例外发生,就去来源网站 (
http://www.8comic.com)
点开好几页,看还有没有其他种例外 @@", 结果哭哭了 ...
看来最快的方式是直接 /cview\('(\d+)-(\d+)\.html',(\d+)[^^]+? (.+?)</[af]
^^^^^Group 4
然後在程式内手动处理 Group 4 内带有 <font .+?> 跟 副标 的部份了 Q_Q
-----
我使用的 Tester & Tools 分别是
VBS ->
http://mdk-photo.com/Regex/
(之前有找到一个 Flash 写的,很不错,但是没记下网址)
Ruby ->
http://rubular.com/
把 Regexp 给图形化成 FSM 的
http://www.regexper.com/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.204.46.87
※ 编辑: hpo14 来自: 123.204.46.87 (05/11 02:58)
1F:→ Rplus:refiddle 05/11 14:50
2F:→ hpo14:睡了一觉起来改成如下结果第一篇的七种格式都通用 05/11 18:05
Rexexp:/cview\('(\d+)-(\d+)\.html',(\d+)[^^]+? (?:<.+?>)?(.+?)(?: .+?)?</[af]/
^^^^^^^^^^ ^^^^^^^^^
比对<font> 比对副标题
※ 编辑: hpo14 来自: 123.204.46.87 (05/11 18:06)