作者daniel76308 (嘿嘿嘿)
看板C_and_CPP
标题[问题] 如何用C++移除HTML的TAG
时间Tue Mar 31 08:51:59 2009
我想要用C++将无名网志的内文抓下来
但是里面包含了许多我不需要的元素
我只想要网志里面内文的部分
不知道有没有什麽办法可以移除或是只截取我要的部分
我自己的想法是把文章全部抓下来後再做处理
但是对C++很陌生
麻烦各位教学了
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.193.85.55
※ 编辑: daniel76308 来自: 123.193.85.55 (03/31 08:54)
1F:推 chrisdar:RegExp 03/31 10:41
2F:→ adrianshum:用 regex 实在太多情况处理不了, 找个 html lib 试吧 03/31 11:12
3F:→ daniel76308:请问html lib是....? 03/31 11:14
4F:→ adrianshum:JFGI 03/31 11:26
5F:→ MOONRAKER:其实找特定字串当作开头结尾再substr()也是可以土炮的啦 03/31 14:02
6F:→ u8906250:try tidy 03/31 20:24
7F:→ stonehomelaa:有其他script language更适合做这种事 03/31 23:12