作者daniel76308 (嘿嘿嘿)
看板C_and_CPP
標題[問題] 如何用C++移除HTML的TAG
時間Tue Mar 31 08:51:59 2009
我想要用C++將無名網誌的內文抓下來
但是裡面包含了許多我不需要的元素
我只想要網誌裡面內文的部分
不知道有沒有什麼辦法可以移除或是只截取我要的部分
我自己的想法是把文章全部抓下來後再做處理
但是對C++很陌生
麻煩各位教學了
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.193.85.55
※ 編輯: daniel76308 來自: 123.193.85.55 (03/31 08:54)
1F:推 chrisdar:RegExp 03/31 10:41
2F:→ adrianshum:用 regex 實在太多情況處理不了, 找個 html lib 試吧 03/31 11:12
3F:→ daniel76308:請問html lib是....? 03/31 11:14
4F:→ adrianshum:JFGI 03/31 11:26
5F:→ MOONRAKER:其實找特定字串當作開頭結尾再substr()也是可以土炮的啦 03/31 14:02
6F:→ u8906250:try tidy 03/31 20:24
7F:→ stonehomelaa:有其他script language更適合做這種事 03/31 23:12