Re: [請益] parser 文字

時間Sun Sep 28 13:46:02 2014

原文恕刪想請問前輩們小弟在parser網頁遇到一個新的問題就是用原本的 simple_parser_dom的工具來parser http://tour.taitung.gov.tw/zh-tw/Home/Index 會出錯問題1 : 如何解再來小弟到處研究了一下用了另一個 curl <?php # Use the Curl extension to query Google and get back a page of results $url = "http://tour.taitung.gov.tw/zh-tw/Home/Index"; $ch = curl_init(); $timeout = 5; curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); $html = curl_exec($ch); curl_close($ch); # Create a DOM parser object $dom = new DOMDocument(); # Parse the HTML from Google. # The @ before the method call suppresses any warnings that # loadHTML might throw because of invalid HTML in the page. @$dom->loadHTML($html); # Iterate over all the <a> tags foreach($dom->getElementsByTagName('a') as $link) { # Show the <a href> echo $link->getAttribute('href'); echo "<br />"; } foreach($dom->getElementsByTagName('a') as $v) { echo $v->getAttribute('title'); echo "<br />"; } ?> 用上面的語法是parser出來了，不過parser回來的字是亂碼試著加入 $v = mb_convert_encoding($v,"BIG5","UTF-8"); 結果會出錯請教這如何解呢 ? --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.158.112.110 ※ 文章網址: http://webptt.com/m.aspx?n=bbs/PHP/M.1411883164.A.113.html

1^F：→ bibo9901: parse (v) 和 parser (n) 真的那麼難分嗎@@ 09/28 14:02

2^F：→ woominin: 不懂什麼意思 - - 09/28 14:14

3^F：推 bency: 是一個動詞(parse)跟名詞(parser)的概念 09/28 15:25

4^F：→ KawasumiMai: 就好像你去teach一個人跟你去teacher一個人 09/28 16:07

5^F：→ KawasumiMai: 後面不會覺得怪怪的嗎 09/28 16:07

6^F：推 hit1205: $v 在這裡是一個 DOMElement，但你要轉換編碼的是裡頭的 09/28 22:08

7^F：→ hit1205: 字，比如說你要轉 $v->getAttribute('title'); 的話 09/28 22:09

8^F：→ hit1205: 那應該是直接轉 $v->getAttribute('title');，而不是 09/28 22:09

9^F：→ hit1205: 轉 $v 本身，因為 mb_convert_encoding 是轉字串用的 09/28 22:09

10^F：→ hit1205: 如果是要取內文請用 $v->textContent (PHP文件似乎沒提XD 09/28 22:16

11^F：→ hit1205: 另外，你讀的這網站本來就是 UTF-8 了，所以其實不用轉碼 09/28 22:16

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

PHP 板

Re: [請益] parser 文字

熱門看板

贊助商連結