作者rkcity (喵。罐頭)
看板Perl
標題[問題] web gzip decode
時間Wed Sep 8 03:49:38 2010
最近使用 IO::Socket::INET 抓網頁資料做parse
可是有些網站回傳的資料都經過gzip壓縮
( Content-Encoding: gzip )
找了一下cpan上的模組 好像都是對file做加解密
我只要單純的將透過socket抓取到的gzip資料(純量變數) 做decode
請版上的大神能不能給個方向呢 m(_ _)m
--
◣ █◤ ◥ ◥ ◤ ◆
◥ ◣ ◢ ◣ ◢ █◣ ? ◣ ◢ ◣ ◆
ψrkcity
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 58.114.146.67
1F:推 imce:Archive::TarGzip 看看是否符合您的需求 09/08 12:01
2F:→ jlovet:為什麼不要直接用wwwmechanize 09/08 17:12
3F:推 OuTian:http request 不要送 Accept-Encoding 就好了 09/08 18:42
4F:→ rkcity:嗯嗯 後來有用上面的方法解決了 謝謝^^ 09/08 21:14
5F:→ kornelius:為什麼不用 Web::Scrapper ? 09/16 20:37
6F:→ rkcity:看了一下Web::Scraper 這個應該是針對HTML DOM跟CSS 09/27 02:26
7F:→ rkcity:不過我處理的不是web page 還是謝謝k大喔^^ 09/27 02:27
8F:推 jackieku:可以參考HTTP::Message的code 裡面有解gzip, bzip2, etc 12/14 15:02