作者rkcity (喵。罐头)
看板Perl
标题[问题] web gzip decode
时间Wed Sep 8 03:49:38 2010
最近使用 IO::Socket::INET 抓网页资料做parse
可是有些网站回传的资料都经过gzip压缩
( Content-Encoding: gzip )
找了一下cpan上的模组 好像都是对file做加解密
我只要单纯的将透过socket抓取到的gzip资料(纯量变数) 做decode
请版上的大神能不能给个方向呢 m(_ _)m
--
◣ █◤ ◥ ◥ ◤ ◆
◥ ◣ ◢ ◣ ◢ █◣ ? ◣ ◢ ◣ ◆
ψrkcity
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 58.114.146.67
1F:推 imce:Archive::TarGzip 看看是否符合您的需求 09/08 12:01
2F:→ jlovet:为什麽不要直接用wwwmechanize 09/08 17:12
3F:推 OuTian:http request 不要送 Accept-Encoding 就好了 09/08 18:42
4F:→ rkcity:嗯嗯 後来有用上面的方法解决了 谢谢^^ 09/08 21:14
5F:→ kornelius:为什麽不用 Web::Scrapper ? 09/16 20:37
6F:→ rkcity:看了一下Web::Scraper 这个应该是针对HTML DOM跟CSS 09/27 02:26
7F:→ rkcity:不过我处理的不是web page 还是谢谢k大喔^^ 09/27 02:27
8F:推 jackieku:可以参考HTTP::Message的code 里面有解gzip, bzip2, etc 12/14 15:02