作者ROCKIT (ROLL)
看板PHP
标题[请益] 有没有人有使用Crawler的经验压
时间Wed Sep 1 21:11:52 2010
由於研究需要从网站上抓资料下来
试了一些现有的套件
网站的原始码是抓下来了
但是中文的地方全变乱码了...
可是我要分析的偏偏就是这些中文的文字...
请问有人有相关的经验吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.96.163
1F:推 flamerecca:有尝试将抓下来的资料用另一个编码打开吗? 09/01 21:25
2F:→ ROCKIT:我如果用浏览器开启,是可以正常显示,但是我要是直接用 09/02 13:43
3F:→ ROCKIT:其他IDE开启,就都是乱码,因为我还要将这些文字INSERT 09/02 13:44
4F:→ ROCKIT:进资料库....要做文字的比较分析,这样应该会有问题... 09/02 13:44