作者lccf (~(⊙o⊙)~)
看板Wikipedia
标题Re: [问题] wikipedia API
时间Tue May 8 08:22:48 2012
※ 引述《renmax (锻翼)》之铭言:
: 各位好
: 这几天都在研读wikipedia API的相关文章
: 目的是抓wikipedia上某些群组资料下来
: 不过,我发现到什麽叫做万事起头难的窘境
: 再加上英文实在是很不行的状况下
: 因此,想在这边请教各位前辈
: 我有看到几篇文章上说,wikipedia有给出两种典型的HTTP连接配置
: 分别是使用webclient 和 HTTPRequest,但是我依旧不懂如何去使用......
: 而且,也不知道要用哪种语言去撰写程式(是PHP还是JAVA?)
: 希望前辈们可以抽空指导一下,感激不尽
: 谢谢
可以去K一下这本
网路机器人、网路蜘蛛与网路爬虫 (Webbots, Spiders, and Screen Scrapers)
Michael Schrenk 着、张敏慧、蓝子轩 译
他是以php curl去实作网路机器人
大部分网路机器人的观念,他都有提到
至於php语法,可参考市面上的书籍
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.177.203
1F:推 renmax:的确要用curl才能抓到资料 谢谢 05/10 16:36