作者lccf (~(⊙o⊙)~)
看板Wikipedia
標題Re: [問題] wikipedia API
時間Tue May 8 08:22:48 2012
※ 引述《renmax (鍛翼)》之銘言:
: 各位好
: 這幾天都在研讀wikipedia API的相關文章
: 目的是抓wikipedia上某些群組資料下來
: 不過,我發現到什麼叫做萬事起頭難的窘境
: 再加上英文實在是很不行的狀況下
: 因此,想在這邊請教各位前輩
: 我有看到幾篇文章上說,wikipedia有給出兩種典型的HTTP連接配置
: 分別是使用webclient 和 HTTPRequest,但是我依舊不懂如何去使用......
: 而且,也不知道要用哪種語言去撰寫程式(是PHP還是JAVA?)
: 希望前輩們可以抽空指導一下,感激不盡
: 謝謝
可以去K一下這本
網路機器人、網路蜘蛛與網路爬蟲 (Webbots, Spiders, and Screen Scrapers)
Michael Schrenk 著、張敏慧、藍子軒 譯
他是以php curl去實作網路機器人
大部分網路機器人的觀念,他都有提到
至於php語法,可參考市面上的書籍
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.177.203
1F:推 renmax:的確要用curl才能抓到資料 謝謝 05/10 16:36