作者edl2000 (Eduardo)
看板Python
標題[問題] 關於爬網頁的新手問題
時間Wed Oct 2 17:38:17 2019
看了一些網路上的教學之後開始練習抓資料
PTT跟yahoo有固定的html 格式的可以抓到了
不過巴哈姆特的排行榜卻很奇怪
https://forum.gamer.com.tw/?page=1&c=21
我看他的資料都在 Javascript裡面
這樣要怎麼處理...有沒有可以指點一下 >_<"
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.61.134.145 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1570009100.A.FFB.html
1F:→ dododavid006: 我之前有用過一種作法是把資料從 js 找出來 然後加 10/02 21:34
2F:→ dododavid006: 上一段轉成 json 的 code 再整個拿去給 nodejs 跑 10/02 21:34
3F:→ dododavid006: 跑完有就 json 了 不過這樣其實挺麻煩的 10/02 21:35
4F:→ dododavid006: 就有 10/02 21:35
5F:推 vi000246: 用regex把整段js存起來 再找能直譯js的lib 10/03 09:12
6F:→ edl2000: 好的,謝謝兩位,來試試看 10/03 09:21
7F:→ frank910138: 去看js 內容有辦法抓出來改寫成python? 10/03 18:49
8F:→ TitanEric: 花時間改寫不如丟給nodejs跑比較快 10/03 19:47
9F:推 Falldog: 不就直接call他的api就好了嗎!? 10/10 22:17
11F:→ edl2000: 看到了,感謝指點,已經成功爬回來寫入檔案 10/14 18:26