作者charlie0228 (嚮往湛藍)
看板PHP
標題[請益] 抓取需要登入網站的原始碼
時間Wed Apr 11 11:36:13 2012
如標題
因為我想要從一些討論區抓取原始碼
但是那些頁面有登入跟沒有登入顯示的資訊不一樣
我是使用file()的方式抓取
可是這樣就只會抓到未登入的網頁原始碼…
有什麼方法可以讓他正確的抓到登入的資訊
然後讓我抓到我要的原始碼
我要抓的網站是:
http://my2.tmu.edu.tw
先謝謝各位了
--
posted from android bbs reader on my HTC Sensation Z710e
https://market.android.com/details?id=com.bbs.reader
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 203.71.94.31
1F:推 LaPass:呃.... 因為沒session.... 沒用php寫過這個.... 妳看看有沒 04/11 12:01
2F:→ LaPass:有模擬瀏覽器的libary 04/11 12:01
3F:推 kerash:看登入有沒有session,有的話copy下來放在header中丟過去? 04/11 12:27
4F:→ kerash:抓SessionID看看@@ 04/11 12:28
5F:推 kusoayan:curl ? 04/11 13:19
6F:→ charlie0228:我在到網路上爬文怎抓session出來好了 04/11 14:42
7F:→ charlie0228:自學真的需要努力查資料 04/11 14:42
8F:推 onininon:能抓到session資料的不是駭客嗎XD 04/11 15:43
9F:推 kerash:不用抓session資料啊,他的 cookie 好像有紀錄 session 04/11 16:13
10F:→ kerash:代表他可能是用這個 session 紀錄的,只要傳資料時設定這個 04/11 16:13
11F:→ kerash:session 就沒問題了,前提是要在這個session的存活時間中做 04/11 16:14
12F:→ kerash:存取,否則若session被清除就沒用了 04/11 16:14
13F:→ charlie0228:嗯嗯 我所學習的東西太基本了@@ 04/11 16:43
14F:→ charlie0228:回家之後再用電腦實作看看 04/11 16:46
15F:→ mervynW:請用 curl cookies 04/11 17:13