作者StubbornLin (Victor)
看板Python
标题[范例] 用WebChuan抓取无名相簿的相片
时间Wed Oct 22 21:40:13 2008
http://0rz.tw/4c4Vp
我用WenChuan写了一个小程式
用来抓取无名的相簿
这其实还算蛮简单的
还可以有更复杂很多的应用
有兴趣可以参考看看
我也有包成.exe
想抓无名照片的也可以直接使用喔 :P
--
易记学 程式设计教学
http://ez2learn.com/
易记学 程式设计讨论区
http://forum.ez2learn.com
VICTOR's 个人Blog
http://blog.ez2learn.com/
财报分析王
http://victorlin.serveftp.org/stock/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.170.176.176
1F:推 superGA:程式码没看 请问这能应付yahoo 999 error吗 10/22 23:41
2F:→ superGA:我对999 error的处理比较有兴趣:P 10/22 23:41
3F:→ StubbornLin:看来不只有我一个人遇到yahoo 999 = = 10/23 00:10
4F:→ StubbornLin:我没预料到居然有那种鬼机制 XD 10/23 00:10
5F:→ StubbornLin:抓了一阵子居然999 我没研究他判断999的方式 10/23 00:10
6F:→ StubbornLin:还有它到底是禁止了什麽 我猜应该是ip 10/23 00:11
7F:→ StubbornLin:我重新播号换个ip就好了 10/23 00:11
8F:→ StubbornLin:我觉得应该是抓图的方式太密集 = = 10/23 00:11
9F:→ StubbornLin:我想... 如果User-Agent用乱数决定 10/23 00:12
10F:→ StubbornLin:不知道它会不会认定是不同电脑 10/23 00:12
11F:→ StubbornLin:但如果只认ip 大概就只能延长抓的间格吧? 10/23 00:12
12F:推 qrtt1:还能换 proxy XD 10/23 00:26
13F:→ StubbornLin:喔喔 对厚 XD 10/23 00:36
14F:→ StubbornLin:那ok阿~ 遇到999就换个proxy 应该就ok吧@@? 10/23 00:37
15F:推 bizkit:google search 也档的超严格 可以玩玩看:p 10/24 02:26
16F:→ bizkit:random user-agent, referer, sleep interval都没啥用 10/24 02:26
17F:→ bizkit:或许只看ip ~ ~ 10/24 02:26
18F:→ StubbornLin:google search我没玩过 不过它那个自动完成我有玩过 10/24 12:45
19F:→ StubbornLin:我以前有捞过上百万笔的关联词资料 10/24 12:45
20F:→ StubbornLin:现在可能不行了 我猜应该现在捞没多久就被锁了 XD 10/24 12:45
21F:→ StubbornLin:我先丢一系列常见的单字 然後把它列出来的字词 10/24 12:55
22F:→ StubbornLin:全部加进去继续找关联字词 这样就会越来越多 10/24 12:55
23F:→ StubbornLin:最後应该是所有字词都会捞出来 10/24 12:56
24F:推 bizkit:看来我们在玩的东西很类似 嘿嘿嘿 10/24 18:52
25F:→ StubbornLin:後来那些关联词好像没有我想像中的有用= = 10/24 21:42
26F:→ StubbornLin:又或着我没有更仔细去研究 就没在玩了= .= 10/24 21:43
27F:推 bizkit:可以跟你伸data吗?:p 10/25 21:42