作者SODAECHO1 (sily)
看板CodeJob
標題[發案] 收集無名帳號~(已成案)
時間Sat Aug 14 13:36:02 2010
案件狀態:已成案
發案人:silly
聯絡方式1:站內信
有效時間:越快越好
專案說明:無名帳號不重複名單350萬筆↑
預算:1.5w
接案者要求:都可以
接受新手承案否:沒意見
附註:一定是要是不重複的無名帳號名單,紀錄方法是
使用記事本紀錄!
例:
i25622
c25712
t25123
(350萬筆不重複名單)
我相信懂程式的可以使用軟體自動抓取無名帳號名單
(就像是自動收集Mail軟體一樣)
目前需要350萬筆不一樣的帳號名單!
當然有能力的人也可以收集更多名單 500萬↑
有問題在站內信給我吧!感謝
(以下內容鼓勵結案後填寫,可以詢問接案人願不願意暴光接案身份)
結案意見:
接案人:
評價(0-10):
說明:
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.252.40.253
現在是8/14 下午5點
蠻多人願意接這個案子的 (至少10人)
讓我不知道怎麼選擇 ! 有站內信給我的 我都會回復
站內信盡量告訴我大家的優勢 我相信這個板上很多人才 感謝大家^^
※ 編輯: SODAECHO1 來自: 111.252.40.253 (08/14 17:08)
已經找到人做了^^" 感謝大家來信
往後也許還會有類似的案件 在上來找大家幫忙吧 感謝!
※ 編輯: SODAECHO1 來自: 111.252.40.253 (08/14 19:21)
1F:推 yanli2:直接幫你寫程式讓你自己抓? 08/15 02:00
2F:→ jlovet:樓上,這樣怎麼知道到底抓了多少,一邊說可以抓一千萬 08/15 02:10
3F:→ jlovet:一邊說我只抓到一千 08/15 02:10
4F:推 pfory:程式抓不難,但是很容易沒幾筆就被鎖IP了 08/15 09:14
5F:推 WolfLord:配合多張網卡與撥號程式應該可解 08/15 10:02
6F:→ superpai:無名真正有在使用的ID有沒有1百萬都不知道@@ 08/15 10:10
7F:→ LewisHamiltn:重點是速度..案主好像很急 我昨天開程式抓幾個小時 08/15 10:33
8F:→ LewisHamiltn:也不過幾萬筆 要350萬看來要多機器+map reduce.. 08/15 10:33
9F:推 makiyolove:我抓到2W5就被999了ˊˋ 08/15 11:32
10F:推 abcabcabc:1台機器就可以了 多線程 同時每個給不同表頭 08/15 14:20
11F:→ abcabcabc:必要時定期切ip 我以前看過網路上有人有寫 08/15 14:21
12F:→ abcabcabc:大概10多分鐘可以抓百萬筆左右 08/15 14:21
13F:推 WolfLord:不要看我,不是我....(逃) 08/15 20:21
14F:→ slalala:各位請教一下 如果像Java HttpClient4同instance做request 08/15 20:43
15F:→ slalala:一樣也會出現999嗎??(具體觀念意思是同一session) 08/15 20:43
16F:推 WolfLord:那個重點在於伺服端怎麼指認你,而你要如何不讓對方辨識 08/15 20:59
17F:→ stdlib:有前輩可以提供些關鍵字嗎,我也想試著處理這類問題,謝謝! 08/15 21:32
18F:→ TonyQ:http client / proxy / html parser / crawler 08/15 21:42
19F:→ TonyQ:扯到 wolf 講的東西的話,可能會需要再加上route/pppoe 08/15 21:43
20F:推 abcabcabc:999是被yahoo買下之後才會有的新計倆吧? 08/15 22:20
21F:→ abcabcabc:tony講的都關鍵字 proxy的話 至少我以前試簡單切proxy法 08/15 22:22
22F:→ abcabcabc:對加了999後的yahoo沒效果 他發現了我的陰謀 得再加料? 08/15 22:23
23F:推 WolfLord:先思考一下:IE連上去後會回報什麼,以及SERVER會到什麼 08/16 02:39
24F:→ WolfLord:然後你能夠變動什麼?這樣仔細想想自然發現他拿什麼指認 08/16 02:39
25F:→ WolfLord:而你也可以拿什麼呼楞對方..... 08/16 02:40
26F:推 aadean:有意思..但來源ip有辨法用程式修改嗎? 08/16 11:02
27F:推 Marty:樓上 用proxy.... 08/16 12:34
28F:推 WolfLord:一般OPEN PROXY都會被列入黑名單,用PROXY很難躲的。除非 08/16 23:53
29F:→ WolfLord:放蠱攻佔殭屍堡壘,不過這樣是違法的。但是ADSL帳號爛掉 08/16 23:54
30F:→ WolfLord:就爛掉,你目標達到就好....所以最佳解是多張網卡勤換IP 08/16 23:55
31F:→ runtime:我以前抓過 手上應該不只350萬 我是WARM的作者 請來信恰談 08/20 00:54
32F:推 runtime:你們都想太多了 其實無名有Bug可以跳過999 08/20 11:05
33F:推 runtime:三年前的Bug沒想到留到現在還在...XD 08/20 11:07
34F:→ runtime:可以思考看看 什麼東西很頻繁存取 卻又不會被擋下來 08/20 11:07
35F:→ TonyQ:真的假的 這也太帥了 XD 08/21 18:51
36F:推 wansincere:這真的是不錯的課題 感謝分享 09/01 17:14
37F:推 xxxx9659:頻繁存取 卻又不會被擋下來 蜘蛛人嗎? 是嗎是嗎? 09/03 23:59
38F:→ hanbz:建立免洗新帳號? 09/14 06:03
39F:→ hanbz:還是透過yahoo的搜尋引擎去做網路蜘蛛? 09/14 06:04