Soft_Job 板


LINE

打算寫一支591爬蟲 有符合條件的新物件就跳出通知 因為懶得架server跟DB 想用chrome extension來做 稍微做了研究 發現要取得房屋列表json 需要先進到591頁面 取得cookie的591_new_session跟html裡面<meta>中的csrf-token 分別放到get reqeust中的header跟cookie 才能取到我要的資料 想問用js能做得到嗎 還是一定要後端語言呢 如果要做成後端 要能設定定時執行 還要考慮跨電腦同步db問題 只打算存物件id用來判斷重複物件 想到就覺得麻煩... 好像還沒看過有人用純js寫爬蟲的? --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.68.118.128 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1595071872.A.0BE.html ※ 編輯: vi000246 (219.68.118.128 臺灣), 07/18/2020 19:37:55
1F:→ diabloevagto: 可以 07/18 19:33
2F:→ milktea736: 應該可以用 nodejs 試試? 07/18 19:34
3F:推 alihue: JS 會先處理 CORS 到爆 07/18 19:35
cors超討厭的 害我的載片小幫手沒辨法在頁面inject預覽圖 只能用開新視窗的方式 ※ 編輯: vi000246 (219.68.118.128 臺灣), 07/18/2020 19:39:50
4F:→ dreamnook: 可以 查apify 07/18 19:51
5F:→ dreamnook: 啊 不過我抓的是靜態頁面 可能不符 07/18 19:52
6F:→ MOONY135: 非常討厭CORS 07/18 19:54
7F:→ MOONY135: python他不香嗎 07/18 19:54
8F:→ MOONY135: db跟server 用docker不就幫你裝好了 07/18 19:55
9F:推 yahooc: 真香 07/18 19:57
10F:推 x123356: 我覺得你可以先搞懂為什麼會有CORS存在 還有api gateway 07/18 20:00
11F:→ leo5916267: 不然直接去591客服問怎麼爬你們家的網頁 07/18 20:40
12F:→ MOONY135: https://reurl.cc/9Elgea + cron 給我香起來 07/18 20:59
13F:→ guanting886: .... 07/18 21:41
14F:推 seal0112: 用node.js寫 不會很難 用js browser會因為cors擋 07/18 21:43
15F:推 BlacksPig: 11樓意見不錯,已笑翻 07/18 21:43
16F:推 fantasychese: 最近剛好在學 你須要的是Puppeteer 07/18 23:35
17F:推 Ayukawayen: extension在background發XHR應該就不會被CORS擋 07/18 23:51
18F:→ Ayukawayen: 不過要先在manifest的permissions把目標網域加進去 07/19 00:03
19F:推 Mamann: 直接nodejs不用cors啦 07/19 00:21
20F:推 zxc8899546: 用cheerio處理html 抓取你要的部分就好 07/19 00:23
21F:→ vi000246: 大家講的都是node.js 看來只能用後端寫了 07/19 01:21
22F:→ TakiDog: 在瀏覽器執行一定撞cors,載片我都寫Python 07/19 01:31
23F:→ TakiDog: 直接把連結用 書籤放js丟給python後端XD 07/19 01:32
24F:→ leo5916267: cors可以關掉瀏覽器的cors看看,或是你webpack用proxy 07/19 02:31
25F:→ leo5916267: 繞過去,但就只是自己用爽的而已 07/19 02:31
26F:→ vi000246: 我打算用python寫了 買個便宜主機設定cron job 07/19 02:57
27F:→ vi000246: 資料庫用jsonbin 應該能解決我的問題 07/19 02:57
28F:推 kewang: SSR 還好,如果你是 CSR 的話就一定要用後端處理了,puppe 07/19 09:50
29F:→ kewang: teer 操作萬解 07/19 09:50
30F:→ apotatostory: 前端我用angular 框架 用proxy 啟動不會cors哦 07/19 12:17
31F:→ qq076qq076: 樓上,ng就是幫你起了一個本地的node伺服器做proxy啊. 07/19 15:15
32F:→ qq076qq076: .. 07/19 15:15
33F:推 chatnoir: 有proxy當然不會有cors啊 =_= 07/19 15:57
34F:→ Hsins: GitHub Actions 就能搞定的東西,為什麼要自己租伺服器? 07/19 19:07
35F:推 Hitmear: 591我之前用python直接打request,一下就搞定了 07/20 14:46
36F:→ Hitmear: 放在heroku上也免費 07/20 14:47
37F:推 jihon2002: 這樣找租屋變好方便XD 07/21 01:26
38F:→ jobintan: Heroku免費的應該有限制吧!還是去官網看一下比較好。 07/21 08:02
39F:→ vi000246: heroku我記得一天要休眠6小時 沒人戳也會自動休眠 07/21 08:57
40F:→ infixman: heroki不是綁信用卡就不用休眠? 07/22 09:58
41F:→ infixman: *heroku 07/22 09:59
42F:→ aa06697: 11樓XD 07/23 14:33







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Boy-Girl站內搜尋

TOP