作者zmcx16 (zmcx16)
看板Soft_Job
標題[請益] 開源特定網站的爬蟲程式會觸犯法律嗎?
時間Wed Jun 17 21:53:48 2020
如題, 想請問一下, 最近想寫一個推特的圖片下載程式, 不過看了下推特網站上的
api.twitter.com以及pbs.twimg.com的Robots.txt就是完全不給爬。
那如果我只寫程式放到github上, 不提供編譯好的實體程式, 並註明該程式只為了技術交
流使用並附上免責條款的話, 一樣會有爬蟲相關的法律問題嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.131.132 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1592402030.A.3B5.html
※ 編輯: zmcx16 (223.136.131.132 臺灣), 06/17/2020 22:16:24
1F:推 king22649: 正常來說 應該不行 不過臉書爬蟲機器人 也沒再管規範 06/17 22:41
2F:→ king22649: 直接炸了別人的網站 看起來還沒被告 給你參考 06/17 22:41
3F:→ vi000246: 如果是twitter應該是沒關係 人家大到不怕你爬 06/17 23:21
4F:→ agogoman: robots不是一個規範 而只是約定俗成的 沒有強制性 06/18 00:00
5F:→ superpandal: 看你有沒有阻礙別人的運營 內容非法、爬爆別人server 06/18 01:49
6F:→ superpandal: 都是很危險 06/18 01:49
7F:→ superpandal: 臉書、twitter本身內容就從user來的 內容肯定沒問題 06/18 01:51
8F:→ fr75: 美國法院最近不是才判爬公開網站都合法 像是LinkedIn 所以應 06/18 03:53
9F:→ fr75: 該沒事 06/18 03:53
那則新聞我有follow到, 不過還是有點怕..., 怕被告的原因不是公開網站而是以其他名
目告你, 例如非善意使用他們的API之類的...。
10F:→ plscd: 如果要下載特定的推特圖片 call api 不就能拿到網址了? 06/18 03:58
目前研究是要用他們的API就得申請開發者帳號, 可是那個API限制太嚴(每15分鐘15次)
所以是傾向使用匿名的方式(先用headless browser拿到需要的cookie跟header, 再拿來
call推特API, 這方面有點灰色地帶, 不知道會不會有偽造cookie跟token的名目說你是
非善意使用...。)
11F:推 dalconan: 你把他爬到掛了可能就會有法律問題了 06/18 08:47
12F:推 nfsong: 爬慢一點。10秒以上應該沒事 06/18 11:28
13F:→ jobintan: 爬PornHub應該比FB或Twitter還有價值。wwwwwwwwww 06/18 12:27
※ 編輯: zmcx16 (223.136.131.132 臺灣), 06/18/2020 23:00:30
14F:→ OrzOGC: 新手學爬蟲時爬pornhub學習的特別快 06/18 23:42