作者zmcx16 (zmcx16)
看板Soft_Job
标题[请益] 开源特定网站的爬虫程式会触犯法律吗?
时间Wed Jun 17 21:53:48 2020
如题, 想请问一下, 最近想写一个推特的图片下载程式, 不过看了下推特网站上的
api.twitter.com以及pbs.twimg.com的Robots.txt就是完全不给爬。
那如果我只写程式放到github上, 不提供编译好的实体程式, 并注明该程式只为了技术交
流使用并附上免责条款的话, 一样会有爬虫相关的法律问题吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.136.131.132 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1592402030.A.3B5.html
※ 编辑: zmcx16 (223.136.131.132 台湾), 06/17/2020 22:16:24
1F:推 king22649: 正常来说 应该不行 不过脸书爬虫机器人 也没再管规范 06/17 22:41
2F:→ king22649: 直接炸了别人的网站 看起来还没被告 给你参考 06/17 22:41
3F:→ vi000246: 如果是twitter应该是没关系 人家大到不怕你爬 06/17 23:21
4F:→ agogoman: robots不是一个规范 而只是约定俗成的 没有强制性 06/18 00:00
5F:→ superpandal: 看你有没有阻碍别人的运营 内容非法、爬爆别人server 06/18 01:49
6F:→ superpandal: 都是很危险 06/18 01:49
7F:→ superpandal: 脸书、twitter本身内容就从user来的 内容肯定没问题 06/18 01:51
8F:→ fr75: 美国法院最近不是才判爬公开网站都合法 像是LinkedIn 所以应 06/18 03:53
9F:→ fr75: 该没事 06/18 03:53
那则新闻我有follow到, 不过还是有点怕..., 怕被告的原因不是公开网站而是以其他名
目告你, 例如非善意使用他们的API之类的...。
10F:→ plscd: 如果要下载特定的推特图片 call api 不就能拿到网址了? 06/18 03:58
目前研究是要用他们的API就得申请开发者帐号, 可是那个API限制太严(每15分钟15次)
所以是倾向使用匿名的方式(先用headless browser拿到需要的cookie跟header, 再拿来
call推特API, 这方面有点灰色地带, 不知道会不会有伪造cookie跟token的名目说你是
非善意使用...。)
11F:推 dalconan: 你把他爬到挂了可能就会有法律问题了 06/18 08:47
12F:推 nfsong: 爬慢一点。10秒以上应该没事 06/18 11:28
13F:→ jobintan: 爬PornHub应该比FB或Twitter还有价值。wwwwwwwwww 06/18 12:27
※ 编辑: zmcx16 (223.136.131.132 台湾), 06/18/2020 23:00:30
14F:→ OrzOGC: 新手学爬虫时爬pornhub学习的特别快 06/18 23:42