作者Bang3small (Bang三小)
看板Python
标题[问题] 请问reddit爬虫问题
时间Tue Oct 2 01:43:57 2018
爬虫新手想请教一下
最近使用bs4 req urllib等来爬取reddit的文章回覆 主要是用old.reddit
出现下面问题
https://i.imgur.com/RRgI4Ty.png
请问是我的div栏找错了吗 但我试了一下下面那行似乎只有【0】会出现这样 改其他数字就
可以了 请问该怎麽样把0去掉呢或着不用去直接爬?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 110.50.153.242
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1538415840.A.FB2.html
1F:→ neil987: 你的content_container就是你要找的那个div本身 你再一个10/02 09:53
2F:→ neil987: .div就是在container的div里面再拿div 没记错的话是这样10/02 09:53
※ 编辑: Bang3small (110.50.153.242), 10/02/2018 10:22:06
3F:→ atrisk: 错误讯息很清楚,content_container是list,却被当成tag用 10/03 17:52