作者wu860125 (wu860125)
看板Python
标题[问题] 爬虫取父节点後get报错
时间Sat Feb 13 10:20:11 2021
https://i.imgur.com/wPKbqPJ.jpg
程式码如上图,最後一行报错
https://i.imgur.com/nUBd4vz.jpg
是否不能在取完父节点後再用get? 或其他地方有错?
HTML结构是<a href=“”><h3>文章标题</h3></a>
范例网址如下,想爬所有文章标题的网址,想请教应该怎麽修改? 谢谢
https://www.bnext.com.tw/categories/semiconductor
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 110.30.176.219 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1613182813.A.DF9.html
1F:推 chickengod: 我猜是这样 find_parents() return list 02/13 11:41
2F:→ chickengod: find_parents()[0].get() 02/13 11:41
3F:→ chickengod: find_parent().get() 02/13 11:41
4F:→ chickengod: 然後那个 可以试试 docker + rsshub + ttrss 02/13 11:49
5F:→ chickengod: 如果有rss的网站不用自己爬w 02/13 11:49
6F:推 supremebboy: 学着看错误讯息吧 讲的很清楚了 02/13 15:46
7F:→ wu860125: 原来是find_parent() 感谢c大 02/13 16:35