作者Ibrahimovic (伊布)
看板Office
标题[算表] 下载网页问题
时间Sun Jul 29 05:45:51 2018
软体: Office Excel
版本: 2016
目前程度概述
在网页里右键选择「检视网页原始码」
里面出现的东西都可以抓到Excel里做裁贴并取出需要的部分
而本篇文的问题是
有些网站的资讯并不会显示在右键「检视网页原始码」里面
例如这个网站
http://www.cmoney.tw/finance/f00026.aspx?s=3372
假设想抓取,细产业别里的「电子上游-IC-封测」
https://i.imgur.com/bYLgMK0.jpg
网页任意空白处按下右键选「检视网页原始码」
只能找到{SubIndustry}
https://i.imgur.com/8ujQFgZ.jpg
然而在网页上选住「电子上游-IC-封测」之後按右键选「检查」
就可以查的到
https://i.imgur.com/lL1AyNr.jpg
但是这部分程度还不到
想请教各位大大这要如何抓取呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.164.1.9
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Office/M.1532814353.A.4EF.html
※ Ibrahimovic:转录至看板 Visual_Basic 07/29 05:46
1F:→ soyoso: ie automation,getelementsbyclassname找tb 07/29 11:02
2F:→ soyoso: split该outerhtml以<tb>,表格如固定的话位置在3 07/29 11:02
3F:→ soyoso: 再以replace取代</td> 07/29 11:02
感谢提点方向
※ 编辑: Ibrahimovic (218.164.1.9), 07/30/2018 01:47:15