作者Ibrahimovic (伊布)
看板Office
標題[算表] 下載網頁問題
時間Sun Jul 29 05:45:51 2018
軟體: Office Excel
版本: 2016
目前程度概述
在網頁裡右鍵選擇「檢視網頁原始碼」
裡面出現的東西都可以抓到Excel裡做裁貼並取出需要的部分
而本篇文的問題是
有些網站的資訊並不會顯示在右鍵「檢視網頁原始碼」裡面
例如這個網站
http://www.cmoney.tw/finance/f00026.aspx?s=3372
假設想抓取,細產業別裡的「電子上游-IC-封測」
https://i.imgur.com/bYLgMK0.jpg
網頁任意空白處按下右鍵選「檢視網頁原始碼」
只能找到{SubIndustry}
https://i.imgur.com/8ujQFgZ.jpg
然而在網頁上選住「電子上游-IC-封測」之後按右鍵選「檢查」
就可以查的到
https://i.imgur.com/lL1AyNr.jpg
但是這部分程度還不到
想請教各位大大這要如何抓取呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.1.9
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Office/M.1532814353.A.4EF.html
※ Ibrahimovic:轉錄至看板 Visual_Basic 07/29 05:46
1F:→ soyoso: ie automation,getelementsbyclassname找tb 07/29 11:02
2F:→ soyoso: split該outerhtml以<tb>,表格如固定的話位置在3 07/29 11:02
3F:→ soyoso: 再以replace取代</td> 07/29 11:02
感謝提點方向
※ 編輯: Ibrahimovic (218.164.1.9), 07/30/2018 01:47:15