作者liptonbin (我還存在耶)
看板C_Sharp
標題[問題] 請教如何parsing網頁
時間Thu Aug 11 14:50:39 2022
請問一下
我有底下網頁的表格 想要用c#做parsing
例如想要抓出表格的第一欄和第二欄 (抓 <CENTER> 0 </CENTER> 中間的值)
0=36s
0=54s
....
第一欄總數相加 0+0+...+0+...=0
https://ibb.co/rQvBpxf
下面比較麻煩,格式比較不固定, (抓 30</a> </center> 前面的值)如最後一張圖
0=1s
4=9s
...
...
第一欄總數相加 0+4+0+...+9+30+...+3+...+15+...+1+...+23...=85
https://ibb.co/Dw3rW7T
檔案路徑:
https://filebin.net/8nwar5cyuh2ioi46
請問c#上該怎麼做
非常感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.66.117 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_Sharp/M.1660200645.A.6C7.html
1F:→ ga009900: 可以試試看用 regular expression 08/12 11:16
2F:推 liaommx: 以爬蟲的方式去抓抓看,剩下都是程式邏輯過濾資料 08/12 21:36
3F:推 liaommx: 關鍵字 HtmlNodeCollection 08/12 21:38
4F:推 wezmag: Html Agility Pack 可以試試 08/13 13:54