作者liptonbin (我还存在耶)
看板C_Sharp
标题[问题] 请教如何parsing网页
时间Thu Aug 11 14:50:39 2022
请问一下
我有底下网页的表格 想要用c#做parsing
例如想要抓出表格的第一栏和第二栏 (抓 <CENTER> 0 </CENTER> 中间的值)
0=36s
0=54s
....
第一栏总数相加 0+0+...+0+...=0
https://ibb.co/rQvBpxf
下面比较麻烦,格式比较不固定, (抓 30</a> </center> 前面的值)如最後一张图
0=1s
4=9s
...
...
第一栏总数相加 0+4+0+...+9+30+...+3+...+15+...+1+...+23...=85
https://ibb.co/Dw3rW7T
档案路径:
https://filebin.net/8nwar5cyuh2ioi46
请问c#上该怎麽做
非常感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.200.66.117 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_Sharp/M.1660200645.A.6C7.html
1F:→ ga009900: 可以试试看用 regular expression 08/12 11:16
2F:推 liaommx: 以爬虫的方式去抓抓看,剩下都是程式逻辑过滤资料 08/12 21:36
3F:推 liaommx: 关键字 HtmlNodeCollection 08/12 21:38
4F:推 wezmag: Html Agility Pack 可以试试 08/13 13:54