作者kyo0010 (~KYO~)
看板C_Sharp
标题[问题] 抓网页的几个小问题
时间Tue Nov 25 21:47:06 2014
WebClient wc = new WebClient();
wc.Encoding = Encoding.UTF8;
string result = wc.DownloadString(htmlStr);
textBox1.Text = result;
很简单的几句而已 想把网页的资料抓下来
成功把HTML抓下来了 想解析的时候发现抓下来的HTML有些DIV 里的TR 跟 TD 都不见了
只看的到
<div id="m"><div id="table01">
(消失的TR跟TD)
</div> <br></div>
可是要的值都在消失的TD里面
想了整天不知道怎麽解....
想求大大们提点一下小弟
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.15.11.132
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/C_Sharp/M.1416923228.A.655.html
※ 编辑: kyo0010 (39.15.11.132), 11/25/2014 21:47:47
1F:推 Peruheru: 你要说的是table吧?div底下怎麽会直接放tr和td? 11/26 08:32
2F:→ Peruheru: 另外回回归问题,我猜那是因为那些资料是js产生的 11/26 08:32
3F:→ Peruheru: 你抓的资料大概是网页刚产生的状态,所以没有动态内容 11/26 08:33
4F:推 Peruheru: 我是不太清楚纯靠c#自己刻要怎麽做... 11/26 08:37
5F:→ Peruheru: 我的话只会想到靠其他东西来完成,如phantomjs之类的 11/26 08:38
6F:推 a926: 你可能要在找一下,我猜你要的内容是Ajax做出来的 11/26 10:09
7F:→ a926: 找他call的回传资料的网址 11/26 10:10
8F:推 Litfal: 开浏览器监视一下HTTP活动,应该蛮容易找到问题点的 11/28 15:50