作者Daiwa (Daiwa)
看板C_Sharp
标题[问题] HtmlAgilityPack一直NullReferenceExcep
时间Mon Mar 21 21:06:07 2016
目前参考此Blog:
http://blog.xuite.net/metafun/life/244633345
尝试利用 HtmlAgilityPack 去解析网页的HTML标签
目标网页是专门用来观看各地风速预报的「WindGuru」:
http://www.windguru.cz/int/
经由FireFox的相关XPath插件得知整张表格的第一个Col之XPath为:
/html[1]/body[1]/div[3]/div[2]/table[1]/tr[3]/td[1]/div[1]/table[1]
在模仿前述网页进行实作时,发现在程式读取到第一个table标签时,会出现NullReferenceException
/html[1]/body[1]/div[3]/div[2]/
table[1]/tr[3]/td[1]/div[1]/table[1]
反覆看了好几次路径及上网爬了资料,还是无法解决
以下是我的未完成程式码片段,麻烦各位前辈给点提示...谢谢大家
static void Main(string[] args)
{
string targetUrl = "
http://www.windguru.cz/int/";
WebClient client = new WebClient();
MemoryStream ms = new MemoryStream(client.DownloadData(targetUrl));
// 使用预设编码读入 HTML
HtmlDocument doc = new HtmlDocument();
doc.Load(ms, Encoding.Default);
// 装载第一层查询结果
HtmlDocument docStockContext = new HtmlDocument();
string targetNode = "/html[1]/body[1]/div[3]/div[2]/table[1]/tr[3]/td[1]/div[1]/table[1]";
docStockContext.LoadHtml(doc.DocumentNode.SelectSingleNode(targetNode).InnerHtml);
Console.WriteLine("OK...");
Console.ReadLine();
}
--
Sent form my Apple Watch.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.127.251.185
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_Sharp/M.1458565578.A.4D0.html
1F:→ Litfal: 你是要抓哪个东西?为什麽不用id... 03/21 22:10
2F:→ Litfal: 而且实际算你抓的div[3]/div[2]里面的确没有table阿 03/21 22:11