作者jokkson (Jason)
看板CodeJob
标题Re: [请益] 请问网页扫描软体开发
时间Tue Sep 18 12:35:59 2007
我有写过类似的东西
也是把网页的资料抓下来分析,塞DB
我是使用vb.net。分析的部份是用正则表示式来达成。
正则表示式让你事半功倍。
※ 引述《yangfan (小羊)》之铭言:
: ※ 引述《tristone (tristone)》之铭言:
: : 在详细一点 我想要能够分析出 这两个网页针对同一个新闻的反应时间
: : 所以不能手动reload 我希望此软体可以自动reload 并且撷取头条新闻入data base
: : 有人可以帮忙吗?
: VB.NET JAVA C# 都可以办到
: 资料库看是用 ACCESS 或是 MYSQL 都行
: 流程是先将网页的原始码抓回来
: 再来滤掉HTML码
: 拆出新闻的位置
: 记下抓取时间
: 塞资料库
: 收工
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.223.249.73
1F:推 Blueshiva:是正规表示式吧... 09/18 12:40
2F:推 menjar:Crawler + Parser + analysis 09/18 12:56
3F:推 jokkson:正则、正规都有人用。原文是Regular Expression 09/18 14:50