作者yangfan (小羊)
看板CodeJob
标题Re: [请益] 请问网页扫描软体开发
时间Mon Sep 17 21:19:19 2007
※ 引述《tristone (tristone)》之铭言:
: ※ 引述《tristone (tristone)》之铭言:
: : 作者: tristone (tristone) 站内: Programming
: : 标题: [请益] 请问网页扫描软体开发
: : 时间: Mon Sep 17 17:39:43 2007
: : 请问我想要交叉分析不同网页的资料
: : for example: yahoo and pchome 首页新闻头条比较
: : 我想要把他自动存入data base中 作为比较target
: : 有没有办法开发出一套自动网页读取 的软体
: : 若有 我应该用哪种语言?
: : 谢谢
: : [email protected]
: 在详细一点 我想要能够分析出 这两个网页针对同一个新闻的反应时间
: 所以不能手动reload 我希望此软体可以自动reload 并且撷取头条新闻入data base
: 有人可以帮忙吗?
VB.NET JAVA C# 都可以办到
资料库看是用 ACCESS 或是 MYSQL 都行
流程是先将网页的原始码抓回来
再来滤掉HTML码
拆出新闻的位置
记下抓取时间
塞资料库
收工
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 125.230.172.90
1F:推 skya0:很多语言都办的到 先找一颗HTML的Parser 会省很多工 09/21 00:03