作者poga (波卡)
看板Ruby
标题Re: 想请教一下
时间Tue Oct 3 00:28:32 2006
※ 引述《jirlong (.)》之铭言:
: 若想要parse 网路上例如yahoo拍卖或像簿的data的话,
: 用php、ruby、python哪个比较好呢?
: 虽然想说想说不该在民进党的地盘问民进党和国民党哪个比较好,
: 不过等待解答的我还是硬着头皮问了。
btw 如果用ruby的话 有这个lib好像不错用
http://ariel.rubyforge.org/
Ariel is a library that allows you to extract information from
semi-structured documents (such as websites). It is different to existing
tools because rather than expecting the developer to write rules to extract
the desired information, Ariel will use a small number of labeled examples to
generate and learn effective extraction rules.
简单的说 就是你定义好文件的结构 然後丢几个范例给它
之後所有一样结构的网页(yahoo拍卖跟相簿应该都一样结构吧)
它都会自己去解析 好像很酷 yahooooo
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.170.70.190