作者mirasol0524 (solet)
看板Database
标题[资源] 求救爬虫高手
时间Tue Jul 19 15:51:15 2016
Hi,
我是个华语老师, 对语料库一窍不通,但最近接触後,我觉得可以将其融入语言教学。
最近异想天开的想利用大数据的概念,制作一个词网,可以帮助学生以主题式的学习。
(一般的教科书都只能提供有限的词表,我想利用大数据技术可以制作出真实、且量大的
词网)
所以自己就开始在网路上自学了一些爬虫的软体(import.io, kimono弄了半天才发现已关
闭)和语言(scrapy)。
四处撞墙了半天,才鼻青脸肿的来向各位请益。(不经一事,不长一智><)
目前希望从餐饮开始,所以自己研究了一下,可以从譬如说:
从爱评网上,将各类餐厅的菜单抓下来 (一定要将餐厅分类哦~)
爱评上很优秀的是它有menu这个网址,我想只要是爬虫高手应该不难爬吧~(I guess…
..)
http://www.ipeen.com.tw/shop/607566/menu
请有兴趣帮忙的高手email给我,
Email:
[email protected]
我可以出微薄的报酬(荷包不深。。。。),以报答大恩~~~
感温~~~~~!!!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.122.96.148
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Database/M.1468914678.A.D8A.html
1F:→ cocobox: 你可以到R_Language那边问看看. 07/20 15:08
2F:→ mirasol0524: 感谢~ 07/21 14:42