作者Wush978 (拒看低质媒体)
看板R_Language
标题[情报] 20131007 MLDM Monday: spideR series
时间Sun Oct 6 13:19:38 2013
[关键字]: R, crawler, encoding
[出处]:
http://www.meetup.com/Taiwan-R/events/136880372/
[重点摘要]:
内容对於有要抓资料需求的朋友很有帮助喔!
聚会议程:
1910 ~ 1920 Warm Up
1930 ~ 1950 TBA (和 Rcurl encoding 相关) (Yi-Hsi Lee)
此讲次藉由一个 spideR 的实作案例 (爬大陆资讯网站) 与大家分享以下体验:
(1) 如何利用 Taiwan R User Group 过去的 MLDM Monday -- spideR Series 讲次,
7 日内从无到有学会以 R 语言实作 spider (spideR);
(2) 使用 R 语言实作跨国 spider 时会遇到的编码 encoding (看似乱码) 问题,
以及解决方法;
(3) 开发 spider 应该的一些其它重要议题 (法律、匿踪与拟人化 [机器人不是机械化的
人])。
--
欢迎到ptt R_Language版分享R 的相关知识
欢迎加入 Taiwan R User Group :
http://www.facebook.com/Tw.R.User
聚会报名
http://www.meetup.com/Taiwan-R/
聚会影片
https://www.youtube.com/user/TWuseRGroup
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 1.34.138.85