作者wheado (principal component QQ)
看板R_Language
标题[问题] rvest与POST爬虫问题卡关(廉价航空)
时间Thu Sep 6 15:30:48 2018
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我想对抓取某廉价航空网站的特定资料,
目前对网站的已知的大概像这张图,
https://imgur.com/a/POOpAI6
POST包含From Data里面那些讯息,
然後按下收寻
跑出像是下面这张图的网页
https://imgur.com/a/X2uz0Ep
这样就可以用 Xpath 去找到里面的内容
如果用 html_session 可以怎麽做?
如果用一个 POST 可以做到吗?
要怎麽去分析这种"需要输入讯息才能找到想要的资料"这类的网路问题
[程式码]:
https://ideone.com/xXk4qS
[环境叙述]:
Win10 + R 64位元
[关键字]:
rvest post httr xml2
[其他]:
RSelenium 套件似乎是挂了
所以我想用html_session来解决
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.71.94.20
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1536219052.A.2AF.html