作者locka (locka)
看板R_Language
标题[问题] xml_node转成text但保留tag资讯
时间Mon Jul 8 18:27:10 2019
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
版友好:
如题,想请问我用rvest的read_heml()爬下来的东西大概长这样
> test
{xml_document}
<html>
[1] <body><table border="1">\n<caption>title ...
如果执行 test %>% html_text() 则解析html标签 只剩下
[1] "title\n id\n aaa\n d\n ddd\n
e\n eee\n "
不知道能否单纯把爬下来的html转成字串,保留所有的标签呢?
想要的结果:
<table border="1">
<caption>title</caption>
<tbody>
<tr>
<th>id</th>
<td colspan="3">aaa</td>
</tr>
<tr>
<th style="width:15%">d</th>
<td style="width:35%">ddd</td>
<th style="width:15%">e</th>
<td style="width:35%">eee</td>
</tr>
</tbody>
</table>'
google了一下好像没找到相关解法所以上来发问
谢谢!
[程式范例]:
https://ideone.com/bbRbpg
[关键字]:
选择性,也许未来有用
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 192.83.168.161 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1562581633.A.873.html
1F:→ andrew43: as.character() 07/08 19:22
2F:→ celestialgod: as.character 07/08 19:22
3F:→ locka: 原来还有这招…谢谢楼上两位大大! 07/09 18:15