作者lsshno1 ( )
看板R_Language
标题[问题] xpathApply with lapply
时间Fri May 4 18:43:51 2018
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
各位前辈好, 我目前手边有一个xml的档案, 我想要取出其中的parent跟children node,
merge在一起.
Page(我的parent node)为分页, 范例中有两页.
Text与Box@llx, lly, urx, ury为我的children node.
我预期我的data.frame为:
Page Text llx lly urx ury
1 D1.2 70.87 43.56 94.53 31.56
1 Date 109.17 156.75 131.80 144.75
2 Forms 70.87 43.56 94.53 31.56
2 only 264.74 43.56 286.73 31.56
目前参考这边的做法
https://tinyurl.com/ya3yh5cj
连结的作法为, 取出每个page的node, 并放在list中.
(就范例而言, 会创造出一个list, 其中有两个element, 分别代表两个page)
接着, 利用lapply结合xpathApply, 对每个element取出我要的children node.
但, 我发现在values这个list中, 她的确有两个element,
其中每个elements都是重复page 1 and 2 的资讯.
如下:
[[1]] [[2]]
D1.2 D1.2
Date Date
Forms Forms
only only
烦请各位指教, 谢谢!
程式码:
https://ideone.com/D2kbyw
范例档案:
https://ideone.com/jqS8fo
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 103.10.220.11
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1525430643.A.691.html
※ 编辑: lsshno1 (103.10.220.11), 05/04/2018 18:53:21