作者paranoia5201 (社会黑暗、行路难)
看板R_Language
标题Fw: [问题] 不乾净的资料汇入、如何处理?
时间Mon Mar 5 17:56:35 2018
※ [本文转录自 Statistics 看板 #1QdHGr4X ]
作者: paranoia5201 (社会黑暗、行路难) 看板: Statistics
标题: [问题] 不乾净的资料汇入、如何处理?
时间: Mon Mar 5 17:56:03 2018
各位好:
这里想要请教、如果拿到的原始档不是很漂亮、该要怎麽汇入处理?
我直接面对的例子是死因统计年报(下载:dep.mohw.gov.tw/DOS/lp-3352-113.html)
打开档案後会发现它每个分页的头几列都是各式主标题与子标题。
我该如何处理这部分、好让它可以在汇入之後做运算整理呢?
感谢~
(预计使用的软体为R、Python、还有SAS)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.117.132
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1520243765.A.121.html
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: paranoia5201 (140.112.117.132), 03/05/2018 17:56:35
1F:→ celestialgod: readxl::read_excel会帮你读成table格式 03/05 18:44
2F:→ andrew43: 处理试算表的package大多可以按分页读入 03/05 18:52
3F:→ andrew43: 读入後就是各别对付了,没什麽法门。 03/05 18:54
4F:推 seimwiwa: 卫福部有全死因档从那个资料再整理出来比较快(吧) 03/06 23:25
5F:→ wayturn: 想问R有套件能处理主副标吗?还是只能手动处理excel再汇入 03/07 12:25
6F:→ andrew43: 读入的function常有前几列不读的参数,可帮点忙 03/07 19:22