作者jasonfghx (工人)
看板R_Language
标题[问题] 如何定位出遗漏值在哪一行哪一列
时间Sun Mar 25 19:34:49 2018
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
不好意思 原始资料中 有些空白被填上- ? NA这种
但实际上他是遗漏值, 有没有什麽方式可以把它们取代成空白
让is.na判断成是遗漏值, 谢谢!!
[程式范例]:
wdbc=read.table("DM_Assignment_2_Kidney.csv", header=F,sep=",")
wdbc1=wdbc
names(wdbc) <- c("Age","Blood Pressure","Specific
Gravity","Albumin","Sugar","Red Blood Cells","Pus Cell","Pus Cell
clumps","Bacteria","Blood Glucose Random","Blood Urea","Serum
Creatinine","Sodium","Potassium","Hemoglobin","Packed Cell Volume","White
Blood Cell Count","Red Blood Cell Count","Hypertension","Diabetes
Mellitus","Coronary Artery Disease","Appetite","Pedal Edema","Anemia","Class")
for(i in 1:25)(
wdbc1[,i]<-gsub("[?]",NA, wdbc[,i])
)
[关键字]:
遗漏值
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.116.1.141
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1521977692.A.9B7.html
1F:→ celestialgod: which(is.na(x), arr.ind = TRUE) 03/25 19:39
2F:→ celestialgod: 会回传NA所在的Row跟Column位置 03/25 19:39
3F:→ jasonfghx: THX 03/25 19:50
※ 编辑: jasonfghx (140.116.1.141), 03/25/2018 20:11:44
4F:→ celestialgod: matrix还是data.frame? 03/25 20:13
5F:→ celestialgod: matrix用gsub(x, "[-?]", "NA") 在抓=="NA"的位置 03/25 20:13
6F:→ celestialgod: 漏看还有空白 gsub(x, "[-? ]", "NA") 03/25 20:14
7F:→ celestialgod: 我放错位置了Orz gsub("[-? ]", "NA", x) 03/25 20:16
8F:→ celestialgod: 如果是长度为零的话 x[nchar(x)] = "NA" 03/25 20:16
9F:→ celestialgod: 更正 x[nchar(x)==0] = "NA" 03/25 20:17
10F:→ celestialgod: data.frame的话 就有很多做法了QQ 03/25 20:18
11F:→ celestialgod: 看你是用base的函数还是dplyr or data.table 03/25 20:18
12F:→ celestialgod: 不过data.frame的做法也一样拉,是character的栏位 03/25 20:19
13F:→ celestialgod: 做上面那两件事情,取代长度为0的跟取代特殊字元 03/25 20:19
14F:→ celestialgod: 另外,你如果是读档案的话,还可以用 03/25 20:20
15F:→ celestialgod: read.table的na.strings去把你要变NA的字串直接转NA 03/25 20:20
17F:→ jasonfghx: THX 03/25 20:27
18F:→ jasonfghx: 我来学习一下 03/25 20:27
很感谢 其实我已经用到gsub 但是我是打"?" 难怪什麽东西都跑不出来 看到你的[]
我已经茅塞顿开
※ 编辑: jasonfghx (140.116.1.141), 03/25/2018 20:32:44
19F:→ jasonfghx: 经过gsub 原本是data frame的资料都变成char 03/25 20:56
20F:→ jasonfghx: 这有解吗? 03/25 20:56
21F:→ jasonfghx: 我自己解决了 03/25 21:17
※ 编辑: jasonfghx (140.116.1.141), 03/25/2018 21:18:15