作者Edster (Edster)
看板R_Language
标题read.csv 中 stringsAsFactors 擅自更动文字
时间Sun Oct 18 11:54:10 2015
刚刚在debug过程中,突然发现
base::read.csv(x, stringsAsFactors = TRUE)
对负数读取会有不同的结果
一串应该是 numeric 的正数,其中或有一些负数与NA。
当 stringsAsFactors = TRUE
读入的结果应该是 -0.4 会变成 (0.4) 然後文字型态会变成 character
必须用
base::read.csv(x, as.is=TRUE, stringsAsFactors = TRUE)
有人知道为何如此设计?
and, 有没有办法让 base::read.table 中的 as.is 直接永久设定成 TRUE
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.241.19.20
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1445140452.A.B0C.html
1F:→ celestialgod: 标题分类不要乱删qq 10/18 12:04
2F:→ andrew43: 可否提供简单例子?你不是说都是数字又怎麽有文字资料? 10/18 17:17
3F:→ Edster: 我也很纳闷,那时的档案已经被我删掉了。现在却重创不出来 10/18 21:33
4F:→ Edster: 我有用notepad++看过被读入成文字(0.4)实际的数值是-0.4 10/18 21:34
5F:→ Edster: 检查过该档案,只要数值是负数的全部被读成类似的格式 10/18 21:35
6F:→ Edster: 因此该栏位被判断成character, 转成numeric时会是NA 10/18 21:36
7F:→ Edster: 正确的读法如上所述, 需要加as.is=TRUE 10/18 21:37
8F:→ celestialgod: 没有例子,无法判断... 10/18 21:41