作者andrew43 (讨厌有好心推文後删文者)
看板R_Language
标题Re: [问题] 求解此档案如何读入和如何跑出分群
时间Sat Jun 9 00:13:30 2018
大概写了一下。
最後 res 是 species by locations 的 binary matrix 为所求。
重点是在要把所有的地点集中起来再逐列与各spp出现的地点做比对。
library(magrittr)
## fatch data
con <-
url(
"
http://archive.ics.uci.edu/ml/machine-learning-databases/plants/plants.data",
"r"
)
src <- readLines(con)
close(con)
## split string by comma
srcLine <- strsplit(src, ",")
## get sp name
sppName <-
lapply(srcLine, function(x) {
x[1]
}) %>%
unlist
## get location name per sp
locName <-
lapply(srcLine, function(x) {
x[-1]
})
## get all unique location name
locNameUni <- locName %>% unlist %>% unique
## binary matrix
res <-
lapply(locName, function(x) {
locNameUni %in% x
}) %>%
do.call("rbind", .) %>%
set_colnames(locNameUni) %>%
set_rownames(sppName)
※ 引述《genius888053 (少年YO)》之铭言:
: https://i.imgur.com/InHBPvq.jpg
: 我复制到记事本後用txt档案方式读取可是却发生以下问题
: https://i.imgur.com/A7iKdyy.jpg
: 上图我有试着将sep删除掉 可是一样发生上述情形
: https://i.imgur.com/dnBtUX7.jpg
: 尽管我读出来後却发生资料不整齐和变数只有一笔的情形
: 求板上大大提点
: 第一次发文,有误请见谅
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.246.95.32
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1528474412.A.814.html
※ 编辑: andrew43 (111.246.95.32), 06/09/2018 00:14:48
※ 编辑: andrew43 (111.246.95.32), 06/09/2018 00:15:35
1F:→ andrew43: 我後来猜想你应该比较可能使用 locations by species 06/09 00:52
2F:→ andrew43: 需要的话再发个声吧 06/09 00:53
3F:→ andrew43: 或是自己先试试看 t(res) 是不是你要的 06/09 00:54
4F:推 genius888053: 太感谢大大了 我等等来试看看 06/09 01:45