作者helixc (@_2;)

看板R_Language

标题

Re: [问题] 读入"鴴" "鸊鷉" 等怪字

时间Mon Jul 6 00:22:58 2015

※ 引述《celestialgod (攸蓝)》之铭言： : ※ 引述《helixc (@_2;)》之铭言： : # readxl套件： (不用JAVA，读取也比较快，也不会转换字串为factor) : library(readxl) : dat = read_excel("birdnames.xls") 这边报告一下... readxl这个套件没问题，但用dplyr处里资料的时候就会有问题。 [code] library(readxl) library(dplyr) fileName = "birdnames.xls" #读取资料 x = read_excel(fileName) #资料读取输出正常 x$c_name[51:52] #使用dplyr::select来读资料，用两种不同的写法，一样都不正常 y1<-select(x, c_name, Order) ; y1[51:52,] y2<- x %>% select(c_name, Order) ; y2[51:52,] #使用base::unique来读取资料，正常 z<-unique(x$c_name); z[51:52] 还不太会贴code以及处里过程，直接贴图 http://imgur.com/7oOVkLm 不正常的资料 Source: local data frame [2 x 2] c_name Order 1 白嘴潜鸟 51 2 小<U+9E0A><U+9DC9> 52 正常的资料 [1] "白嘴潜鸟" "小鸊鷉" 如果是package处里的问题的话，那转移到非windows系统是无解的吧？只能舍弃dplyr使用*apply来输出名录了... 可是我还不会用*apply来写dplyr-like的功能阿Orz --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.138.151.129 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1436113381.A.EAB.html

1^F：→ celestialgod: #1Kuvs-9O (Statistics) 07/06 00:38

2^F：→ celestialgod: 根据上面那篇 y1$c_name[51:52]这样又能正常显示XD 07/06 00:39

3^F：→ celestialgod: 这是R print的问题(摊手 07/06 00:39

4^F：→ celestialgod: i find a silution, please refer to http://goo.g 07/06 01:04

5^F：→ celestialgod: l/XKK9a2 07/06 01:04

6^F：→ celestialgod: 抱歉，手机推文，断掉，http://goo.gl/XKK9a2 07/06 01:05

7^F：→ celestialgod: another discussion and solution https://goo.gl/M 07/06 01:11

8^F：→ celestialgod: 4q4eL 07/06 01:11

9^F：→ celestialgod: https://goo.gl/M4q4eL 又断... 07/06 01:12

10^F：→ helixc: 什麽软体可以自己帮你断句呀 MoPTT吗XDD 07/06 01:13

11^F：→ helixc: 我加上 Sys.setlocale(locale="UTF-8") 就好了(摊手) 07/06 01:13

12^F：→ helixc: 可惜没有跳脱dplyr来写程式的机会了(?) 07/06 01:13

13^F：→ helixc: 可是为何base下的指令就OK, 但dplyr的指令就不行? 07/06 01:15

14^F：→ celestialgod: 不是dplyr问题，你看第二个网址有写是format问题。 07/06 01:17

15^F：→ celestialgod: 只跟data.frame有关 07/06 01:17

16^F：→ helixc: 好像没好...出现错误讯息 07/06 01:31

17^F：→ helixc: Warning message: 07/06 01:32

18^F：→ helixc: In Sys.setlocale(locale = "UTF-8") : 07/06 01:32

19^F：→ helixc: OS reports request to set locale to "UTF-8" cannot b 07/06 01:32

20^F：→ helixc: onored 07/06 01:32

21^F：→ helixc: 我决定改输出序号到Excel去比对比较快...这样太累了 07/06 01:33

22^F：推 leo0650: 因为Windows的locale好像没有UTF-8相关的 (若Mac OS可行) 07/06 01:53

23^F：→ leo0650: 若要print在console可试试c大提供的方法，y1增加class 07/06 01:55

24^F：→ leo0650: class(y1) <- c("unicode_df","data.frame","tbl") 07/06 01:56

25^F：→ helixc: 有些工作真的还是excel比较快(苦笑) 07/06 03:20

26^F：推 Edster: 我以前处理植物名录的时候，全使用代码，代码还是比较安心 07/06 17:11

27^F：→ Edster: 不晓得你们代码怎麽编，我们是属名前三码跟种名前三码， 07/06 17:12

28^F：→ Edster: 遇到变种跟亚种，就再三码。 07/06 17:13

29^F：→ helixc: 各种台湾出现过的鸟类加起来最多也不会超过1000种， 07/06 21:26

30^F：→ helixc: 而鸟类也有很好的名录可以参考，我知道的人都是直接用名录 07/06 21:27

31^F：→ helixc: 的编号来操作...植物有五千多种以上，我以前大学的时候遇 07/06 21:27

32^F：→ helixc: 到一位作草本的老师自己写PDA软体用属名3码种小名2码编码 07/06 21:27

33^F：→ helixc: 不过听他说还是会遇到重复的... 07/06 21:28

34^F：→ helixc: 回到本文的题旨..其实很有趣，就算那一个data.frame 07/06 21:28

35^F：→ helixc: 里面的字变成乱码，还是可以和还没变成乱码(不是df格式?) 07/06 21:29

36^F：→ helixc: 的资料很好的合并，程式还是都把他们当一家人XD 07/06 21:29

37^F：→ helixc: 不过总得面对批次出图/档案的问题，该学非Win系统了Orz 07/06 21:29

38^F：推 Neisseria: 在 Linux 和 Mac 上使用 utf-8 console 会容易得多 07/06 22:13

39^F：→ andrew43: 所以…出错的根本原因是什麽呢？ 07/07 00:21

40^F：→ andrew43: 是R处理utf8大字集有问题吗？还是什麽？ 07/07 00:22

41^F：→ andrew43: 这一串讨论可能很重要。如果知道根本原因，可以帮很多人 07/07 00:23

42^F：→ celestialgod: 第一， windows r显示utf8是没问题，读取(要读exce 07/07 00:46

43^F：→ celestialgod: l或是用readLines, 其他读不进去)也ok, 写入还没试 07/07 00:46

44^F：→ celestialgod: 过... ，不过写到xls应该ok。第二， data.frame显 07/07 00:46

45^F：→ celestialgod: 示有问题，要用我推文中第二个连结去做。 07/07 00:46

46^F：→ celestialgod: 这样的总结， ok吗？ 07/07 00:47

47^F：→ andrew43: 谢谢楼上补充。 07/07 01:24

48^F：→ helixc: 抱歉第二个连结看不太懂，是要自己写print fun吗？可以回 07/07 08:08

49^F：→ helixc: 文比较清楚吗？感谢 07/07 08:08

50^F：→ helixc: 因为不只是显示，ggplot::savegg ()存图功能遇到奇怪的字 07/07 08:10

51^F：→ helixc: 也会崩溃，问题不应该只是要在R上面秀出正常有怪字的df 07/07 08:10

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

R_Language 板

Re: [问题] 读入"鴴" "鸊鷉" 等怪字

热门看板

赞助商连结