[问题] 关於 Big5 与 regexp

时间Wed Apr 15 03:32:18 2009

环境： Ruby 1.8.7 状况：输入：一个 Big5 的纯文字档 input.txt 里面的内容只有四个字：东吴大学操作：开档，读内容，判断它是否 match /^[\d\w]{8}$/ 预期结果： nil 实际结果：因 $KCODE 而异 (!?) 在 $KCODE='u' 的时候会 match 到 \d\w 不是只会 match 到英文字母和数字吗？想请问大家为甚麽会这样 :( 感谢附录：程式： #!/usr/bin/ruby -w $KCODE='u' # 这一行注解与否会影响到正规表示法的 match File.open("input.txt", "r").each_line do |l| if l.chomp.match(/^[\d\w]{8}$/) puts "matched" end end --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 140.122.166.137 ※ 编辑: ducksteven 来自: 140.122.166.137 (04/15 03:35)

1^F：→ iamweep:你的程式把东吴大学的binary当成UTF-8来解读而match \w 04/15 07:23

2^F：→ godfat:你 $KCODE 设 u 然後读 big5 不是在欺骗 ruby 吗 @@ 04/15 11:35

3^F：→ ducksteven:这是节录原本的程式要同时处理 big5 和 utf8 04/15 13:09

4^F：→ godfat:用 ruby 1.8 的话，这样只能用 byte sequence 来做 04/15 13:41

5^F：→ ducksteven::o 意思是我应该把 big5 和 utf8 分开处理罗？ 04/15 22:02

6^F：→ godfat:当然，而且\w是会match中文字的，你要[A-Za-z]才是英文字母 04/15 22:41

7^F：→ godfat:要统一处理就转个编码，或是用 1.9.1 吧 04/15 22:41

8^F：→ ducksteven:嗯嗯谢谢 :) 04/15 23:43

9^F：→ iamweep:统统转成UTF-8来做，用iconv 04/16 02:00

10^F：→ ducksteven:这个有技术上的困难因为它有些字是 ...造字... XDD 04/16 03:01

11^F：→ godfat:如果是 big5-hkscs, iconv 支援，如 UAO, 海字集，要另找 04/16 10:50

12^F：→ godfat:如果是完全自己的造字... 只能自己写了 XD 04/16 10:50

13^F：→ ducksteven:是啊就是完全造字...XD 04/16 18:02

14^F：→ Schelfaniel:完全自己造字有时连 iconv 都会转失败，超惨的 04/16 20:38

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Ruby 板

[问题] 关於 Big5 与 regexp

热门看板

赞助商连结