Re: [问题] 请问有关撷取资料的问题?

时间Wed Jun 18 20:19:11 2008

不好意思再问一下中文解码的问题因为我要处理的data是从某个文字档(.txt)抓下来的而这个.txt档里面是包括许多中文字串的资料我在输入以下程式的时候 #-*- coding:big5 -*- f=open('XXX.txt','rU').read() print f 这是没有问题的其中的中文字串都可以完整show出来但是当我要对其中f(文字档)做一些处理的时候(例如tokenize或是撷取资料出来) 就会出现unicode的问题想请问一下为什麽都只能在print的时候中文字串可以显示但是写其他程式码处理的时候就不行呢@@ 请问有没有什麽解决办法呢谢谢!!! ※ 引述《gasolin (小g)》之铭言： : ※ 引述《clara830 (...)》之铭言： : : 不好意思再请教一个进阶的问题.... : : 假设我现在有一个list是这样: : : text = ['ABCD:from XXX X 12(V) XXX', 'EF:XXX XX', 'GH: from XXX XX 345(V) XX'] : : 比如说我现在想要让程式判断 : : : 如果里面有包含'from'的话 : : 就把其中冒号前面的字串找出来以及找出其中(V)前面的字串 : : 以这个例子来说的话也就是希望撷取出 [(ABCD, 12), (GH, 345)] : : 好像有点复杂.....不知道这有办法写出来吗? : : 现在好像还想不到怎麽解决 : 跟前面的回答基本一样 : store = [] : text = [....] : for i in text: : if 'from' in i: : seg = i.split(':') : first_param = seg[0] : second_param = seg[1].split('(V)')[0] : store.append((first_param, second_param)) : print store --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 140.122.210.35 ※ 编辑: clara830 来自: 140.122.210.35 (06/18 22:23)

1^F：→ liangjr:不晓得你是如何做处理的 06/19 03:07

2^F：→ liangjr:yungyuc大的152篇有很多encoding的观念可以参考 06/19 03:08

3^F：→ clara830:谢谢~~不过我现在那些字串都是在.TXT档里面 06/19 10:31

4^F：→ clara830:跟前面讲的好像不太一样..... 06/19 10:32

5^F：→ clara830:难道我要把.txt里面的全部文字全部用复制贴上过去吗? 06/19 10:34

6^F：→ clara830:想请问有没有办法直接对.TXT档案做处理的.....@@ 06/19 10:35

7^F：推 wawawa:你文字档是何种编码？程式码贴个片段出来看看吧 06/19 17:00

8^F：→ clara830:已想到解决方式感谢: ) 06/19 20:36

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

Re: [问题] 请问有关撷取资料的问题?

热门看板

赞助商连结