作者winderek (野狼)
看板Perl
標題[問題] 中文文章中比對符號
時間Mon Apr 25 01:15:31 2011
由於使用者的要求,我的環境是在windows下的命令提示字元
據我所了解,這上面只支援big5而不支援utf-8
而我所使用的設定為use Encode::TW
沒有設定
use encoding 'big5',filter=>1;(實際上我並不了解他實際上的意義)
而我若是這樣設定的話,許多包含中文字辨識的程式碼會出現錯誤
我的程式已經完成了8成左右,因為新加入功能才發現這不知如何解的問題
我是讀入中文檔案到
@File_Data進行辨識
當中我要找到某一行有包含@字元
$File_Data[$_]=~ m!\Q@\E! #由於文章有
\,因此不使用
\
但是我發現應該是中文字由兩個字元所組成
因此一個中文字的某字元是
@的話也會被辨識出
但這會找出許多不含
@字的行
我該如何解決呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.88.13
1F:推 audreytang:use open ':encoding(big5)'; # 試試這樣? 04/25 10:02
2F:→ winderek:我剛剛試了,可是開檔後的內容全變成亂碼了 04/25 11:45
3F:推 audreytang:Encode::decode(big5 => $File_Data[$_]) =~ /\@/; 04/28 11:16