Linux 板


LINE

大家好,我知道在tty顯示中文很麻煩,所以我想知道在亂碼背後的顯示模式 問題是這樣的: 我有50萬個檔案要處理,格式大概是 501025_ID.txt 因為一開始沒限制作業ID只能用英文,所以有幾個中文ID混入 LINUX顯示如下 502222_123.txt 503312_??+??.txt (為中文所顯示的亂碼) 507832_cher.txt 503878_-?{D.txt (為中文所顯示的亂碼) 要把中文的ID換成英數比較好處理 所以我用 find . -regextype egrep -regex ".*_[^[:alnum:]].*" 或是改用 -------------------------------".*_\?\?\+\?\?.*" 都沒辦法抓出任何一條Orz 想請問的是,怎麼樣可以知道linux實際上對那字元的認知是什麼? 或是,有認何方式可以直接把這些中文亂碼換成可見的英數文字嗎? 例如: 我 \u{num} 謝謝 Dan -- 不過是人 http://www.facebook.com/twaiting --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 124.155.187.95
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Linux/M.1435840252.A.199.html
1F:→ bitlife: 直接用wildcard來更改檔名會不會好一點? 07/02 20:52
是用「*」嗎?
2F:推 danny8376: 我覺得大概是big5編碼檔名吧? 07/02 22:36
我用big5內碼去search,無法匹配,看起來好像不是
3F:→ losepacific: find . -regextype egrep -regex \ 07/03 00:22
4F:→ losepacific: '..*[^a-zA-Z0-9_-.)( /][^a-zA-Z0-9_-.)( /]*..*' 07/03 00:22
5F:→ losepacific: 剛剛測試find的正規表示,寫了這麼長才抓到直中文名 07/03 00:23
6F:→ losepacific: 中文檔名改碼或許可以找找關鍵字urlencode 07/03 00:26
7F:→ losepacific: python2 -c "import urllib, sys 07/03 00:27
8F:→ losepacific: print urllib.quote(sys.argv[1])" 4567889-我.txt 07/03 00:29
9F:→ losepacific: 在utf8環境下會輸出4567889-%E6%88%91.txt 07/03 00:29
10F:→ losepacific: perl -MURI::Escape -e 'print 07/03 01:29
11F:→ losepacific: uri_escape($ARGV[0])."\n";' "123-稍快.txt" 07/03 01:29
12F:→ losepacific: 2> /dev/null 07/03 01:30
13F:→ losepacific: 在utf8環境下會輸出123-%E7%A8%8D%E5%BF%AB.txt 07/03 01:31
謝謝,我試著search這些關鍵字 今天試了一下,有個檔名是 501111_我愛PTT.txt 顯示為 501111_??+?{PTT.txt 用 .* 可以找的到 用 .*_.*PTT.* 變找不到了 表示中文無法匹配點號嗎? 但.*又可以匹配Orz
14F:→ bitlife: 你的linux有原生支援中文嗎? 原則上在中文utf-8環境,句點 07/03 11:13
15F:→ bitlife: 可以match中文,那些亂碼已不是中文字,所以.只能match一字 07/03 11:14
16F:→ bitlife: 元 07/03 11:14
17F:→ bitlife: 另外你的第2個regex,有greedy的問題,要使用修飾,我比較熟 07/03 11:15
18F:→ bitlife: 程式語語用的regex, command line的不是很確定 07/03 11:16
19F:→ bitlife: 抱歉,我看錯了,上面15,16分的推文請忽略 07/03 11:18
謝謝,我試試把整個系統改成zh_TW.utf8看看 做為小菜鳥,我放棄在LINUX上做了一.一 用find . -regextype egrep -regex ".*_[[:alnum:]].*"|xargs -i mv {} ./file 把所有正確的檔抓出來 剩的拉到windows上修改檔名 ※ 編輯: cherubx (61.66.243.96), 07/03/2015 16:29:58







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BuyTogether站內搜尋

TOP