作者hyderai (飄)
看板PHP
標題Re: [請益] Windows下讀許功蓋檔名的檔案
時間Fri Sep 21 23:51:29 2012
自問自答 整理一下目前的看法 有錯還請麻煩指正
首先 Google 找到大部分關於許功蓋的問題 通常是為了解決將Big5編碼的許功蓋字串
存入 DB 時會遇到的問題 因為這些字串包含\字元
而\通常在程式中通常有跳脫字元的義涵
所以通常用addslashes函式處理過後 再存入DB中
要使用時再從DB取出 使用stripslashes函式 來顯示到網頁上
不過實際上只要上傳網頁、存入的中文字串以及使用的DB都使用utf-8編碼
就可以避掉這個問題 所以在此例上傳檔案的情況 只要上傳的 php 網頁使用utf-8編碼
基本上$_FILES['userfile']['name'] 就會是utf-8編碼
如果想將檔名存入 DB 直接使用這個變數就可以了
問題在於如果要存上傳檔案到Server上 而Server又是Windows (Big5)的話
因為只能存big5檔名 而不能存utf-8檔名 所以一般直覺會使用下面做法:
$upload_dir = "upload/";
$big5_fn = mb_convert_encoding($_FILES['userfile']['name'],
"utf-8", "big5"); //將 utf8 檔名轉成 Big5 檔名
move_uploaded_file($_FILES['userfile']['tmp_name'] ,
($upload_dir . $big5_fn) ); //移到上傳資料夾
然後就是惡夢的開始
因為先前提過的許功蓋字串問題 這些字串內包含\字元
所以使用像是is_file、readfile這些函式時會發生問題
猜測可能是因為這些函式接受路徑檔名
而這些函式內部又沒對許功蓋的情況做處理
所以對這些函式 "upload\許功蓋.txt" 看起來會是"upload\?\?\.txt"
所以就出問題了
目前找到的作法 就是不要存中文檔名 另外使用其他英文數字來當檔名
可想而知 就得存對應檔名的資訊 ex. 許功蓋.txt <=> abc123.txt
如果不想存?
用urlencode()編碼處理 避掉許功蓋問題後再存?
這裡又會衍生一個問題 Windows 檔名有260個字元限制
用urlencode() 是會爆的做法
目前看到有的人使用英數檔名 然後多使用md5()來編碼 壓縮檔名到32個字元
避免長度超過 可以參考看看
不過得記得 md5() 是不可逆的 (如果不討論破解之類的)
※ 引述《hyderai (飄)》之銘言:
: 因為環境是Windows server 所以不得不處理Big5 許功蓋的問題
: 目前要讀取使用者上傳到網站上的檔案 因為Server是Windows
: 所以檔名都是big5編碼 假設檔案就是上傳到upload資料夾下
: 在讀取upload資料夾下的檔案時 如果遇到檔名是許功蓋的情形
: (ex. 許功蓋.txt) 使用is_file, readfile之類的函式 都沒辦法正常判斷及讀取
: 不知道有沒有什麼解決方法?
: <?php
: header('Content-type: text/html; charset=utf-8');
: $a = array();
: $a = scandir("upload/");
: foreach($a as $value){
: echo "檔案名稱:". $value . "<br />";
: if(is_file("upload/" . $value)){
: echo "檔案內容:<br />";
: echo "略<br />\n";
: }
: else{
: echo "非檔案:<br />"; //$value 是許功蓋.txt時會判斷成非檔案
: }
: }
: ?>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.34.162.25
1F:→ MOONRAKER:md5是單向雜湊函數又不是對稱加密,當然不可逆。 09/22 03:11
2F:→ liaosankai:=.=疑?原PO有說md5()可逆嗎?1F感覺回答的很嚴肅 09/22 03:43
3F:→ kerash:最後一句是疑問,一樓沒甚麼回答有問題的狀況 09/22 09:51
4F:→ Johnnyvip:我個人是用英數取個隨機的檔案名稱 再用資料庫對照 09/22 11:53
5F:→ Johnnyvip:讀取用資料庫搭配header 09/22 11:56
6F:→ Johnnyvip:不建議在server上用中文檔名 09/22 12:01
7F:→ Johnnyvip:不管是在windows或是linux上 09/22 12:03
8F:→ Johnnyvip:而且盡量用windows和linux都能夠使用的方法 09/22 12:05
9F:→ Johnnyvip:不然程式要換os執行的話 會需要另外修改 09/22 12:07
10F:→ alpe:檔名用md5放, 實際檔名另存這樣作比較簡單. 09/24 01:08
11F:推 gname:推樓上的方法,我也這麼做,只是總覺得可能會有看不見的bug 囧 09/24 08:38