看板Config
標 題中文網址的發展?--%nn 與免下載 ?!
發信站中央大學松濤風情資訊站 (Wed Feb 11 13:27:04 2004)
轉信站ptt!ctu-reader!ctu-peer!news.nctu!freebsd.ntu!news.ntu!news.mcu!news.c
> 最近的一次 IE patch 把送給 proxy 的中文域名由 binary data
> 全都改為 %nn 的型式送給 proxy server, 如果不用 proxy port, Win2K
> 還是仍會在下層的 resolver 把域名改為 UTF-8 送出. 猜測其原因應該是
> 要用 %nn 來代替各種可能的 UTF-8 碼通過 IE 內部, 避免發生誤判域名
> data 為 control code , 消除造成誤動作所形成的漏洞.
===================================================================
域名使用 %nn 傳送就必需使用 UTF-8 編碼, 如果是 BIG5 或 GBK
因為第二 byte 有 ASCII 符號, 會因不分大小寫而無法無害通過, 但WIN2K
本身是送出 UTF-8 binary code 的, 如果 IE 選定一律以 UTF-8 傳送, 就
會使得 URL 裡的檔案名稱也是 UTF-8 形式, 與現有 web 不相容是必然的,
因此只能傳送域名. 但 UTF-8 %nn 的域名到了 Win2K resolver 又會再用
UTF-8 encoding 一次, 這是 IE 與 resolver 分離沒有把 type tag 一併傳
送過去是最可笑的地方. 因此, 是否設定 "一律使用 UTF-8 傳送" 就形成兩
種用法.
MicroSoft IE 在 binary data , UTF-8 encoding , %nn encoding
團團轉也不是第一次, 總之, 目的不明. 只不過使用 UTF-8 的好處就是沒有
BIG5 , JIS, GB, KIS 的區別問題, 也沒有欠字顯示問題, 要做線上轉碼轉
為 ACE 會好做一點. 如果不轉為 ACE , MicroSoft 也早就做了 Active
directory 的 UTF-8 dns 等著.
*.tw 攔截 8 bit name , xn--開頭名稱, %nn (非 LDH 符號) name
是都能處理的, 如果都用 UTF-8 編碼, 鑑別上會更容易, 線上轉碼免下載會
更好做. 但大陸是否放棄下載的做法看來是不可能, 就看 keyword (3721 網
路實名, CNNIC 通用網址) 跟 auto.search.msn.com 的衝突是否能解決.
CNNIC 跟 3721 的雙簧會持續演下去, 前有 Realname , 後有 MicroSoft ,
現在有 Yahoo, 又是合作買服務, 又是與公營的毀約, 另投資到民營的一方,
同樣的模式重覆上演, 造成現在已經號稱有一半用戶是使用中文上網. 使用中
文名稱上網, 背後就是搜索引擎在支撐, 純域名的想法, 找不到都不管, 根本
就不是在做服務, 跟稅捐稽徵處等著人家上門繳錢找罪一樣受是不得人心的.
--
◎ Origin: 中央松濤站□bbs.ee.ncu.edu.tw From: 140.115.6.234