看板Config
标 题中文网址的发展?--%nn 与免下载 ?!
发信站中央大学松涛风情资讯站 (Wed Feb 11 13:27:04 2004)
转信站ptt!ctu-reader!ctu-peer!news.nctu!freebsd.ntu!news.ntu!news.mcu!news.c
> 最近的一次 IE patch 把送给 proxy 的中文域名由 binary data
> 全都改为 %nn 的型式送给 proxy server, 如果不用 proxy port, Win2K
> 还是仍会在下层的 resolver 把域名改为 UTF-8 送出. 猜测其原因应该是
> 要用 %nn 来代替各种可能的 UTF-8 码通过 IE 内部, 避免发生误判域名
> data 为 control code , 消除造成误动作所形成的漏洞.
===================================================================
域名使用 %nn 传送就必需使用 UTF-8 编码, 如果是 BIG5 或 GBK
因为第二 byte 有 ASCII 符号, 会因不分大小写而无法无害通过, 但WIN2K
本身是送出 UTF-8 binary code 的, 如果 IE 选定一律以 UTF-8 传送, 就
会使得 URL 里的档案名称也是 UTF-8 形式, 与现有 web 不相容是必然的,
因此只能传送域名. 但 UTF-8 %nn 的域名到了 Win2K resolver 又会再用
UTF-8 encoding 一次, 这是 IE 与 resolver 分离没有把 type tag 一并传
送过去是最可笑的地方. 因此, 是否设定 "一律使用 UTF-8 传送" 就形成两
种用法.
MicroSoft IE 在 binary data , UTF-8 encoding , %nn encoding
团团转也不是第一次, 总之, 目的不明. 只不过使用 UTF-8 的好处就是没有
BIG5 , JIS, GB, KIS 的区别问题, 也没有欠字显示问题, 要做线上转码转
为 ACE 会好做一点. 如果不转为 ACE , MicroSoft 也早就做了 Active
directory 的 UTF-8 dns 等着.
*.tw 拦截 8 bit name , xn--开头名称, %nn (非 LDH 符号) name
是都能处理的, 如果都用 UTF-8 编码, 监别上会更容易, 线上转码免下载会
更好做. 但大陆是否放弃下载的做法看来是不可能, 就看 keyword (3721 网
路实名, CNNIC 通用网址) 跟 auto.search.msn.com 的冲突是否能解决.
CNNIC 跟 3721 的双簧会持续演下去, 前有 Realname , 後有 MicroSoft ,
现在有 Yahoo, 又是合作买服务, 又是与公营的毁约, 另投资到民营的一方,
同样的模式重覆上演, 造成现在已经号称有一半用户是使用中文上网. 使用中
文名称上网, 背後就是搜索引擎在支撑, 纯域名的想法, 找不到都不管, 根本
就不是在做服务, 跟税捐稽徵处等着人家上门缴钱找罪一样受是不得人心的.
--
◎ Origin: 中央松涛站□bbs.ee.ncu.edu.tw From: 140.115.6.234