作者chweng ()
看板EzHotKey
标题Re: [AHK-] 有关中文与Unicode
时间Wed Sep 30 12:28:00 2009
※ 引述《zop (阿斯沟以内欧喷酱)》之铭言:
: 小弟在网页的文字输入为中文Big5,
: 但是使用文字编辑器打开HTML,中文的部份却显示为
: 我的日常記事
: 小弟的问题是,能否在AHK里输入中文,输出为上述的编码?
: 不是将编码还原为中文,请指教,感恩。^_^
&#xxxxx; 这种写法有个专有名词,好像叫做 unicode reference 还是什麽的。
以第一个 我 来说,代表的是中文字「我」,至於这数字怎麽来的,请参考这边:
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6211
简单说就是把 Big-5 的我(A7DA)转成 UTF-8 的我(e68891),这个 AHK 可以办到。
接着透过转换规则再转成 Unicode 的我(6211),然後 16 进位的 6211 即是 10 进
位的 25105 了。
我稍微查了一下,好像没有现成的 function 可以套用,所以可能得自己写一个。
在 AHK 里面,可以用 Transform 指令取得剪贴簿里面的文字的 UTF-8 编码形式,
但是我不确定从 InputBox 输入的文字能不能直接取得 UTF-8 编码形式?
取得 UTF-8 编码之後,要转成 Unicode 也是有规则的,如果没有现成的函数可以套用,
就只能自己再写一个。详细规则可以参考这边:
http://zh.wikipedia.org/zh-tw/UTF-8
结论就是,真要转换绝对可行,但是如果要自己写也是有点麻烦的。
不知道我是不是有漏查了什麽?也许有更简单快速的方法也不一定。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 124.199.106.66
1F:推 zop:感恩~不过我正要写小游戏的模组,改天再研究研究 XD 09/30 17:50
2F:推 zop:十分,非常的,很困难..... 11/07 01:06