看板CompBook
标 题C++ Primer 答客问 (39) - little endian, big endian
发信站清华资讯(枫桥驿站) (Sat Mar 25 22:40:32 2000)
转信站Ptt!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!maple
C++ Primer 答客问 (39) - little endian, big endian
侯捷
[email protected]
2000.03.25 第一次发表於
清大.枫桥驿站(140.114.87.5).电脑书讯版(Computer/CompBook)
本文将於日後整理於 侯捷网站/侯捷译作/C++ Primer 中文版/答客问
侯捷网站:www.jjhou.com
----------------------------------------------------------------
kylin 与我分享了一个看似奇怪的问题,是他的同事所写的一段码,
没有注解,其结果令人丈二金刚摸不着头脑。
大意是这样:同事 A 所写的一段程式码中,将一份 DWORD 资料输出
到 port 去,然後在读入时以「chars 阵列」处理之。程式中运用了
DWORD 和 char[] 之间的型别转换动作。奇怪的是同事 A 将 char 阵列
内容两两对换处理(这是奇怪之处)。举例示范如下:
// vc6[o] bcb4[o] g++[o]
#include <iostream>
using namespace std;
typedef unsigned long DWORD;
int main()
{
char szByteData[32] = "abcdefgh"; // 0x61,62,63,64,65,66,67,68
DWORD dwDwordData[5];
dwDwordData[0] = 0x41424344; // 'A','B','C','D'
dwDwordData[1] = 0x45464748; // 'E','F','G','H'
char* pPtrToByteData = (char*)dwDwordData;
DWORD* dwPtrToDwordData = (DWORD*)szByteData;
for (int i = 0; i < 8; i++)
cout << pPtrToByteData[i]; // DCBA HGFE (颠倒了,所以同事 A
// 才需做两两对换处理。此处未示范)
cout << endl;
cout << hex << "dwPtrToDwordData[0] = "
<< dwPtrToDwordData[0] << endl; // 64636261 (颠倒了)
cout << hex << "dwPtrToDwordData[1] = "
<< dwPtrToDwordData[1] << endl; // 68676665 (颠倒了)
}
初看实在令人讶异。後来我们才想到是 big endian 和
little endian 之故。
是的,这个程式在 Windows 9x 环境下跑,而 Windows 9x 的硬体平台
是 Intel x86,而 Intel x86 采用 little endian 的位元组排列模式,
也就是 "least significant byte appears first in the number".
所以当 DWORD 放到 Intel x86 系统的记忆体中,会 word 和 word
颠倒放置、byte 和 byte 颠倒放置。如果要以 bytes(chars)将它
一一读入,必须自行颠倒各 bytes 的次序。
把这个程式拿到 FreeBSD on i386 上执行,结果与上相同。
但是如果把这个程式拿到 Solaris on Sparc 上执行,结果如下:
for (int i = 0; i < 8; i++)
cout << pPtrToByteData[i]; // ABCD EFGH(次序没变)
cout << endl;
cout << hex << "dwPtrToDwordData[0] = "
<< dwPtrToDwordData[0] << endl; // 61626364(次序没变)
cout << hex << "dwPtrToDwordData[1] = "
<< dwPtrToDwordData[1] << endl; // 65666768(次序没变)
因为 Sun Sparc 机器采用 big endian 的位元组排列模式,意即
"most significant byte is placed first"。
这给我们一个教训:
(1) 诡异的动作,却不写注解,害人害己。
(2) 移植性不高的程式码,宜尽量避免 — 至少应有详细说明。
顺带一提,很多人都不知道 big/little endian 的典故。
Microsoft Press Computer Dictionary 3/e p.49 说:
"The term big endian is derived from Jonathan Swift's
Gulliver's Travels, in which the Big-Endians were a group
of people who opposed the emperor's decree that eggs
should be broken at the small end before they were eaten."
一笑!
-- the end
--
※ Origin: 枫桥驿站<bbs.cs.nthu.edu.tw> ◆ Mail: [email protected]