作者Hazukashiine (みなさん、こんにちは)
看板C_and_CPP
标题Re: [问题] XOR交换值问题
时间Sun Nov 26 13:37:58 2017
这样的写法要追朔到手工撰写组合语言
当时连对记忆体和暂存器的使用都斤斤计较
所以如果用一个额外的暂存器去储存值的话
代表 register spilling 的可能性会增加
因为为了要确保这个跳到 label 处理完後
要把我们刚 push 出去的值再 pop 回来要不少的时间
这段时间是有点久故也被称为 von Neumann bottleneck
用来描述资料在汇流排上的传输瓶颈
--- 题外话 ---
说到 XOR 的神奇技巧
我们更常用的,甚至到现今都有在用的是:
使用 XOR REG, REG
来把一个暂存器的值清零
这样做是确实会比 MOV 指令来得好
现今的 CPU 为了拉高时脉跟吞吐量
通常都把处理器做成管线式的 (pipelined)
这样以来常常需要去处理 data hazard
因此 MOV 指令可能触发
partial register stall
这跟指令的顺序有很大的关系
因此在 Intel 的规格书上有明确指出
希望用 XOR 还有另外五种指令来清零
Intel 把它称作 zero idioms
这些指令已经被 hard-coded 在晶片上
让处理器明确知道这个指令只是要清零
而不会触发额外的事件
这样可能会在一些关键的时刻提升效率
--- 结尾语 ---
无论如何在编译器很聪明的年代
把 code 写得好懂真的比较实际
甚至还更好优化
写了 XOR SWAP 一定一定比较慢
因为 x86 提供 XCHG 来交换暂存器的值
如果用一般的写法(宣告额外的变数)
优化器很容易优化你的程式码
挑选出这颗处理器最适当的指令出来
所以说
Premature optimization is evil.
在没确定这是效能瓶颈前过早进行一些优化
可能会适得其反
※ 引述《ptt0720 (湿湿)》之铭言:
: 语言:CPP
: 今天写quick sort的时候发现原本常用的交数值方法好像有观念上的问题
: https://i.imgur.com/GwH4NbM.png
: 我习惯的用法是第二十七行 直接用参考交换两个值
: 但是发现印出来後都是一堆0
: 後来交叉比对後发现是XOR交换值的问题
: 想请问一下是不是阵列用XOR交换数值会出错?
: 想请问一下原因 麻烦各位大大了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.185.23
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1511674682.A.71C.html
※ 编辑: Hazukashiine (61.230.0.89), 11/26/2017 13:47:07
1F:推 alan23273850: 专业推 11/26 13:57
2F:推 galic: XOR超神奇的阿 Parity check很常用 但说到跟XOR Swap比较相 11/26 14:12
3F:→ galic: 关的大概是 XOR Linked List... 11/26 14:12
4F:推 chuegou: 这篇刚好也跟上面那篇问组语效率的相关 11/26 14:19
5F:推 VictorTom: 推:) 11/26 15:07
6F:推 final01: 当时是多久以前? 11/26 15:46
7F:→ Hazukashiine: 很久很久以前( 大误 11/26 15:47
8F:推 ersfw4418: 感谢教学 11/26 16:14
9F:推 ilikekotomi: 感谢分享 现在只知道有XOR SWAP 但没想过要去用 11/26 17:39
10F:推 chengcti: 其实 现在已经没人考虑这个 但是MCU 还是需要 11/26 18:06
11F:推 TitanEric: 推个 11/26 21:06
12F:→ PkmX: 最初用跟自己xor清成零不是因为他指令最短吗= =? 11/26 21:16
13F:→ PkmX: 且通常编译器最佳化後 分配reg的时候就直接帮你把交换的值 11/26 21:21
14F:→ PkmX: 写到交换过後的reg了 连xchg都不需要XD 11/26 21:21
15F:推 james732: 推 11/27 20:52
16F:推 xvid: 推 11/28 01:46
17F:推 friendever: 专业推 12/07 12:43