作者Instance (呆呆华)
看板C_and_CPP
标题[心得] X86 架构下的 Memory Model
时间Sun Jul 18 11:24:10 2021
大多时间在家有点无聊,花了点时间研究以前一知半解的东西。
不过要强调的是,这篇文章只针对 X86。
std::atomic 有六种 Memory Order 选项:
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
这六种模式在 X86 底下几乎没什麽差别的,
用最弱的 memory_order_relaxed 就可以了,
因为 X86 是属於 Strong Memory Model 的架构。
Load-Load, Store-Store, Load-Store 情况下是安全的。
Store-Load 情况下表示,
A 执行绪储存某一变数,
其他执行绪必须同步读到最新的数值,
这时就必须用到原子操作。
如果要理解原子操作的话,
最简单的方法是从硬体角度来思考。
现代的 CPU 有 L1, L2, L3 Cache,
如果你的电脑有多个核心,
当资料放在 L1, L2 Cache 时,
并不保证所有核心对某一变数的值是一致的。
而进行原子操作的动作之後,
变数的值会同步到所有核心的 Cache。
原子操作的方法有很多种:
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 组合语言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的组合
语言,我不是很了解
5. InterlockedExchange(); // Win API
效果都是将变数的值同步到所有核心,
这样才能保证多执行绪环境下此变数的全局可见,
Win API 或许效能会稍差一点吧。
参考文章:
C++11中的内存模型上篇 - 内存模型基础
https://tinyurl.com/f36rsus9
C++11中的内存模型下篇 - C++11支持的几种内存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些见解
https://zhuanlan.zhihu.com/p/41872203
--
西之西处,大陆彼岸,我族飞舞,乘驭他风...
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.241.208.49 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1626578713.A.0AC.html
1F:→ sarafciel: 呃...我建议原PO去补一下图灵奖神书计算机架构 07/18 22:36
2F:→ sarafciel: 你这篇文章从原子操作开始的东西除了参考应该都是错的 07/18 22:40
不是很懂,哪里有问题在请S大详述一下,方便後进们学习。
3F:→ final01: 有书在讲这个??好像都是网路文章吧?所以很片段XD 07/18 23:11
4F:→ sarafciel: CA也不是专门讲这个的书啦XD 但是要理解这部分issue 07/18 23:25
5F:→ sarafciel: 对CPU的设计跟加速原理要有一定程度的认识 07/18 23:26
6F:推 poyenc: 好奇你怎麽不看 Hans-J. Boehm 的提案还有论文, 而是看网 07/19 02:10
7F:→ poyenc: 路上的文章 07/19 02:10
※ 编辑: Instance (118.167.163.61 台湾), 07/19/2021 11:51:35
8F:嘘 EricTCartman: 好奇要是一开始就知道要看Boehm的论文还会愿意发文 07/19 17:39
9F:→ EricTCartman: 给楼上酸? 07/19 17:40
10F:→ Caesar08: 楼上,这也不是甚麽很神秘的资讯,google memory order 07/20 01:28
11F:→ Caesar08: 上面就有写每一个的内容是甚麽。看不懂也有spec可以读 07/20 01:30