作者lovejomi (JOMI)
看板C_and_CPP
标题[问题] union 的undefine behavior
时间Tue Jun 16 00:35:43 2020
平常真的很少用union 所以当要用的时候还是查了一下
https://en.cppreference.com/w/cpp/language/union
S s = {0x12345678}; // initializes the first member, s.n is now the active
member
// at this point, reading from s.s or s.c is undefined behavior
诶, 这不就是常看到union的标准用法吗?
於是我再找找
http://isocpp.github.io/CppCoreGuidelines/CppCoreGuidelines#Ru-pun
恩....真的是undefined behavior.....完全颠覆我之前对union的认知
原来看到这种union { struct{} , array;} 全部都是UB...
想问一下
1. 即使他是 书本上的UB 但是不是可以说 所有已知compiler实作上都让他效果一致
也就是常用的那套手段也没什麽问题, 真的这样写 也不用太苛责?
2. 如果真的不想写出UB 的程式码, 是不是只能用reinterpret_cast
例如
union Endian{
int a;
char b;
};
改用
int a = 1; char b = *(reinterpret_cast<char*>(&a));
对於reinterpret_cast每当用 都很怕是UB,
有没有什麽通则可以快速确认是否转型是UB呢?
以上 (今天才知道union 这样写是UB, 实在很震惊)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.12.193.155 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1592238947.A.863.html
※ 编辑: lovejomi (39.12.193.155 台湾), 06/16/2020 01:00:08
1F:→ loveme00835: 你的认知应该是从 C 语言来的, 所谓的 active member 06/16 02:09
2F:→ loveme00835: 就是已经建构好的物件, 如果你要改用另外一个物件就 06/16 02:09
3F:→ loveme00835: 必须要先解构当前的 active member 再去建构另一个, 06/16 02:09
4F:→ loveme00835: 在 C++ 里所有物件都要经过建构才能用, 只有将指标转 06/16 02:09
5F:→ loveme00835: 型无视这个规则的都是 UB 06/16 02:09
6F:→ loveme00835: 对於 non-class object 也是同理, 建构子/解构子一整 06/16 02:12
7F:→ loveme00835: 套流程缺一不可 06/16 02:12
8F:→ loveme00835: 如果懒得自己处理就改用 std::variant 吧 06/16 07:34
9F:→ lovejomi: 可是primitive type要怎麽建构解构(syntax)? 06/16 09:49
10F:→ lovejomi: 如果要这样 那之前在C work的union写法 在C++是不是无法 06/16 09:50
11F:→ lovejomi: 使用, 如我举例的Endian 例子...连primitive type也UB? 06/16 09:50
13F:→ lovejomi: 合理吗@@ 这样我补上解构 不就不对称了 06/16 09:51
15F:→ loveme00835: 有 06/16 10:50
16F:→ loveme00835: [class.union]/7 06/16 10:51
18F:→ lovejomi: u.i.~int_t(); 我有私底下这样写但实在从来没看过 06/16 11:18
19F:→ lovejomi: 但这也证明了 endian那种用法在C++完全是个错误? 06/16 11:18
20F:→ lovejomi: 但也像我第一个问题讲的 这种UB真的是无法接受的吗? 06/16 11:19
21F:→ lovejomi: 您的例子 透过placement new才会有建构子呼叫 06/16 11:20
22F:→ lovejomi: 如果一开始就要用 u.s 该怎麽办呢 06/16 11:21
24F:→ lovejomi: 是不是 要调整s为第一个 并且 在 {{一定要写}} ? 06/16 11:25
25F:→ loveme00835: UB 是灰色地带, 只要你确定使用的编译器行为会如你预 06/16 11:26
26F:→ loveme00835: 期, 那 UB 就只是可携性比较差而已. 很多低阶的记忆 06/16 11:26
27F:→ loveme00835: 体操作都是 UB 要靠标准慢慢补完. 可以参考 [P0593] 06/16 11:26
28F:→ lovejomi: 恩 那 没跑到建构子是不是也是可接受? 06/16 11:50
29F:→ loveme00835: 当然不是这样说 0rz 你没有跑完 ctor 自然连 dtor 也 06/16 12:51
30F:→ loveme00835: 不会跑, 尤其是对有 side-effect 的 ctor 来说更是一 06/16 12:52
31F:→ loveme00835: 定要呼叫 06/16 12:52
32F:→ lovejomi: 我对side effect这词用在这领域没什麽感觉,可否给我一 06/16 19:18
33F:→ lovejomi: 些延伸资讯呢 谢谢 06/16 19:18
34F:→ loveme00835: 偶觉得你还是先把基础打好 06/16 20:17
35F:推 CoNsTaR: 想要有保障就用 inheritance,不要用 union 啊 06/21 11:02
36F:→ CoNsTaR: 要用 union 就要自己人脑生成 induction principles 和 06/21 11:07
37F:→ CoNsTaR: 检查所有 introduction/elimination 06/21 11:07