作者lovejomi (JOMI)
看板C_and_CPP
標題[問題] union 的undefine behavior
時間Tue Jun 16 00:35:43 2020
平常真的很少用union 所以當要用的時候還是查了一下
https://en.cppreference.com/w/cpp/language/union
S s = {0x12345678}; // initializes the first member, s.n is now the active
member
// at this point, reading from s.s or s.c is undefined behavior
诶, 這不就是常看到union的標準用法嗎?
於是我再找找
http://isocpp.github.io/CppCoreGuidelines/CppCoreGuidelines#Ru-pun
恩....真的是undefined behavior.....完全顛覆我之前對union的認知
原來看到這種union { struct{} , array;} 全部都是UB...
想問一下
1. 即使他是 書本上的UB 但是不是可以說 所有已知compiler實作上都讓他效果一致
也就是常用的那套手段也沒什麼問題, 真的這樣寫 也不用太苛責?
2. 如果真的不想寫出UB 的程式碼, 是不是只能用reinterpret_cast
例如
union Endian{
int a;
char b;
};
改用
int a = 1; char b = *(reinterpret_cast<char*>(&a));
對於reinterpret_cast每當用 都很怕是UB,
有沒有什麼通則可以快速確認是否轉型是UB呢?
以上 (今天才知道union 這樣寫是UB, 實在很震驚)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.12.193.155 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_and_CPP/M.1592238947.A.863.html
※ 編輯: lovejomi (39.12.193.155 臺灣), 06/16/2020 01:00:08
1F:→ loveme00835: 你的認知應該是從 C 語言來的, 所謂的 active member 06/16 02:09
2F:→ loveme00835: 就是已經建構好的物件, 如果你要改用另外一個物件就 06/16 02:09
3F:→ loveme00835: 必須要先解構當前的 active member 再去建構另一個, 06/16 02:09
4F:→ loveme00835: 在 C++ 裡所有物件都要經過建構才能用, 只有將指標轉 06/16 02:09
5F:→ loveme00835: 型無視這個規則的都是 UB 06/16 02:09
6F:→ loveme00835: 對於 non-class object 也是同理, 建構子/解構子一整 06/16 02:12
7F:→ loveme00835: 套流程缺一不可 06/16 02:12
8F:→ loveme00835: 如果懶得自己處理就改用 std::variant 吧 06/16 07:34
9F:→ lovejomi: 可是primitive type要怎麼建構解構(syntax)? 06/16 09:49
10F:→ lovejomi: 如果要這樣 那之前在C work的union寫法 在C++是不是無法 06/16 09:50
11F:→ lovejomi: 使用, 如我舉例的Endian 例子...連primitive type也UB? 06/16 09:50
13F:→ lovejomi: 合理嗎@@ 這樣我補上解構 不就不對稱了 06/16 09:51
15F:→ loveme00835: 有 06/16 10:50
16F:→ loveme00835: [class.union]/7 06/16 10:51
18F:→ lovejomi: u.i.~int_t(); 我有私底下這樣寫但實在從來沒看過 06/16 11:18
19F:→ lovejomi: 但這也證明了 endian那種用法在C++完全是個錯誤? 06/16 11:18
20F:→ lovejomi: 但也像我第一個問題講的 這種UB真的是無法接受的嗎? 06/16 11:19
21F:→ lovejomi: 您的例子 透過placement new才會有建構子呼叫 06/16 11:20
22F:→ lovejomi: 如果一開始就要用 u.s 該怎麼辦呢 06/16 11:21
24F:→ lovejomi: 是不是 要調整s為第一個 並且 在 {{一定要寫}} ? 06/16 11:25
25F:→ loveme00835: UB 是灰色地帶, 只要你確定使用的編譯器行為會如你預 06/16 11:26
26F:→ loveme00835: 期, 那 UB 就只是可攜性比較差而已. 很多低階的記憶 06/16 11:26
27F:→ loveme00835: 體操作都是 UB 要靠標準慢慢補完. 可以參考 [P0593] 06/16 11:26
28F:→ lovejomi: 恩 那 沒跑到建構子是不是也是可接受? 06/16 11:50
29F:→ loveme00835: 當然不是這樣說 0rz 你沒有跑完 ctor 自然連 dtor 也 06/16 12:51
30F:→ loveme00835: 不會跑, 尤其是對有 side-effect 的 ctor 來說更是一 06/16 12:52
31F:→ loveme00835: 定要呼叫 06/16 12:52
32F:→ lovejomi: 我對side effect這詞用在這領域沒什麼感覺,可否給我一 06/16 19:18
33F:→ lovejomi: 些延伸資訊呢 謝謝 06/16 19:18
34F:→ loveme00835: 偶覺得你還是先把基礎打好 06/16 20:17
35F:推 CoNsTaR: 想要有保障就用 inheritance,不要用 union 啊 06/21 11:02
36F:→ CoNsTaR: 要用 union 就要自己人腦生成 induction principles 和 06/21 11:07
37F:→ CoNsTaR: 檢查所有 introduction/elimination 06/21 11:07