作者wei115 (NEET)
看板C_and_CPP
標題[問題] 區域變數是如何存在記憶體上的?
時間Sun Dec 8 16:50:35 2019
感覺C點比較弱,可能和ASM比較有關系,但這裡人多,就發在這了:p
如題
小弟最近在寫一個簡單的C編譯器,但對於區域變數是如何放在堆疊上的有些迷惑
例如
int main()
{
int a = 111;
if(a)
int b = 222;
int c = 333;
return 0;
}
一開始我是想說,編譯器是在要使用時才把變數push到堆疊上的
像是遇到a = 111,就在堆疊上push一個111,然後只有if成立時才把222 push到堆疊上,
反之則跳過
可是看了好幾個組合語言的範例(x86 Arm),好像會先計算在這函數中所有可能會用到變
數大小然後一次性push到堆疊上
例如剛剛的C程式,如果if成立會有a、b、c三個int,不成立會有a、c兩個int
而看到的實作則是不管有沒有b都先分配空間給他
但以C來說,在if內宣告的變數,他的生命週期應該就只在if內,但如果以這樣的實作,
在if內的變數,只要知道他的記憶體位置,就算在if外也能存取(因為有事先分配空間,
而且沒有回收),不太理解為什麼要這麼做
有沒有相關資料是講這方面細節的,謝謝
(寫完後發現C點真的好少.....會不會被刪阿orz....)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.224.234.183 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_and_CPP/M.1575795040.A.65E.html
1F:推 jerryh001: 因為快 一編譯下去相對位置就固定了 而且scope只有在高 12/08 17:16
2F:→ jerryh001: 階的時候才有意義 進到組合語言後沒在管這個 12/08 17:16
3F:推 Fenikso: 你要怎麼只回收b, 移動rsp嗎? 這樣也沒有真的回收喔 12/08 17:19
4F:推 harryooooooo: 照你說的在進到scope時才分配的話,就跟把scope當fu 12/08 17:20
5F:→ harryooooooo: nction call差不多意思了。語意上沒什麼問題但是會 12/08 17:20
6F:→ harryooooooo: 有效能損失吧,只有看過把function inline的沒看過 12/08 17:20
7F:→ harryooooooo: 反過來的。而且還要重新維護scope外的變數的offset 12/08 17:20
8F:→ harryooooooo: ,損失應該真的不小。 12/08 17:20
我自己猜想也是為了效能,但很好奇相關細節
因為直覺來想,如果是用到時再分配空間,那只需要讀一次AST
如果是先分配,那就要讀兩次,一次確定空間,另一次產生組合語言
然後現在在想用哪種方式實作比較好,所以想知道來龍去脈
9F:→ Lipraxde: 如果 backend 是 stack architecture 的話就會看到你說 12/08 18:18
10F:→ Lipraxde: 的那種方式了,你看的範例應該都是 register architect 12/08 18:18
11F:→ Lipraxde: ure 12/08 18:18
我一開始以為register archure的stack也承擔計算的功能,可是後來發現他只負責分配
空間和function call
12F:推 iaminanl: 如果-O都沒有開,compiler就不會有優化(security conce 12/08 19:31
13F:→ iaminanl: rn是優化的一部分) 12/08 19:31
16F:推 iaminanl: 每個compiler都差不多,可以做多一點實驗看看 12/08 19:35
我是用-O0測試的然後如果程式裡沒有call function,分配就比較隨意(有變數再加一個偏
移)
如果有call,就會在function的開頭先分配所有空間,然後不確定這是不是最佳化
※ 編輯: wei115 (125.224.234.183 臺灣), 12/08/2019 19:56:47
17F:推 suhorng: 直接預先算好的優點前面推文說過了 另外 push/pop 會 12/09 09:06
18F:→ suhorng: 改變 stack pointer, 反而不一定有固定 %rsp + 位移快 12/09 09:07
19F:→ suhorng: 另外, 最後生命週期那段有錯. 記憶體空間在那裏並不代表 12/09 09:07
20F:→ suhorng: 變數還活著. 因為已經結束了生命週期, 再去存取是未定義 12/09 09:10
21F:→ suhorng: 的, 甚至同樣的位址再分配給別的變數也有可能 12/09 09:11
嗯嗯,了解
我知道這是未定義行為,編譯器隨時可能最佳化掉這些行為
但對具體是依據怎樣的標準去產生組合語言不太了解
我的理解是編譯器後端一邊遍歷AST一邊根據當下的語句去產生對應的組合語言
但遇到語句時要產生怎樣的組合語言並不清楚
目前是看gcc產生的組合語言學習
但不知道為什麼要這樣產生
23F:→ jepk007: if內變數的生命週期不也是整個函數嗎 12/09 10:13
24F:→ xam: 自修嗎? 這些東西計算機組織/結構,編譯器的課程會學到.. 12/09 12:06
是自修沒錯
但目前看到的書沒有很具體講一個編譯器要怎麼寫
目前是邊看資料,邊讀jserv的MazuCC的原始碼學習
※ 編輯: wei115 (120.109.130.64 臺灣), 12/09/2019 14:40:58
25F:推 nullptr: if內變數的生命週期只在if內喔, 出了之後再去讀是syntax 12/24 03:57
26F:→ nullptr: error; 如果把&b存進pointer然後去讀的話是UB 12/24 03:58
27F:→ nullptr: 因為是UB所以編譯器可能拿B的空間給C用 12/24 04:00