作者shane87123 (陽光大肥宅)
看板CompilerDev
標題[問題] 兩種不同執行檔產生方式,導致時間不同
時間Tue Nov 2 22:58:37 2021
大家好,
我今天有一個程式,內部有計算時間的 code
轉成 ll 檔後,(input.ll)
使用 lli input.ll,得到 run time = t1,
現在我用以下兩種方法得到執行檔:
$ clang input.ll -o output1
$ ./outout1
得到 run time = t2,
$ llc input.ll
$ as input.s -o input.o
$ clang input.o -o output2
$ ./output2
得到 run time = t3。
t1, t2, t3的關係為:t1 = t3 < t2
直接由 clang 得到的執行檔執行速度最慢,
而經過一連串的 compile 得執行檔,執行速度和 lli 得到的一樣,
想請問為什麼有這樣的差異存在?
直接由 clang 出來的是 a.out。
哪一種作為測量 run time 最合適?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.75.78 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/CompilerDev/M.1635865119.A.747.html
1F:推 nash0914: 先確定一下3種方式所經歷的優化pass有什麼不同 —print-11/02 23:42
2F:→ nash0914: after-all 觀察一下 每個經歷過的pass11/02 23:42
clang 似乎沒有這個 flag?
我期待的是,經過這些編譯,是不會有任何優化的。我的目的是要測我自己的優化 pass
的 run time 如何,希望中間不加任何pass.
感覺 lli最準?也就是第二種產生方式。
※ 編輯: shane87123 (220.141.75.78 臺灣), 11/03/2021 00:26:22
3F:→ Lipraxde: 那這樣的話你可以用 opt 去指定跑你要的優化,然後用 l11/03 00:55
4F:→ Lipraxde: lc 做 codegen、codegen 的優化。opt、llc 兩個 tool11/03 00:55
5F:→ Lipraxde: 分別是用來跑 target-independent、target-dependent11/03 00:55
6F:→ Lipraxde: 的 pass pipeline 的11/03 00:55
7F:→ Lipraxde: 要跑自己的 pass 去比較差異會比較建議用上述的作法,11/03 01:02
8F:→ Lipraxde: 這樣還可以拿到 object file 來看有沒有如預期 codegen11/03 01:02
9F:→ Lipraxde: 。用 clang 的話要指定 pass、優化程度比較麻煩,而 ll11/03 01:02
10F:→ Lipraxde: i 則是用 interpreter + JIT 的方式,要看到 codegen11/03 01:02
11F:→ Lipraxde: 的結果會比較難一些。11/03 01:02
其實我主要是想做 target-independent 的優化順序這塊,單純想比較
target-independent 的優化哪個種順序比較好
llc 我剛剛看一下,似乎預設就是 O2,那感覺第二種方式就比較不好了
llc 所得到的 assembly code,要怎麼做才能得到 executable file?
as 之後拿到 object code,ld 會出錯,用 clang 傳 -O0 會是好方法嗎?
※ 編輯: shane87123 (114.43.59.118 臺灣), 11/03/2021 09:25:23
12F:推 nash0914: clang 請下 -mllvm —print-after-all 另外要測試自己11/03 10:50
13F:→ nash0914: 的優化pass 感覺不應該把其他的關掉 這樣會造成自己所11/03 10:50
14F:→ nash0914: 做的優化pass 看起來很厲害 跟實際上的使用情況有所不同11/03 10:50
15F:推 nash0914: 需要考慮自己的優化pass是在做什麼 安排在哪些優化pass11/03 10:53
16F:→ nash0914: 後做自己的優化pass比較適當 過去經驗有時候是看benchma11/03 10:53
17F:→ nash0914: rk的結果來決定XD11/03 10:53
我現在的順序就是這樣,不過剛好相反,
如果把llc的O2關起來 performance 比opt O3差
但把llc O2 開起來 performance 比 opt O3好XDD
另外想問,benchmark要去哪裡找比較好?
我現在是自己找一些執行時間比較久的 c code來測
※ 編輯: shane87123 (101.10.95.108 臺灣), 11/03/2021 13:54:31
18F:→ Lipraxde: 痾... opt -O3 && llc -O2 的 performance 比 opt -O311/03 19:52
19F:→ Lipraxde: && llc -O0 還好好像還蠻合理的吧?還是我理解錯你的意11/03 19:52
20F:→ Lipraxde: 思?11/03 19:52
抱歉,沒有表達清楚
Opt 我的 pass sequence + llc O2 效能比
Opt O3 + llc O2 好
但opt 我的 pass sequence +llc O0 效能比 opt O3 + llc O0差
※ 編輯: shane87123 (101.10.93.31 臺灣), 11/04/2021 09:24:31
21F:→ Lipraxde: 如果是做調整 target-independent 的 pass 順序的調整 11/05 12:27
22F:→ Lipraxde: 的話,把 llc 固定用 O2 吧XD 11/05 12:27
了解,我現在也是直接用 llc 預設的(O2)
※ 編輯: shane87123 (114.43.59.118 臺灣), 11/07/2021 14:08:07