作者shane87123 (阳光大肥宅)
看板CompilerDev
标题[问题] 两种不同执行档产生方式,导致时间不同
时间Tue Nov 2 22:58:37 2021
大家好,
我今天有一个程式,内部有计算时间的 code
转成 ll 档後,(input.ll)
使用 lli input.ll,得到 run time = t1,
现在我用以下两种方法得到执行档:
$ clang input.ll -o output1
$ ./outout1
得到 run time = t2,
$ llc input.ll
$ as input.s -o input.o
$ clang input.o -o output2
$ ./output2
得到 run time = t3。
t1, t2, t3的关系为:t1 = t3 < t2
直接由 clang 得到的执行档执行速度最慢,
而经过一连串的 compile 得执行档,执行速度和 lli 得到的一样,
想请问为什麽有这样的差异存在?
直接由 clang 出来的是 a.out。
哪一种作为测量 run time 最合适?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.141.75.78 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/CompilerDev/M.1635865119.A.747.html
1F:推 nash0914: 先确定一下3种方式所经历的优化pass有什麽不同 —print-11/02 23:42
2F:→ nash0914: after-all 观察一下 每个经历过的pass11/02 23:42
clang 似乎没有这个 flag?
我期待的是,经过这些编译,是不会有任何优化的。我的目的是要测我自己的优化 pass
的 run time 如何,希望中间不加任何pass.
感觉 lli最准?也就是第二种产生方式。
※ 编辑: shane87123 (220.141.75.78 台湾), 11/03/2021 00:26:22
3F:→ Lipraxde: 那这样的话你可以用 opt 去指定跑你要的优化,然後用 l11/03 00:55
4F:→ Lipraxde: lc 做 codegen、codegen 的优化。opt、llc 两个 tool11/03 00:55
5F:→ Lipraxde: 分别是用来跑 target-independent、target-dependent11/03 00:55
6F:→ Lipraxde: 的 pass pipeline 的11/03 00:55
7F:→ Lipraxde: 要跑自己的 pass 去比较差异会比较建议用上述的作法,11/03 01:02
8F:→ Lipraxde: 这样还可以拿到 object file 来看有没有如预期 codegen11/03 01:02
9F:→ Lipraxde: 。用 clang 的话要指定 pass、优化程度比较麻烦,而 ll11/03 01:02
10F:→ Lipraxde: i 则是用 interpreter + JIT 的方式,要看到 codegen11/03 01:02
11F:→ Lipraxde: 的结果会比较难一些。11/03 01:02
其实我主要是想做 target-independent 的优化顺序这块,单纯想比较
target-independent 的优化哪个种顺序比较好
llc 我刚刚看一下,似乎预设就是 O2,那感觉第二种方式就比较不好了
llc 所得到的 assembly code,要怎麽做才能得到 executable file?
as 之後拿到 object code,ld 会出错,用 clang 传 -O0 会是好方法吗?
※ 编辑: shane87123 (114.43.59.118 台湾), 11/03/2021 09:25:23
12F:推 nash0914: clang 请下 -mllvm —print-after-all 另外要测试自己11/03 10:50
13F:→ nash0914: 的优化pass 感觉不应该把其他的关掉 这样会造成自己所11/03 10:50
14F:→ nash0914: 做的优化pass 看起来很厉害 跟实际上的使用情况有所不同11/03 10:50
15F:推 nash0914: 需要考虑自己的优化pass是在做什麽 安排在哪些优化pass11/03 10:53
16F:→ nash0914: 後做自己的优化pass比较适当 过去经验有时候是看benchma11/03 10:53
17F:→ nash0914: rk的结果来决定XD11/03 10:53
我现在的顺序就是这样,不过刚好相反,
如果把llc的O2关起来 performance 比opt O3差
但把llc O2 开起来 performance 比 opt O3好XDD
另外想问,benchmark要去哪里找比较好?
我现在是自己找一些执行时间比较久的 c code来测
※ 编辑: shane87123 (101.10.95.108 台湾), 11/03/2021 13:54:31
18F:→ Lipraxde: 痾... opt -O3 && llc -O2 的 performance 比 opt -O311/03 19:52
19F:→ Lipraxde: && llc -O0 还好好像还蛮合理的吧?还是我理解错你的意11/03 19:52
20F:→ Lipraxde: 思?11/03 19:52
抱歉,没有表达清楚
Opt 我的 pass sequence + llc O2 效能比
Opt O3 + llc O2 好
但opt 我的 pass sequence +llc O0 效能比 opt O3 + llc O0差
※ 编辑: shane87123 (101.10.93.31 台湾), 11/04/2021 09:24:31
21F:→ Lipraxde: 如果是做调整 target-independent 的 pass 顺序的调整 11/05 12:27
22F:→ Lipraxde: 的话,把 llc 固定用 O2 吧XD 11/05 12:27
了解,我现在也是直接用 llc 预设的(O2)
※ 编辑: shane87123 (114.43.59.118 台湾), 11/07/2021 14:08:07