作者xiaotee (晓薙)
看板PC_Shopping
标题[测试] I家E core在Ansys Fluent中的效能表现
时间Fri Jun 21 22:39:19 2024
懒人包:没有用
部落格好读版:
https://soulattic.blogspot.com/2024/06/intel-13th-cpuansys-fluent.html
1. 前言
由於工作上时常需要使用CFD(计算流体力学)软体来模拟,加上对电脑硬体有些认识,成了
成了本次做这一些小测试的契机。
念研究所的时候12代刚上,当时有时间可以进行测试,实验室的设备费却已经乾了,因此一
直没能买有大小核设计的CPU来进行一些CFD运算的测试。我看到的大多说法都说大小核
设计有助於计算密集型的生产力应用,例如渲染、剪片转档等等,也确实在Cinebench之类
的跑分软体中有十分强悍的表现。
网路上国内外的评测都鲜少提到CFD软体的测试成绩,只有少数评测网站会测试开源的CFD软
体OpenFOAM,但测出来的结果却差异甚大。
在AnandTech的测试中intel 13/14th 全面领先Ryzen 7000系
在Phoronix的测试中7950x3d却反将一军
目前工作上使用的软体是ANSYS Fluent,因此本文将会以这个软体做为测试主轴。但合法的
ANSYS软体一套要价数百万,只好跟公司借用借用,嘿嘿。
利用了下班时间跑了ANSYS Fluent的Benchmark Case做了一些测试,留个纪录想要抛砖引玉
2. 测试环境
A. 软体版本: ANSYS Fluent 23R2
B. Benchmark Case: ANSYS Fluent, External Flow Over an Aircraft Wing
(aircraft_2m)
C. 网格数量: 2m(200万)
D. 网格类型: Hexa(六面体)
E. 紊流模型: realizable k-eps turbulence
F. 求解器类型: Pressure based coupled solver, Green Gauss Node based, steady
G. 电脑配备:
CPU: Intel i7 13700 nonK
Cooler: Thermalright BA120
MB: ASUS B760-A WiFi D4
RAM: Kingston Fury DDR4-3200 32GBx2 @3466
SSD: ADATA S70 pro 2TB
Case: CM TD500 MESH V2
H. 环境温度24度C,观测HWinfo软体全测试无出现撞温度墙的状况。
I. 电源计画: 高效能
合法的ANSYS Fluent一次最多只能使用4核心运算,想另外加核心数上去就必须购买HPC(Hig
h Performance Computing)。
而这个HPC也是动辄百来万的东西,因此在这边只使用1个软体本体+1个HPC的License,总共
总共12核心下去做运算,我想在有限的核心数量下找出最佳的组合也比较符合预算有限的且
只能使用合法软体的单位。
3. 测试结果
必须要先做说明,我有找到原厂的电脑设定建议,里头是建议关掉超执行绪(Hyper-Thread,
因此刚开始测试都是关闭HT的状况,後来才想说要把HT打开测试看看。
以下是测试结果,橘框是P core:
A. 6P6E (no HT)
Simulation wall-clock time for 1800 iterations 4085 sec
6P6E是将HT关掉後,在Windows 11下的自动核心调度结果
进工作管理员看是有指定CPU亲和性在每个运作的核心上的
https://i.imgur.com/GadJ4lb.png
B. 8P4E (no HT)
Simulation wall-clock time for 1800 iterations 3920 sec
8P4E是我在工作管理员中手动将CPU亲和性调度到8个P核上的结果
https://i.imgur.com/3XH3Yia.png
C. 全预设 (自由调度)
Simulation wall-clock time for 1800 iterations 3630 sec
全预设状况下把HT重新打开,这时进工作管理员查看会发现CPU亲和性没有被指定
但从工作管理员上可以推断出应该是跑在12个P核的执行绪上
https://i.imgur.com/uVanIiv.png
D. 8P0E (no HT)
SSimulation wall-clock time for 1800 iterations 3683 sec
把小核跟HT都关了,软体设定8核心运算,只用8C8T下去跑,这个就没有特别截图了
E. 8P0E(有开HT,用12个执行绪在跑)
Simulation wall-clock time for 1800 iterations 3578 sec
关小核但开HT,看工作管理员,也有指定CPU亲和性在前12个执行绪上
https://i.imgur.com/65t7BYt.png
4. 总结
基本上可以将结果分为两群:
i. 有E核参加运算(A、B)
ii. 无E核参加运算(C、D、E)
https://i.imgur.com/5eo1FTG.png
其中i群内8P4E相较於6P6E快了4.2%,好像有些差别
ii群内8P0E无HT比预设慢了1.4%,8P0E有HT比预设快了1.5%,这应该可以被认为是误差
i群平均(4002.5s)相较於ii群平均(3630.3s)慢了10.3%
甚至可以从B跟D的比较中发现8P4E比8P0E还慢!!
我认为这可以归因於CFD的特性,CFD是一种吃重记忆体频宽的应用。
在消费级平台上只有双通道的记忆体频宽被P核和E核共享,结果就是没有让速度较快的P核
发挥全部的算力,进而导致整体计算时间拉长。
因为还没测试过AMD平台,所以不能说全大核的AMD平台就比较好。但可以得到的结论是:
算CFD完全没有买13900/K的必要,因为P核数量并没有增加。
以上结果供各位参考,如有关於购买CFD模拟用硬体设备也欢迎留下建议。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.173.25.76 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1718980761.A.4DA.html
※ 编辑: xiaotee (1.173.25.76 台湾), 06/21/2024 22:44:15
※ 编辑: xiaotee (1.173.25.76 台湾), 06/21/2024 22:46:49
1F:推 Dcpp2015: 有数据有推36.238.90.61 06/21 22:46
谢谢推
2F:推 bior1234: 每个小核簇(每4个小核)共用一个记忆36.232.148.201 06/21 22:49
3F:→ bior1234: 体节点,在memory intensive的程式表现36.232.148.201 06/21 22:49
4F:→ bior1234: 会很差36.232.148.201 06/21 22:49
感谢说明~
5F:推 soapmactony: 推测试,我以为我在看小论文1.162.93.146 06/21 22:50
其实只是废话比较多的简易测试而已
6F:推 smallreader: 记忆体频宽 那L3快取大小会不会也有111.254.183.69 06/21 22:51
我印象中看别人测的数据是有差
https://reurl.cc/4r76R2
https://i.imgur.com/P69E3N7.png
7F:推 mrme945: 原po有没有考虑7000系也测一篇来比较111.71.212.146 06/21 22:55
没...没有多余的预算了
8F:推 Kowdan: 推测试,太详细了吧,我还是买AMD好了118.169.21.174 06/21 22:55
谢谢推
9F:→ smallreader: 喔~没事 x3d提到评测已经讲完了111.254.183.69 06/21 22:56
10F:推 Klauhal: Intel什麽时候放弃大小核架构114.34.167.89 06/21 23:03
※ 编辑: xiaotee (1.173.25.76 台湾), 06/21/2024 23:19:11
11F:推 E7lijah: 推分享27.52.38.5 06/21 23:21
12F:→ E7lijah: 是说这台电脑是你自己的还是实验室的27.52.38.5 06/21 23:23
是...是公司的
13F:推 dos01: 吃重记忆体频宽? 所以用D4跑跟D5理论上来说182.155.78.98 06/21 23:24
14F:→ dos01: 应该会有差距?182.155.78.98 06/21 23:24
理论上是这样,因为同样D4-3200,跑双通道、四通道、八通道的求解速度天差地远
15F:推 yuu123: 懒人包简单暴力,害我笑出来1.200.10.90 06/21 23:26
※ 编辑: xiaotee (1.173.25.76 台湾), 06/21/2024 23:32:57
16F:→ E7lijah: 实验室的SSD拿S70 Pro我有点担心27.52.38.5 06/21 23:42
17F:→ E7lijah: *公司27.52.38.5 06/21 23:42
资料碟而已,系统碟是SN770...XD
不是我配的,不要看我
18F:推 sdbb: 感谢112.104.64.201 06/22 00:08
19F:→ YouCantGetME: 有撞功耗墙吗?59.127.199.236 06/22 00:10
看起来都没有撞功耗墙喔
有确认过主板内PL1/2都设定在253W
各项测试跑起来最多到160w左右而已
20F:推 fu1vu03: 最快的居然是把小核关了w211.76.58.165 06/22 00:43
21F:→ mtc5566: 多核围观39.10.8.240 06/22 01:07
22F:推 Luciferspear: 我喜欢你这麽粗暴1.171.242.95 06/22 02:17
23F:推 jyhfang: 推 懒人包 XD220.134.41.251 06/22 03:23
24F:推 BlackCoal: 简单粗暴的结论220.142.135.215 06/22 04:45
我怕我废话太多没人看QQ
25F:→ spfy: 这应该还蛮有参考价值的吧 这种商业软体很少124.218.223.231 06/22 06:57
26F:→ spfy: 人能测 而且原PO也满详细的124.218.223.231 06/22 06:57
※ 编辑: xiaotee (101.8.26.47 台湾), 06/22/2024 07:22:38
27F:推 arrenwu: 推 这个软体使用者普遍太专业XDDD98.45.195.96 06/22 07:30
28F:推 lamlinjimmy: 有拖後腿效用啊 怎麽能说没有用= =1.34.164.202 06/22 07:31
29F:推 kira925: X3D对这些EDA应用是超强的...220.135.86.145 06/22 07:32
※ 编辑: xiaotee (101.8.26.47 台湾), 06/22/2024 07:40:29
※ 编辑: xiaotee (101.8.26.47 台湾), 06/22/2024 07:50:05
30F:→ y40103: 大小核还要赌软体设计/OS调度 真的不如直111.249.142.175 06/22 08:13
31F:→ y40103: 接AMD 大小核比较像Intel的遮羞布 功耗狂111.249.142.175 06/22 08:13
32F:→ y40103: 拉 跑分才会好看111.249.142.175 06/22 08:13
33F:推 zseineo: 推223.140.170.202 06/22 08:21
34F:推 jjjjdong: 清楚有料的实测 推推101.136.149.212 06/22 09:00
35F:推 star07: 同跑CFD 帮推推111.252.172.218 06/22 09:08
谢谢推
36F:推 kingpaul: 感谢测试,这结论有厘清一些我操作上的 118.160.61.12 06/22 09:08
37F:→ kingpaul: 疑问,连原厂工程师都没解释清楚 118.160.61.12 06/22 09:08
谢谢推,我有请代理商去问原厂,也是给罐头回覆而已~
只好自己测试看看
38F:推 Lemming: 推 关小核派不推不行 1.170.185.115 06/22 09:09
39F:→ Lemming: SN770就另一种卖牌子的 1.170.185.115 06/22 09:09
40F:→ Lemming: WD的nvme根本就是SN580绿标 SN770蓝标 1.170.185.115 06/22 09:10
41F:→ Lemming: 但改个标色很有帮助 1.170.185.115 06/22 09:10
小核日常使用还不错,就不适合这种记忆体密集的应用
42F:推 blueash: intel 大小核吹上天 实际应用一跑笑死人 42.75.131.185 06/22 09:14
43F:→ blueash: 这个测试结论简单粗暴 我喜欢 42.75.131.185 06/22 09:14
44F:推 amos30627: 小核跑分用的 玩游戏也用不到 101.9.196.171 06/22 09:15
45F:推 skyrain1234: 推测试 106.1.186.50 06/22 09:24
46F:推 chocoball: 多补一些数据就论文了 而且结论有趣220.142.150.146 06/22 09:35
47F:→ ILike58: 结果传统的加强记忆体阶层还是比较受用。 42.70.164.240 06/22 09:37
48F:推 tommyhunter: 推测试!虽然不会用到Fluent了 36.239.139.176 06/22 09:47
祝你未来一切顺利~
49F:推 Ahhhhaaaa: 从i7-12700的8P4E、i9-12900的8P8E 123.192.245.57 06/22 09:50
50F:→ Ahhhhaaaa: 往上一代都是在增加E核而已 123.192.245.57 06/22 09:50
51F:推 roseritter: 好直接的结论xd 111.254.61.191 06/22 10:53
52F:推 oblrtippo: 推 49.216.221.13 06/22 11:04
53F:推 nucleargod: 只差全小核了,这有办法测吗 118.167.21.216 06/22 11:31
应该是没有要测全E核啦...毕竟License数量限制在那,当然是用快的下去跑啊!
54F:推 san06182003: 推 不知道static structural 或Ansys 36.238.155.33 06/22 11:41
55F:→ san06182003: lsdyna是不是一样结果 36.238.155.33 06/22 11:41
谢谢推,也希望有人可以跑跑Benchmark case罗~
56F:推 klo1227: 有数据给推 223.138.55.131 06/22 12:12
57F:推 greg7575: 谢谢 111.251.230.53 06/22 12:22
58F:推 AbeNana: 优文 111.71.213.212 06/22 12:31
59F:推 jay920314: 推 1.200.40.85 06/22 13:53
60F:推 aotom: E核到底有没有用我觉得不好下定论,像是20 114.43.30.199 06/22 13:55
61F:→ aotom: 77我关HT开E核,FPS有比较高一些 114.43.30.199 06/22 13:55
62F:→ aotom: 但原PO环境下,开E核看起来就是悲剧 114.43.30.199 06/22 13:55
63F:推 aotom: 大小核主要还是调度问题 114.43.30.199 06/22 14:05
64F:推 tyr2004: 有料,推个 223.139.104.91 06/22 14:26
65F:推 paul40807: 谢谢懒人包 111.255.68.122 06/22 14:44
66F:推 allyourshit: 推 1.34.92.164 06/22 15:29
67F:推 est: 推测试118.161.169.190 06/22 16:19
68F:推 se2104: 推 122.55.34.138 06/22 16:36
69F:推 wsc47621: 全大核没有问题 124.6.4.211 06/22 17:11
70F:推 i9602283: 之前测试过公司用的Flotherm 58.114.66.151 06/22 18:25
71F:→ i9602283: 跟楼主的结论差不多 58.114.66.151 06/22 18:26
72F:→ i9602283: 关掉HT,关掉E核会比较快 58.114.66.151 06/22 18:26
73F:→ i9602283: 另外记忆体频宽大速度明显有差 58.114.66.151 06/22 18:27
谢谢回报,其实我也测过FloTHERM,但我忘记留数据就没有写成文章了
但有发现没有改高效能电源计画的话会全跑在E核上 XD
FloTHERM还有N卡会闪退的问题...
74F:推 coox: 看不懂QQ 为什麽有E反而比没E慢 36.236.199.199 06/22 18:57
白话一点就是,E核加入运算之後,P核需要等E核算完才能算下一步~
75F:→ leviva: 推测试,不过买的起这软体,至少要上64核 27.53.113.173 06/22 19:31
76F:→ leviva: 心吧,不会用家用型 27.53.113.173 06/22 19:31
64核要用3个HPC,请问软体要花多少钱呢(X
这类软体一个很大的问题就是用越多核心数的机器运算也代表要花越多钱买软体 哈哈
77F:推 yeeouo: 哪有差不多,楼主不关HT比较快吧 124.213.115.96 06/22 19:39
78F:推 smallreader: 开HT就该比较快 关HT是考量增幅太小 111.254.183.69 06/22 20:28
79F:→ smallreader: (这里增幅小因为被记忆体频宽限制住) 111.254.183.69 06/22 20:32
80F:→ smallreader: 如果没有记忆体瓶颈 例如测cb 那HT分 111.254.183.69 06/22 20:35
81F:→ smallreader: 数还是有显着差异 (耗电也UP就是了) 111.254.183.69 06/22 20:35
我印象中有同事跟我说他开/关HT测另一款CFD软体 Star-CCM+,会快一点点点
就真的一点点
82F:推 weimr: 有数据有推 61.224.129.203 06/22 22:27
83F:推 samjovi: 大推~刚使用12700H关E核跑PICS3D也快17%180.217.129.211 06/22 23:32
谢谢测试
※ 编辑: xiaotee (1.173.25.76 台湾), 06/23/2024 01:08:06
84F:推 ATND: 推 223.139.81.184 06/23 09:39
85F:推 CarelessWind: 期待A家测试 42.78.9.123 06/23 19:22