作者yqwu (走走)
看板Linux
标题[问题] cluster双CPU设定
时间Thu Jun 18 15:34:11 2015
想要请教一下
之前旧的实验室cluster的子机 本来都是用六核心单CPU
最近买了新的子机 是两个六核心的CPU
可是安装完成之後 跑起来的效能和单CPU的一样
想请教一下
cluster双CPU有需要做甚麽特别的设定
才能顺利用双CPU做平行计算呢
我们是使用openmp的平行化方式
谢谢
--
每年的耶诞节 我只许一个愿
我希望 我爱的人 有一天能够爱我
其实 一个人的生活也不算太坏
只要自己想得开的话
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.182.160
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1434612854.A.B20.html
1F:推 soem: 个人认为你这样描述资讯过少,若有点CPU资讯,以及你观察到 06/18 20:51
2F:→ soem: 的状况会比较容易理解你遇到的问题。 06/18 20:51
3F:→ yqwu: cpu是 2* XEON E5-2620 比上两年前买的i7 6核心 型号忘了 06/18 23:22
4F:→ yqwu: 简单来说就是两个CPU和一个CPU跑完一组平行计算的时间一样 06/18 23:23
5F:→ yqwu: 所以我在想是不是新的电脑设定错误 06/18 23:23
6F:推 WolfLord: 一般来讲,你只要启动的是SMP KERNEL就够了,至於平行 06/18 23:34
7F:→ WolfLord: 演算的效能并不是单纯你用了哪一个KIT就一定能凸显的 06/18 23:35
8F:→ WolfLord: 多核心程式需要注意的很多,但单纯从您的说法里面可以 06/18 23:36
9F:→ WolfLord: 推测的资讯其实很贫乏:是否有适当分割演算,演算是否 06/18 23:37
10F:→ WolfLord: 有不当的相依关连,甚或逻辑性的等待拴锁等等..... 06/18 23:37
11F:→ tjjh89017: 搞不好ram吃满了,所以没有办法跑那麽快XD 06/18 23:38
12F:→ tjjh89017: 之前就有遇过ram吃满,CPU没有办法跑出理论GFlops 06/18 23:38
应该不会是这个问题
就我知道的 我们学长之前开发的程式不太吃ram
所以应该不是ram的问题
13F:→ WolfLord: 如果你的计算程式只是一般的单一流程计算程式,那不管 06/18 23:39
14F:→ WolfLord: 少个核:都不会实质增加你的演算速度的。这种程式需要 06/18 23:40
15F:→ WolfLord: 是像 Carry 那种暴力蛮牛(核心时脉与实质核心演算速度 06/18 23:41
16F:→ WolfLord: )处理器 06/18 23:42
我们的计算程式有经过平行化处理
但是不能够跨node (openmp)
我之前自己有测试过 4核心的cpu 和6核心的cpu开了HT比较
执行的时间大概是3:1 也就是6核心cpu速度有快三倍
所以後来买了一台新的双cpu的电脑 结果跑起来没有比单颗的快觉得很纳闷
买之前有请厂商测试过
他报给我的速度的确有快一倍
可是自己装好了来用又没有
要问他们怎麽设定 他们又说要收钱Orz
17F:推 KAOKAOKAO: 编译的时候有正确link吗? 06/19 19:02
这个不是很懂
18F:推 suyuan: 为什麽不把原始码丢出来呢?不要浪费大家的时间用猜的 06/19 20:37
抱歉 其实我也算是个电脑白痴 很多地方不是很懂
请问大概是要什麽原始码呢
丢上cluster跑的程式吗
实在对这方面不是很熟
十分感谢各位热心的回答
※ 编辑: yqwu (1.163.54.181), 06/19/2015 20:56:43
19F:→ shihchiang: 既然都平行了怎不用显卡跑 06/20 00:38
openmp好像只能用cpu平行化的样子
20F:推 WolfLord: 先确认你是不是用SMP核心起动OS吧 06/20 02:02
我来google一下看看这个怎麽确认
21F:→ sunneo: cat /proc/cpuinfo看看,32bit kernel只到8 cores 06/21 20:21
是指主机的吗?
※ 编辑: yqwu (1.171.169.95), 06/21/2015 22:13:03
22F:推 WolfLord: cat /proc/version 看看有没有标示SMP啊~ 06/21 23:57
23F:→ yqwu: 原来是这样看 感谢!! 有标示SMP 06/22 08:46
24F:→ yqwu: 请问会是主机centos版本太旧的问题吗 目前5.4 06/22 13:50
25F:→ jjooeeyy: 跑的时候有确定每个cpu跟cores都有被用到? 06/22 16:46
26F:→ WolfLord: 那 ps 看看执行续有没有分裂(同程式多个PID)如果没有 06/22 19:57
27F:→ WolfLord: 程式写得有问题,如果有,可能要检查看看是否有互相卡 06/22 19:58
28F:→ WolfLord: 卡关的逻辑判断式 06/22 19:59
29F:→ tjjh89017: try this 06/22 20:22
30F:→ tjjh89017: export OMP_NUM_THREADS=12 06/22 20:22
31F:→ sunneo: 主机的啊,如果你没自己编核心,32bit kernel只认得8cores 06/24 03:40