作者ryan0903 (ryan)
看板Linux
标题[问题] CentOS fortran平行计算问题
时间Wed Mar 23 22:27:19 2022
https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/
https://i.imgur.com/pKWdhds.jpg
也遇到这个网站贴一个问题
已经照他的建议操作
但是还是有一样的error
我怀疑是library没办法在各个nodes 共用
想请问有人有类似经验 很需要帮忙 谢谢
可以再私讯详述问题 麻烦了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.43.159.108 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1648045641.A.617.html
1F:→ ryan0903: 总共有6个nodes 但是只能利用其中一个 也就是指令只能 03/23 22:31
2F:→ ryan0903: 是#PBS -l nodes=1:ppn=40 最多 03/23 22:31
3F:推 relaughter: 每个节点彼此都要能免密码登入,这点确定了吗? 03/23 23:02
4F:→ ryan0903: 有的 感谢提醒 还有什麽要注意的吗 03/24 00:13
5F:→ giraffe4527: 每个节点防火墙、selinux都关掉,可以输出PBS的log 03/24 00:22
6F:→ giraffe4527: 可以试试看在每个节点跑mpirun确认是不是submit问题 03/24 00:25
7F:→ giraffe4527: 再来把.ssh/known_hosts节点清掉排除hosts key问题 03/24 00:28
8F:推 CardLin: 没有 InfiniBand 多节点也只是无用的技术。 03/25 01:28
9F:→ CardLin: 跨节点建议 /home 及 /opt 用 NFS 分享,ssh key放/home 03/25 01:30
10F:→ CardLin: 另外建议用 PIC 编译所有的程式码。 03/25 01:34
11F:→ CardLin: 因为 PIC 会影响分支预测的准确率。 03/25 16:46
12F:→ pillbox1989: 一般建立mpi时,会用nis在每个节点建立相同的使用者 03/25 18:59
13F:→ pillbox1989: 代号。若要用ssh方式,要使用ssh_keygen做出金钥对放 03/25 18:59
14F:→ pillbox1989: 到各节点 03/25 18:59
15F:→ giraffe4527: 其实nis+nfs共享home就不用每个节点丢key了 03/26 10:46
16F:→ giraffe4527: 放到head node自己的auth key就每个节点通用 03/26 10:46
17F:→ giraffe4527: 不然很多台每个使用者每台都要做一次真的累 03/26 10:46
18F:→ giraffe4527: 但就是平行时比较吃网路 03/26 10:48