作者ryan0903 (ryan)
看板Linux
標題[問題] CentOS fortran平行計算問題
時間Wed Mar 23 22:27:19 2022
https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/
https://i.imgur.com/pKWdhds.jpg
也遇到這個網站貼一個問題
已經照他的建議操作
但是還是有一樣的error
我懷疑是library沒辦法在各個nodes 共用
想請問有人有類似經驗 很需要幫忙 謝謝
可以再私訊詳述問題 麻煩了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.43.159.108 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Linux/M.1648045641.A.617.html
1F:→ ryan0903: 總共有6個nodes 但是只能利用其中一個 也就是指令只能 03/23 22:31
2F:→ ryan0903: 是#PBS -l nodes=1:ppn=40 最多 03/23 22:31
3F:推 relaughter: 每個節點彼此都要能免密碼登入,這點確定了嗎? 03/23 23:02
4F:→ ryan0903: 有的 感謝提醒 還有什麼要注意的嗎 03/24 00:13
5F:→ giraffe4527: 每個節點防火牆、selinux都關掉,可以輸出PBS的log 03/24 00:22
6F:→ giraffe4527: 可以試試看在每個節點跑mpirun確認是不是submit問題 03/24 00:25
7F:→ giraffe4527: 再來把.ssh/known_hosts節點清掉排除hosts key問題 03/24 00:28
8F:推 CardLin: 沒有 InfiniBand 多節點也只是無用的技術。 03/25 01:28
9F:→ CardLin: 跨節點建議 /home 及 /opt 用 NFS 分享,ssh key放/home 03/25 01:30
10F:→ CardLin: 另外建議用 PIC 編譯所有的程式碼。 03/25 01:34
11F:→ CardLin: 因為 PIC 會影響分支預測的準確率。 03/25 16:46
12F:→ pillbox1989: 一般建立mpi時,會用nis在每個節點建立相同的使用者 03/25 18:59
13F:→ pillbox1989: 代號。若要用ssh方式,要使用ssh_keygen做出金鑰對放 03/25 18:59
14F:→ pillbox1989: 到各節點 03/25 18:59
15F:→ giraffe4527: 其實nis+nfs共享home就不用每個節點丟key了 03/26 10:46
16F:→ giraffe4527: 放到head node自己的auth key就每個節點通用 03/26 10:46
17F:→ giraffe4527: 不然很多台每個使用者每台都要做一次真的累 03/26 10:46
18F:→ giraffe4527: 但就是平行時比較吃網路 03/26 10:48