作者JackBaska (Baska)
看板Linux
标题[问题] TORQUE在Ubuntu上的连结细节?
时间Sat May 21 14:36:17 2016
最近先用 Ubuntu 配不同网卡的 VM , 试着建立自己的 Cluster
目前已经成功把服务挂在 Server上面 , 但遇到了一些问题想要
询问是否有版友知道怎麽处理 , 顺便分享至少把服务挂上去这段
的做法
如果有人有兴趣的话可以参考以下设定网址:(太长,要自己贴在一起)
https://jabriffa.wordpress.com/2015/02/11/installing-
torquepbs-job-scheduler-on-ubuntu-14-04-lts/
倒数第二步如果有遇到抓不到 , 或是 Unauthorized Request
极有可能是你的hosts 没设定好或出现名称冲突 , 可以参考以下
内容:
xxx.xxx.xxx.xxx 是你的 public IP
ubuntu_server 是你的DNS server 设定名称, 也就是网址中的
DOMAIN (因为一开始看网址觉得表示的有点模糊花了点时间试)
-------------------------------
127.0.0.1 localhost localhost.xxx.xxx.xxx.xxx
xxx.xxx.xxx.xxx ubuntu_server
192.168.xxx.10 Node1
192.168.xxx.20 Node2
192.168.xxx.30 Node3
-------------------------------
但遇到几个问题想请教是否有人有相关经验
1. 在一般 terminal 已经可以互相找到(ssh)内网机器的情况下
要如何让 TORQUE 能够全权控制其他内网机器 ?
目前有试几个看到的指令 , 但因为对 TORQUE 还没有 overall
的认识 , 觉得有些设置没做好所以一直连不上
2. TORQUE 如何能做类似 qinfo 的指令 , 由於我以前用过别人
建好的Cluster 是用付费 PBS 後台 , 当时有 qinfo , 能够
协助job管理 , 掌握每一台机器 CPU占用情形 , 但此指令我
目前在 TORQUE 使用他会表示没有该指令
3. 因为不明原因 , submit 可以 work 但不会真的 run , 只会
看到 qstat 处於有submit 但 cancel 了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.240.167.212
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1463812581.A.F14.html
※ 编辑: JackBaska (111.240.167.212), 05/22/2016 15:38:10