作者hooboa1122 (伯乐)
看板MIS
标题[请益] 公司主机集中做机器学习分散式运算
时间Fri Oct 4 12:27:23 2019
我们公司工程师都配备一台10万元 2080显卡
要做深度学习deep learning计算之用
因为人数越来越多 为了把运算资源更有效利用
我们想要评估
把这些主机放到机房集中 专做pytorch运算
每个工程师只配一台mac mini与机房主机连线用
请问一下
1.这样的想法是否可行呢?
2.是否有合适的国内厂商可建议?
3.这样的费用会花到多少呢?
4.如果采用Cloud GPU
依大家的经验 会比较便宜吗?
https://cloud.google.com/gpu/?hl=zh-tw
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.127.111.39 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MIS/M.1570163246.A.101.html
1F:推 goodga: 钱的问题,最後会觉得一人一台最便宜... 10/04 15:14
2F:→ blackhippo: 去年做VDI+GPU lab借张卡..光是卡+license问业务差不 10/04 15:19
3F:→ blackhippo: 多可以买20台主机.. 10/04 15:20
4F:推 chang0206: 有,但是费用会很吓人....cloud GPU更不用说 10/04 16:29
5F:→ chang0206: 一个月一两千美金一台,组一台PC都有剩 10/04 16:30
6F:→ freeunixer: 光买专用的显卡就贵死你,用 1060 加旧版驱动挡着用... 10/04 17:32
7F:→ asdfghjklasd: 可以..不过有多少钱要做? 10/04 18:10
8F:→ VictorZ: 试试看装CentOS然後把那几台主机串在一起当丛集共用资源 10/05 00:17
9F:→ VictorZ: ,再开VDI出来,但是驱动那些要自己处理。 10/05 00:17
10F:推 antigenius: 给你关键字 kubeflow 10/05 08:25
11F:推 antigenius: 花钱请一个做aws flow的DevOps帮你做poc先 10/05 08:28
12F:推 darktasi: 说到最後还是预算问题有兴趣我可以站内你 10/05 16:18
13F:→ changmary: 集中贵资源最大化 分散便宜很多 10/06 11:26
14F:→ atrix: 麻烦死了,大部分方案都只适合所有人都是超高等级人才的环 10/10 00:11
15F:→ atrix: 境 10/10 00:11