作者b10007034 (Warren)
看板Grad-ProbAsk
标题[理工] 107 台大 计系
时间Wed Dec 5 01:37:54 2018
HI, 各位大大
想讨论今年第二大题
https://imgur.com/7n6WZw0
这个cluster我参考原文书及张凡第七章画的
https://imgur.com/a/d4QDu0S
题目提到reduction,我翻原文书翻到这个
https://imgur.com/nI9Lxy9
f
题目貌似没给rotation,是假设平均的seek+rotation=5ms?
最大应该是所有资料放在一颗硬碟然後传上来吧?
最小是多颗硬碟组RAID,然後计算吗? 不太确定
g
题目提到data transfer可以和computation时间重叠,且data transfer时间比较久
所以只要计算资料传到GPU就好?这个资料是多大,我们决定吗
h
这边我只想到决定好reduction的次数乘上100us就好
课本的pattern是8个传到剩1个,reduction3次,应该是 以2为底 log N
i
total time应该是 资料读到电脑的时间 + 资料处理时间(GPU) + reduction ?
题目也没说 记忆体频宽、大小 ,还有Network的速度感觉好少条件
bottleneck我猜是硬碟
大大有任何想法吗?求解感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.167.92
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Grad-ProbAsk/M.1543945077.A.FB1.html
1F:推 Dora5566: 有给D个disk 就用RAID read最慢的那一种做lower bound吧 12/05 20:59
2F:→ b10007034: 台大 f, min. time=5ms max. time=5ms+10^15/250*10^6) 12/10 11:16
3F:→ b10007034: g 切成1KB为最小不可分割运算单位,意思是有10^15/10^3 12/10 11:18
4F:→ b10007034: 10^12 computers,每台有8张GPU,128GB的频宽 12/10 11:19
5F:→ b10007034: GPU运算时间=1KB/128GB 约等於7.8125ns 12/10 11:19
6F:→ b10007034: h 共10^12 computers,要把这些node运算的资料加起来 12/10 11:20
7F:→ b10007034: 考虑到10^12非2的倍数,reduction operations= 12/10 11:21
8F:→ b10007034: floor(log(10^12))=39(次),因此传输时间等於3.9ms 12/10 11:22
9F:→ b10007034: i total min. time=5ms+3.9ms+7.8125ns约等於8.9ms 12/10 11:23
10F:→ b10007034: bottleneck为硬碟的seek time,建议换成SSD 12/10 11:23
11F:→ b10007034: 业界人士给我的答案,应该差不到哪里去。 12/10 11:25