Cloud 板


LINE

: → hilorrk:@@ 兩位前輩請息怒... 08/24 00:16 這情況很正常. 在BBS或mailing-list常有這種嚴肅討論. 而我個人經驗,mailing-list遇到的討論對象,比較不會有刁蠻不承認自己犯錯的. : → hilorrk:就我所知 google的MapReduce並沒有送"資料"吧~ 08/24 00:16 : → hilorrk:而是master assign map/reduce task給worker 而worker再去 08/24 00:17 : → hilorrk:DFS取資料...所要傳輸的是程式的fork? 08/24 00:18 : → hilorrk:而且採取的是類似master去polling 而非worker主動要工作? 08/24 00:21 : → hilorrk:不知這樣理解對不對...改天要來好好研究一下了- -|| 08/24 00:21 你說的第一句話有一點錯.請以分散式的觀點思考系統環境, 環境中存在多少個map的instances,多少個reduce的instances? 最少,每個map都要知道它該讀哪個檔案分段,而根據map的規格, map並沒有自己包含了判斷它要讀哪個分段的程式碼. 包含了判讀正確檔案位置的程式,是舊世界的寫法. 可以Google尋找一些介紹 MapReduce的投影片,有一些會列出舊的平行程式寫法,和MapReduce平行程式寫法. 所以接下來你說對了,是master polling. (polling? 其實這個詞也不對啊!) Master必須要整理幾種資訊: 1. 要處理的資料有多少檔案. 2. 能使用的map worker有多少個. 基本上是把map fork在每個map worker沒錯. 但是把執行檔fork成一些程序就行了嗎? 當然不只,而是還要告訴每個程序要讀 哪個檔案或哪個分段位置(chunk index). Map worker會執行map,把檔案餵進map,然後map丟出一些key-value,是放在 local store; 線上的記憶體可能不足以處理這些突然拋出的key-value. 接下來,reduce會自動理解它要從哪個map讀結果嗎? 起碼也要看map worker和reduce worker是不是一對一對應. 通常不是. 那要怎麼做? 前面說 map 出來的東西是local store的. Reduce worker要拿到map的local store, 如果map worker和reduce worker各在不同的電腦,當然是一些類似檔案傳輸的動作. 根據key-value的規格,是 map(key0, value0) -> {(key,value)} [local store] -> grouping( {(key,value)} ) -> (key1,{value1}) [input to reduce] -> reduce(key1, {value1}) 中間grouping的客製彈性很大,有些是說map worker做一個map之後的處理, 有些是說把key-value送到一個集中位置處理,也有人說是map worker將key-value 分割,分別送到幾個固定的reduce worker那邊. 甚至一組工作的定義,可能要有個規格定義明白,哪個map之後要接哪個map/reduce, 哪個reduce要接哪個map/reduce. 並不是只有worker自己知道要從哪裡取資料而已. Worker哪有那麼聰明啊. 分散式系統重要的是訊息溝通. Map做完了要告訴master,然後master要通知reduce,reduce worker會向map worker 請求資料. 這些概念還蠻簡單. --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.160.209.34
1F:推 hilorrk:我知道master必須informed其他worker location of data啦. 08/24 06:28
2F:→ hilorrk:用MapReduce當然就不可能像以前寫MPI還要在code裡切割分配 08/24 06:29
3F:→ hilorrk:我的意思是..由master傳輸process和location受限於master 08/24 06:30
4F:→ hilorrk:網路是沒辦法的吧?相較下來map task從DFS讀取大量data及運 08/24 06:31
5F:→ hilorrk:算才是真正的平行所在?(當然還包括reduce) 08/24 06:33
6F:→ hilorrk:至於map worker的grouping及reduce worker的merge要如何實 08/24 06:41
7F:→ hilorrk:現 這又是另一個問題了...確實有看到不少model就是了 08/24 06:42
8F:→ hilorrk:不知我的概念是否還有哪裡有需要指正的地方? 08/24 06:58
9F:推 ledia:哈哈, 別擔心, 你是對的, 對拒絕學習的人可以不用這麼認真 08/26 09:43
10F:推 ledia:MapReduce 只是雲端的一小部份, 如果像某些人想要又拿來傳 08/26 09:46
11F:→ ledia:資料, 又拿來解決 synchronization, 還真是浪費了 MapReduce 08/26 09:47
12F:→ ledia:message passing, voting, dynamic routing 等等 08/26 09:50
13F:→ ledia:這些 building block 沒概念, 抱著 MapReduce 一直玩, 還說 08/26 09:50
14F:→ ledia:別人不能承認錯誤 ? 噗哧 XD 08/26 09:51
15F:→ yauhh:hilorrk,文章並沒有明確講由master傳一個process出去,事實上 08/26 20:01
16F:→ yauhh:的確不這麼做,因為每一台電腦的Pid不一樣. 08/26 20:01
17F:→ yauhh:ledia,我說你啊,你沒有指出我有什麼錯啊. 我在談的就是 08/26 20:02
18F:→ yauhh:MapReduce的Framework,而不是特定工作. 是你自己一直把問題 08/26 20:03
19F:→ yauhh:牽到map的層次而已. 你知道我講mapper是指map master嗎? 08/26 20:03
20F:→ yauhh:而我的確指出你的錯誤,只是你還是要嘴硬不想回一句"抱歉錯了 08/26 20:04
21F:→ yauhh:只能說,因為我還關心著MapReduce,所以目前文章還是反覆讀, 08/26 20:04
22F:→ yauhh:實作也正在默默進行. 這些過程全都不干你的事. 08/26 20:05
23F:→ yauhh:反正你有MQ server就滿意了. 08/26 20:06
24F:→ hilorrk:的確啦..我說傳送process不是很嚴謹 應該是從user的程式 08/26 20:12
25F:→ hilorrk:fork出一個process在worker上~不過也不能用每一台電腦的 08/26 20:12
26F:→ hilorrk:pid不一樣來說啦 畢竟一個worker上可能有多個task~ 08/26 20:13
27F:→ hilorrk:我的重點在於 挺好奇y大所說的從master傳輸(assign?)task 08/26 20:16
28F:→ hilorrk:給map worker時如何作到您所意指的"分散式資源分配" 08/26 20:16
29F:→ hilorrk:就我認知當中 這點的確得依賴於master對外傳輸的速度@@ 08/26 20:18
30F:→ hilorrk:還有請兩位息息怒..交流上難免會有意見不同處 我相信L大和 08/26 20:19
31F:→ hilorrk:Y大在資訊領域都有很深的見解 希望能就技術層面來討論就好 08/26 20:20
32F:→ hilorrk:不要傷了皇城之內的和氣啊XD(誤 08/26 20:20
33F:→ yauhh:最後這不用管,反正該有的分寸我自己也會抓好. 養新板不容易 08/26 20:29







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BuyTogether站內搜尋

TOP