Re: MapReduce (Re: [情報] 利用智慧型手機建構雲端

時間Tue Aug 24 04:09:30 2010

: → hilorrk:@@ 兩位前輩請息怒... 08/24 00:16 這情況很正常. 在BBS或mailing-list常有這種嚴肅討論. 而我個人經驗,mailing-list遇到的討論對象,比較不會有刁蠻不承認自己犯錯的. : → hilorrk:就我所知 google的MapReduce並沒有送"資料"吧~ 08/24 00:16 : → hilorrk:而是master assign map/reduce task給worker 而worker再去 08/24 00:17 : → hilorrk:DFS取資料...所要傳輸的是程式的fork? 08/24 00:18 : → hilorrk:而且採取的是類似master去polling 而非worker主動要工作? 08/24 00:21 : → hilorrk:不知這樣理解對不對...改天要來好好研究一下了- -|| 08/24 00:21 你說的第一句話有一點錯.請以分散式的觀點思考系統環境, 環境中存在多少個map的instances,多少個reduce的instances? 最少,每個map都要知道它該讀哪個檔案分段,而根據map的規格, map並沒有自己包含了判斷它要讀哪個分段的程式碼. 包含了判讀正確檔案位置的程式,是舊世界的寫法. 可以Google尋找一些介紹 MapReduce的投影片,有一些會列出舊的平行程式寫法,和MapReduce平行程式寫法. 所以接下來你說對了,是master polling. (polling? 其實這個詞也不對啊!) Master必須要整理幾種資訊: 1. 要處理的資料有多少檔案. 2. 能使用的map worker有多少個. 基本上是把map fork在每個map worker沒錯. 但是把執行檔fork成一些程序就行了嗎? 當然不只,而是還要告訴每個程序要讀哪個檔案或哪個分段位置(chunk index). Map worker會執行map,把檔案餵進map,然後map丟出一些key-value,是放在 local store; 線上的記憶體可能不足以處理這些突然拋出的key-value. 接下來,reduce會自動理解它要從哪個map讀結果嗎? 起碼也要看map worker和reduce worker是不是一對一對應. 通常不是. 那要怎麼做? 前面說 map 出來的東西是local store的. Reduce worker要拿到map的local store, 如果map worker和reduce worker各在不同的電腦,當然是一些類似檔案傳輸的動作. 根據key-value的規格,是 map(key0, value0) -> {(key,value)} [local store] -> grouping( {(key,value)} ) -> (key1,{value1}) [input to reduce] -> reduce(key1, {value1}) 中間grouping的客製彈性很大,有些是說map worker做一個map之後的處理, 有些是說把key-value送到一個集中位置處理,也有人說是map worker將key-value 分割,分別送到幾個固定的reduce worker那邊. 甚至一組工作的定義,可能要有個規格定義明白,哪個map之後要接哪個map/reduce, 哪個reduce要接哪個map/reduce. 並不是只有worker自己知道要從哪裡取資料而已. Worker哪有那麼聰明啊. 分散式系統重要的是訊息溝通. Map做完了要告訴master,然後master要通知reduce,reduce worker會向map worker 請求資料. 這些概念還蠻簡單. --

※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.160.209.34

1^F：推 hilorrk:我知道master必須informed其他worker location of data啦. 08/24 06:28

2^F：→ hilorrk:用MapReduce當然就不可能像以前寫MPI還要在code裡切割分配 08/24 06:29

3^F：→ hilorrk:我的意思是..由master傳輸process和location受限於master 08/24 06:30

4^F：→ hilorrk:網路是沒辦法的吧?相較下來map task從DFS讀取大量data及運 08/24 06:31

5^F：→ hilorrk:算才是真正的平行所在?(當然還包括reduce) 08/24 06:33

6^F：→ hilorrk:至於map worker的grouping及reduce worker的merge要如何實 08/24 06:41

7^F：→ hilorrk:現　這又是另一個問題了...確實有看到不少model就是了 08/24 06:42

8^F：→ hilorrk:不知我的概念是否還有哪裡有需要指正的地方？ 08/24 06:58

9^F：推 ledia:哈哈, 別擔心, 你是對的, 對拒絕學習的人可以不用這麼認真 08/26 09:43

10^F：推 ledia:MapReduce 只是雲端的一小部份, 如果像某些人想要又拿來傳 08/26 09:46

11^F：→ ledia:資料, 又拿來解決 synchronization, 還真是浪費了 MapReduce 08/26 09:47

12^F：→ ledia:message passing, voting, dynamic routing 等等 08/26 09:50

13^F：→ ledia:這些 building block 沒概念, 抱著 MapReduce 一直玩, 還說 08/26 09:50

14^F：→ ledia:別人不能承認錯誤 ? 噗哧 XD 08/26 09:51

15^F：→ yauhh:hilorrk,文章並沒有明確講由master傳一個process出去,事實上 08/26 20:01

16^F：→ yauhh:的確不這麼做,因為每一台電腦的Pid不一樣. 08/26 20:01

17^F：→ yauhh:ledia,我說你啊,你沒有指出我有什麼錯啊. 我在談的就是 08/26 20:02

18^F：→ yauhh:MapReduce的Framework,而不是特定工作. 是你自己一直把問題 08/26 20:03

19^F：→ yauhh:牽到map的層次而已. 你知道我講mapper是指map master嗎? 08/26 20:03

20^F：→ yauhh:而我的確指出你的錯誤,只是你還是要嘴硬不想回一句"抱歉錯了 08/26 20:04

21^F：→ yauhh:只能說,因為我還關心著MapReduce,所以目前文章還是反覆讀, 08/26 20:04

22^F：→ yauhh:實作也正在默默進行. 這些過程全都不干你的事. 08/26 20:05

23^F：→ yauhh:反正你有MQ server就滿意了. 08/26 20:06

24^F：→ hilorrk:的確啦..我說傳送process不是很嚴謹　應該是從user的程式 08/26 20:12

25^F：→ hilorrk:fork出一個process在worker上~不過也不能用每一台電腦的 08/26 20:12

26^F：→ hilorrk:pid不一樣來說啦　畢竟一個worker上可能有多個task~ 08/26 20:13

27^F：→ hilorrk:我的重點在於挺好奇y大所說的從master傳輸(assign?)task 08/26 20:16

28^F：→ hilorrk:給map worker時如何作到您所意指的"分散式資源分配" 08/26 20:16

29^F：→ hilorrk:就我認知當中　這點的確得依賴於master對外傳輸的速度@@ 08/26 20:18

30^F：→ hilorrk:還有請兩位息息怒..交流上難免會有意見不同處我相信L大和 08/26 20:19

31^F：→ hilorrk:Y大在資訊領域都有很深的見解希望能就技術層面來討論就好 08/26 20:20

32^F：→ hilorrk:不要傷了皇城之內的和氣啊XD(誤 08/26 20:20

33^F：→ yauhh:最後這不用管,反正該有的分寸我自己也會抓好. 養新板不容易 08/26 20:29

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Cloud 板

Re: MapReduce (Re: [情報] 利用智慧型手機建構雲端

熱門看板

贊助商連結