Cloud 板


LINE

※ 引述《hilorrk (Cary)》之铭言: : 不才第一次接触到这种新颖的概念还是觉得挺特别的 : 也感慨自己对MapReduce的了解仍不够深 : 不该把它局限在语言模式、multi-core、cluster : 其实在云端的领域中 仍有许多发挥想像力的空间! : 消息来自MIT Tech. Review : http://www.technologyreview.com/blog/mimssbits/25609/ : Misco网站 : http://www.cs.ucr.edu/~jdou/misco/ : 相关paper : http://portal.acm.org/citation.cfm?id=1839294.1839332 : 如果对MapReduce不熟 可以查查wikipedia : 或是看看google这篇paper(比起bigtable、GFS和chubby 它好读多了) : http://labs.google.com/papers/mapreduce.html 关於MapReduce,看了一篇用communicating sequential processes讨论的文章,蛮好. "Analyzing MapReduce with CSP" http://www.iist.unu.edu/www/docs/techreports/reports/report421.pdf#page=95 里头主要用有名的C.A.R. Hoare给的语言来讨论这个分散式计算架构. 可以看到一些式子,像 SYSTEM ::= MASTER || MAPPER || REDUCER || FS 表达系统为MASTER,MAPPER,REDUCER和FS(File system)平行计算组成. 然後,像MAPPER是 MAPPER ::=||_t Mapper_t, t in T 表示MAPPER是由几个处理map工作的Mapper_t的集合. 须注意Map-Reduce分为几个角色: master, mapper, map task, reducer, reduce task, file system. 而mapper, reducer都是一个类别要分出好多instance的, 而不是一个单位就搞定. 然後,文章对讯息也有定义,像 Message ::= R#FileName#ChunkIndex 是Master发送给Mapper的讯息, 包含R是Reducer的数目,FileName档名,和ChunkIndex区块编号. 一个Mapper除了要知道map task之外,还要知道它要读哪个档案, 然後要知道工作做完之後要将结果分解为R个部份,才能分送到R个Reducer. Mapper的计算主体说是 cal(InputData) ::= map(InputData); sort({<key,value>_n}); combine({<key,value>_n}); partition({<key,V>_n'}). map(InputData) = {<key,value>_n} sort({<key,value>_n}) = {<key',value'>_n} combine({<key',value'>_n}) = {<key',V>_n'} partition({<key',V}_n'}) = {Split_k}, k in R 主要是表达map task的进行是先map,把一堆key-value丢出来. 然後要排序(?),grouping (即combine),然後分割成 R 个部份. 这里包含了map计算之後的输出资料是local store的要点. 不过,在这边我觉得应该可以不要做排序. 因为输出资料分割成R段之後 分送到R个Reducer,每个Reducer应该是从T个Mapper得到各自分别排序好的资料段落. T个资料段落虽然分别排序好,但是整体来看是没排序的. 倒不如别排,就直接多个Grouper角色,用filter方式将资料整理成一群一群的. 在这里可能有个题目,可以谈一下(combine.sort)或是直接filter,哪个是较省事的方法. --



※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 211.21.94.199







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Gossiping站内搜寻

TOP