Cloud 板


LINE

※ 引述《gmoz ( This can't do that. )》之铭言: : 其实10月初就有了,刚刚才发现@@ : http://0rz.tw/ztXgh : 用来应付索引资料内即时更新的资料 : 正在看XD 之前看完了,稍微PO一下大意好了XD 里面提出一个增量处理的系统 Percolator 用Percoliator为主的搜索引擎就是咖啡因 简单的大意就是,原本的Google是用MapReduce来分析整理爬下来的网页,制作出索引库 如果现在有一批新资料(更新过的网页)出现时, 没办法即时地只对这些资料做MapReduce整理就加进索引库 因为索引库内的资料彼此之间都是有关连的 例:由A算出B、由B算出C,你不能只更新一小部份的A或B或C 你只能全部重做Mapreduce 一般的资料库又没办法容纳下GOOGLE的资料量,也缺乏伸缩性 所以Google提出Percolator,可以增量的处理新资料的玩意 主要有两个重点:transaction 和 observer 符合ACID(利用时间戳达成ACID)的transaction用来读写资料 又因为他的ACID特性可以避免冲突 而触发与运行transcation的便是observer 一个observer会再触发(trigger)他下游的observer (ob之间的关系开发者自定义) 一系列的observer就构成了Percolator的主要架构 原本的GOOGLE SEARCH要做100次左右的Mapreduce 现在GOOGLE只需要10个observer就可以做完 另外Percolator是建构在改良过的Bigtable上 (这里用的是GFS2) Percolator发送RPC给Bigtable server, 这个server再发送RPC给chunk server做实体修改 一个对bigtable的新增 (改良成多row,并且有时间戳,类似版本概念) 会登记在他的notify列,等待observer来处理他 系统流程直接引述PAPER里面的一段话 Percolator applications are structured as a series of observers; each observer completes a task and creates more work for “downstream” observers by writing to the table. In our indexing system, a MapReduce loads crawled documents into Percolator by running loader transactions, which trigger the document processor transaction to index the document (parse, extract links, etc.). The document processor transaction triggers further transactions like clustering. The clustering transaction, in turn, triggers transactions to export changed document clusters to the serving system. 原文里面还有很多细节 例如observer是以怎样的方式去搜索notify亮起来的bigtable行列 observer在运作时候避免冲突的流程细节,transaction的程式细节和锁的运作 如何减少RPC和效能的分析等等 --



※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.243.224.126 ※ 编辑: gmoz 来自: 111.243.224.126 (12/05 15:03)
1F:推 Azarc:推 12/06 10:05







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Tech_Job站内搜寻

TOP