Cloud 板


LINE

※ 引述《gmoz ( This can't do that. )》之銘言: : 其實10月初就有了,剛剛才發現@@ : http://0rz.tw/ztXgh : 用來應付索引資料內即時更新的資料 : 正在看XD 之前看完了,稍微PO一下大意好了XD 裡面提出一個增量處理的系統 Percolator 用Percoliator為主的搜索引擎就是咖啡因 簡單的大意就是,原本的Google是用MapReduce來分析整理爬下來的網頁,製作出索引庫 如果現在有一批新資料(更新過的網頁)出現時, 沒辦法即時地只對這些資料做MapReduce整理就加進索引庫 因為索引庫內的資料彼此之間都是有關連的 例:由A算出B、由B算出C,你不能只更新一小部份的A或B或C 你只能全部重做Mapreduce 一般的資料庫又沒辦法容納下GOOGLE的資料量,也缺乏伸縮性 所以Google提出Percolator,可以增量的處理新資料的玩意 主要有兩個重點:transaction 和 observer 符合ACID(利用時間戳達成ACID)的transaction用來讀寫資料 又因為他的ACID特性可以避免衝突 而觸發與運行transcation的便是observer 一個observer會再觸發(trigger)他下游的observer (ob之間的關係開發者自定義) 一系列的observer就構成了Percolator的主要架構 原本的GOOGLE SEARCH要做100次左右的Mapreduce 現在GOOGLE只需要10個observer就可以做完 另外Percolator是建構在改良過的Bigtable上 (這裡用的是GFS2) Percolator發送RPC給Bigtable server, 這個server再發送RPC給chunk server做實體修改 一個對bigtable的新增 (改良成多row,並且有時間戳,類似版本概念) 會登記在他的notify列,等待observer來處理他 系統流程直接引述PAPER裡面的一段話 Percolator applications are structured as a series of observers; each observer completes a task and creates more work for “downstream” observers by writing to the table. In our indexing system, a MapReduce loads crawled documents into Percolator by running loader transactions, which trigger the document processor transaction to index the document (parse, extract links, etc.). The document processor transaction triggers further transactions like clustering. The clustering transaction, in turn, triggers transactions to export changed document clusters to the serving system. 原文裡面還有很多細節 例如observer是以怎樣的方式去搜索notify亮起來的bigtable行列 observer在運作時候避免衝突的流程細節,transaction的程式細節和鎖的運作 如何減少RPC和效能的分析等等 --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.243.224.126 ※ 編輯: gmoz 來自: 111.243.224.126 (12/05 15:03)
1F:推 Azarc:推 12/06 10:05







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BuyTogether站內搜尋

TOP