作者hilorrk (Cary)
看板Cloud
标题[情报] 10 Hadoop-able Problems (a summary)
时间Fri Aug 20 09:01:33 2010
摘要
此篇作者提到了十项Hadoop-able problem,也就是能够以Hadoop有效处理的问题。
其中大多以商业用途为主。
1. 风险评估(Modelling True Risk)
2. 客户流失分析(Customer Churn Analysis)
3. 推荐引擎(Recommendation engines, ex:google PageRank)
4. 广告瞄准(ad targeting)
5. POS交易分析(Point Of Sale Transaction Analysis)
6. 以网络资料分析预测错误(Analysing Network Data To Predict Failure,
此处的network并非意指Internet)
7. 威胁分析、诈欺侦测(Threat Analysis/Fraud Detection)
8. 贸易监控(Trade Surveillance)
9. 搜寻品质(Search Quality)
10.资料沙盒(Data "Sandbox")
最後文中提及,多数以上的task都可以归类为以下动作:
"整合资料、评测资料、以评测结果排序",
而这正是Hadoop最善长且基本的能力。
注:Cloudera为Hadoop的一个distribution,提供一种以Hadoop为基础的档案管理系统
新标准。而Sqoop为其SQL to Hadoop database的工具。
--
摘自 Mike Pearce – blog
http://blog.mikepearce.net/2010/08/18/10-hadoop-able-problems-a-summary/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.36.168.54