作者hilorrk (Cary)
看板Cloud
标题[技术] Hadoop生态的种类
时间Thu Feb 9 18:04:27 2012
本篇文章来自GIGAOM
http://gigaom.com/cloud/what-it-really-means-when-someone-says-hadoop
当我们(在商业上)谈到Hadoop,通常是指:
1.Hadoop Core
就是Apach Hadoop下的HDFS和MapReduce。
广范来说还包括像是Hive、Pig、HBase等相关Project。
2.Hadoop Distribution
提供Package让Hadoop系统更容易建置。
类似於Linux Distribution(Fedora、Ubuntu)。
代表公司是Cloudera和Horonworks(Yahoo)。
这两家公司同时也是Hadoop Source Code提供者中的主要成员。
之前还在争谁贡献比较多而打起口水战XD
3.Hadoop Management Software
如同字面上,就是管理Hadoop的软体。
虽然同常会打包在Distribution当中,
不过也有专门提供相关系统的公司(Platform Computing、Zettaset)。
4.Hadoop Application Software(Products that use Hadoop)
前面的基本上要用Hadoop就是要与HDFS、MR或相关计划的code。
而此项的种类就很多,基本上只要用到Hadoop的都算...
像是IBM、MS等公司都在积极将Hadoop整合至系统中。
此外还有像是一些专门产业(Ex:Smart Grid)也使用Hadoop来处理资料。
有些系统是以Distribution提供的Package及服务为基础的。
--
Hadoop是目前处理Big Data的主流趋势。
而Big Data是要实现云端计算看似资源无上限这种理想必需解决的问题之一。
但Hadoop != 云端计算。
像是Virtualization不是云端计算一样,
他只是解决了云端计算中资源分配的问题(也算是无感存取资源的问题)。
而网际网路(或私有网路)也不是云端计算,
网路是实现云端计算中可随处存取现存最好的解决方案。
云端计算不是一种技术,是理想,是远景啊XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.249.131.194