现在学习hadoop从哪个版本入手

如题所述

第1个回答  2017-04-10
大讲台hadoop培训为你解答:
1、Apache Hadoop2.0版本,有以下模块:
Hadoop通用模块,支持其他Hadoop模块的通用工具集;
Hadoop分布式文件系统(HDFS),支持对应用数据高吞吐量访问的分布式文件系统;
Hadoop YARN,用于作业调度和集群资源管理的框架;
Hadoop MapReduce,基于YARN的大数据并行处理系统。
Hadoop目前除了社区版,还有众多厂商的发行版本。
2、Cloudera:最成型的发行版本,拥有最多的部署案例;提供强大的部署、管理和监控工具。开发并贡献了可实时处理大数据的Impala项目。
3、Hortonworks:100%开源的Apache Hadoop唯一提供商。Hortonworks是第一家使用了Apache HCatalog的元数据服务特性的提供商。而且,他们的Stinger极大地优化了Hive项目。Hortonworks为人们提供了一个非常好的、易于使用的沙盒。Hortonworks开发了很多增强特性并提交至核心主干,这使得Apache Hadoop能够在包括Windows Servers和Windows Azure在内的Microsoft Windows平台上本地运行。
4、MapR:与竞争者相比,它使用了一些不同的概念,特别是为了获取更好的性能和易用性而支持本地UNIX文件系统而不是HDFS(使用非开源的组建)。我们可以使用本地UNIX命令来代替Hadoop命令。除此之外,MapR还凭借如快照、镜像或有状态的故障恢复之类的高可用性特性来与其他竞争者相区别。该公司也领导着Apache Drill项目,本项目是Google的Dremel的开源项目的重新实现,目的是在Hadoop数据上执行类似SQL的查询以提供实时处理。
5、Amazon Elastic Map Reduce(EMR):区别与其他提供商的是,这是一个托管的解决方案,其运行在由Amazon Elastic Compute Cloud(Amazon EC2)和Amazon Simple Storage Service(Amazon S3)组成的网络规模的基础设施之上。除了Amazon的发行版本之外,也可以在EMR上使用MapR,临时集群是主要的使用情形。如果你需要一次性的或者不常见的大数据处理,EMR可能为你节省大笔开支。然而,这也存在不利之处。其只包含了Hadoop生态系统中的Pig和Hive项目,在默认的情况下不包含很多其他项目。并且,EMR是高度优化成与S3中的数据一起工作的,这种方式会有较高的延时并且不会定位于你的计算节点上的数据。所以处于EMR上的文件IO相比于你自己的Hadoop集群或者你的私有EC2集群来说慢很多,并有更大的延时。

现在学习hadoop从哪个版本入手
1、Apache Hadoop2.0版本,有以下模块:Hadoop通用模块,支持其他Hadoop模块的通用工具集;Hadoop分布式文件系统(HDFS),支持对应用数据高吞吐量访问的分布式文件系统;Hadoop YARN,用于作业调度和集群资源管理的框架;Hadoop MapReduce,基于YARN的大数据并行处理系统。Hadoop目前除了社区版,还有众多厂商的发行...

hadoop安哪个版本
Hadoop版本推荐安装Hadoop 3.x系列版本。这是当前最新的稳定版本,具备良好的稳定性和扩展性,适用于大数据处理和分析。此外,这个版本还提供了更好的安全性和资源管理功能。以下是关于该版本选择的 一、Hadoop 3.x系列版本的优势 Hadoop 3.x系列版本在功能和性能上都有了很大的提升。该版本对HDFS、YARN...

新手学习hadoop用什么系统好
目前为止,作为半只脚迈进Hadoop大门的人,我建议大家还是选择Hadoop 1.x用。可能很多人会说,Hadoop都出到2.4,为啥还用1.x呢,说这话一听就没玩过hadoop。理由一: Hadoop 1.x和2.x是完全两个不同的东西,并不是像说单机的webserver从1.0升级到2.0那么简单的事情。也不是说我现在用的mysql...

如何选择正确的Hadoop版本
如果要给hadoop入门级新手做一个hadoop版本的推荐,可以使用DKH的发行版hadoop。DKH标准版有三个不同的子版本:用于开发调试的单机版;支持三节点的学习版;支持五节点以上的标准服务器版。DKH-分布式SQL版有两个子版本:学习版和服务器版。入门级新手可以选择DKH标准版中的支持三节点的学习版。DKH有...

Hadoop3的安装:安装JDK8
在选择学习和测试hadoop3集群时,考虑到资源占用情况,对于CentOS7、8以上版本的用户,使用CentOS6.x版本更为合适。第一步:解压缩JDK8。tar –zxvf jdk-8u91-linux-x64.tar.gz 完成解压缩后,JDK8已安装在系统中。第二步:配置环境变量。使用sudo vi \/etc\/profile编辑配置文件,添加以下环境变量...

现在想学习数据库架构领域的知识,是选择db2好,还是hadoop好?
选择 hadoop 绝对没有错,hadoop技术还在发展阶段 现在 是大数据的时代,传统的关系型数据已经很难 满足大数据量的处理。任何技术都可能被别的技术替代,作为程序员来说,就是要不断的学习。

有哪些好的hadoop学习资料
书不要买太多,一本书从头到尾看下来比较好,不是从头到位尾看下来的一般没有什么太大的效果。建议 路嘉恒《Hadoop实践》讲的很专业也很基础。要是能从头到尾看下来对你会有帮助的。另外一本入门层次较高的就是《Hadoop权威指南》。还有一本入门层次较高的清华大学出版的《高可用的HDFS》里面讲的技术...

需要在linux上安装什么软件来学习hadoop
Hadoop有官方发行版Hadoop与cloudera版,其中cloudera版是Hadoop的商用版本。下载hadoop-2.4.0.tar.gz(当前最新)并将其解压,这两个那个也可以,不过一般都是用官方发行版。这里你可以下载其他的相关软件http:\/\/www.linuxprobe.com\/tools 可以去看下,希望对你有帮助啊 ...

hadoop权威指南第三版和第四版的区别
《Hadoop权威指南》是2010年清华大学出版社出版的图书,作者是怀特。本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。2、内容介绍 《Hadoop权威指南(中文版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理...

想学hadoop,需要先学什么?哪有自学用的教程?
首先要有Java基础,然后推荐《Hadoop权威指南》作者Tom White,封面上有大象的那个。《Hadoop实战》作者Chuck Lam,人民邮电出版社

相似回答