新手学习hadoop用什么系统好

如题所述

目前为止,作为半只脚迈进Hadoop大门的人,我建议大家还是选择Hadoop 1.x用。可能很多人会说,Hadoop都出到2.4,为啥还用1.x呢,说这话一听就没玩过hadoop。

理由一: Hadoop 1.x和2.x是完全两个不同的东西,并不是像说单机的webserver从1.0升级到2.0那么简单的事情。也不是说我现在用的mysql 5.0,只要编译一个新版本就直接无缝迁移到5.5的事情。Hadoop从1.0过度到2.0是整个架构体系全部推翻重写的。从实现方式到用户接口完全是两个完全不同的东西,不要简单的认为那不过就像nginx从0.8升级到1.4一样。所以我给的建议是,生产环境用1.x,实验环境部署2.x作为熟悉使用。

理由二: 依然是,Hadoop不是webserver,分布式系统尽管Hadoop实现出来了,但是他仍然是非常复杂的一套体系,单说HDFS存储,以前Hadoop 0.20.2想升级到0.20.203,首先你需要在所有节点部署上新版的Hadoop,然后停止整个集群的所有服务,做好元数据备份,然后做HDFS升级,还不能保证HDFS一定能升级成功。这样升级一次的代价是很大的,停服务不说,万一升级不成功能不能保证元数据完整无误都是不可预知的。远比你想象的麻烦的多得多得多。千万不要以为有了TDH Manager或者其他管理软件你就真的可以自动化运维了,部署Hadoop只是万里长征的第一步而已。

理由三: Hadoop 2.x目前很不稳定,Bug比较多,更新迭代速度太快,如果你想选择2.x,想清楚再做决定,这玩意不是说你选择新的版本就万无一失了,Openssl多少年了,还出现了心脏滴血的漏洞,何况刚出来才不到一年的Hadoop2,要知道,Hadoop升级到1.0用了差不多7,8年的时间,而且经过了无数大公司包括Yahoo,Facebook,BAT这样的公司不停的更新,修补,才稳定下来。Hadoop2才出现不到一年,根本没有经过长期稳定的测试和运行,看最近Hadoop从2.3升级到2.4只用了一个半月,就修复了400多个bug。
温馨提示:内容为网友见解,仅供参考
无其他回答

新手学习hadoop用什么系统好
目前为止,作为半只脚迈进Hadoop大门的人,我建议大家还是选择Hadoop 1.x用。可能很多人会说,Hadoop都出到2.4,为啥还用1.x呢,说这话一听就没玩过hadoop。理由一: Hadoop 1.x和2.x是完全两个不同的东西,并不是像说单机的webserver从1.0升级到2.0那么简单的事情。也不是说我现在用的mysql...

现在学习hadoop从哪个版本入手
1、Apache Hadoop2.0版本,有以下模块:Hadoop通用模块,支持其他Hadoop模块的通用工具集;Hadoop分布式文件系统(HDFS),支持对应用数据高吞吐量访问的分布式文件系统;Hadoop YARN,用于作业调度和集群资源管理的框架;Hadoop MapReduce,基于YARN的大数据并行处理系统。Hadoop目前除了社区版,还有众多厂商的发行...

想要学习Hadoop,需要先会些什么技术比较好
1、java基础知识要过关,再具备些网络知识,就很容易入手hadoop 2、因为hadoop是最适于在linux系统中的, 所以最好再熟悉一下linux系统的服务配置以及常用的shell命令,对你学习它会事办功倍的。3、至于数学的东西是必备的基础知识,对于初学者来说,这是次要的,除非你学到高深处。

学习Hadoop必须要懂Linux和Java吗?Hadoop的学习路径是怎样的
Java的话,如果你要做Hadoop相关开发,学习Python等语言也可以,但最好还是选择Java,因为很多生态系统内的软件第一时间会提供Java接口,其他语言可以说是二等公民。学习路径就是Linux\/Hadoop生态系统\/Java同时开学。动手是最重要的。

如何选择正确的Hadoop版本
如果要给hadoop入门级新手做一个hadoop版本的推荐,可以使用DKH的发行版hadoop。DKH标准版有三个不同的子版本:用于开发调试的单机版;支持三节点的学习版;支持五节点以上的标准服务器版。DKH-分布式SQL版有两个子版本:学习版和服务器版。入门级新手可以选择DKH标准版中的支持三节点的学习版。DKH...

hadoop开发时是在纯linux系统上吗
hadoop开发时是在纯linux系统上吗 用hadoop不在与那个linux系统好,而是hadoop最好在linux下,其实linux都差不多,核心都是一样的,用起来也都大同小异,在linux系统上怎么搭建hadoop开发环境 在Eclipse的Windows->Preferences中,选择Hadoop Map\/Reduce,设定好Hadoop的安装目录,这里,我直接从linux的\/...

hadoop安哪个版本
一、Hadoop 3.x系列版本的优势 Hadoop 3.x系列版本在功能和性能上都有了很大的提升。该版本对HDFS、YARN和MapReduce等核心组件进行了优化,提高了系统的吞吐量和处理速度。同时,新版本还增强了安全性,支持更多的安全认证方式,提高了系统的安全性。此外,Hadoop 3.x系列版本还提供了更好的资源管理功能...

学习hadoop 需要java吗
1.大数据支持很多开发语言,但企业用的最多的还是java,所以并不是完全需要,有其它语言基础也可以,同时hadoop是由java编写的,要想深入学习,学习java是有必要的。2.于此,hadoop一般在工业环境大部分是运行在linux环境下,hadoop是用java实现的。所以最好是熟悉linux环境下编程。至于java做到看得懂比较好...

学习hadoop需要具备哪些基础
开发方面,hadoop首先是个提供大数据存储的平台,因此我们要使用其存储功能,因此需要掌握其数据操作的api(scala api 或者 java api);其次是hadoop是大数据分析的数据源,熟悉对大数据的 分析\/使用 方法(spark\/map-reduce技术,都有scala 和 java两种api)。因此,学习hadoop必须掌握scala或者java中的一门...

学习云计算必须会LINUX么?必须要在LINUX环境下工作么?
许多云服务提供商使用Linux作为其底层操作系统,如AWS的EC2实例、Google Cloud的Compute Engine等。因此,熟悉Linux环境可以帮助开发人员更好地理解和操作这些云服务,并优化应用程序的性能和安全性。然而,尽管Linux在云计算领域有着广泛的应用和重要性,但并不代表学习云计算就必须要精通Linux或者只能在Linux...

相似回答