`
小网客
  • 浏览: 1214962 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

[YARN]Apache Hadoop 2.2.0YARN技术架构[翻译]

 
阅读更多

YARN架构

MapReduce在Hadoop0.23的时候做了很大的改动,我们称之为MRv2或者YARN。

MRv2的主要观点是把JobTracker,资源管理,任务调度执行功能拆分成几个独立的进程。也就是说有一个全局的RM和AM,一个应用程序是一个独立的job或者一组job。

ResourceManager ,每个从节点,NodeManager 组成了一个数据计算框架,ResourceManager 负责协调整个系统的所有应用程序的资源。

每个应用程序的ApplicationMaster实际上是一个负责跟ResourceManager 协商资源,和NodeManager一起执行和监控任务的框架。



ResourceManager 拥有两大主要组件:Scheduler and ApplicationsManager。

Scheduler负责给所有的运行的应用程序分配资源,受制于容量和队列等。Scheduler仅仅是调度而不关心应用程序的状态监控跟踪。也不保证失败任务和应用失败以及硬件失败。仅仅关心应用程序的资源需求,是一个抽象的资源容器,包括内存,cpu,硬盘,网络等元素。第一个版本中只支持内存。

Scheduler是插件化的负责在各种队列和应用程序直接隔离集群资源,现在的MR调度机制包括CapacityScheduler 和FairScheduler都是插件化的。

CapacityScheduler支持层次队列,支持共享集群资源。

ApplicationsManager 负责接收任务提交,协调容器去执行应用尤其ApplicationMaster ,同时当ApplicationMaster 失败了提供重启服务。

NodeManager 在每个节点上都有,负责容器,监控资源使用情况,上报状态信息到ResourceManager/Scheduler。

每个应用的ApplicationMaster 用于协调从Scheduler资源容器,状态跟踪监控。

MRv2兼容以前稳定版本(hadoop-0.20.205),也就是说所有的MR任务在MRv2中不需要做任何修改只需要重编译即可运行。

 

  • 大小: 32.3 KB
1
0
分享到:
评论

相关推荐

    hadoop2.2.0 64位 native库centos64

    WARN org.apache.hadoop.util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable 在网上查了一下发现Apache官网提供的是32位编译的,在64...

    hadoop-2.2.0-src.tar

    Apache Hadoop 2.2.0 is the GA release of Apache Hadoop 2.x. Users are encouraged to immediately move to 2.2.0 since this release is significantly more stable and is guaranteed to remain compatible in...

    hadoop-2.2.0-x64.tar.gz part3

    自己编译的64bithadoop-2.2.0版本 [INFO] Reactor Summary: ...This command was run using /home/hadoop/Desktop/hadoop-2.2.0-src/hadoop-dist/target/hadoop-2.2.0/share/hadoop/common/hadoop-common-2.2.0.jar

    hadoop2.2.0部署

    3.1 hdfs和yarn单机安装 17 3.1.1 配置主机和防火墙 17 3.2 hadoop基本shell命令 19 3.3 简单JAVA实例 20 4 伪分布式部署spark 20 4.1 下载spark 20 4.2 解压安装 20 4.3 安装scala. 20 4.4 配置spark的启动参数 21 ...

    hadoop-2.2.0-x64.tar.gz part2

    hadoop-2.2.0 64bit下载,自己编译的 [INFO] Reactor Summary: [INFO] [INFO] Apache Hadoop Main ................................ SUCCESS [1.834s] [INFO] Apache Hadoop Project POM ...........................

    hadoop-2.2.0-x64.tar.gz part1

    hadoop-2.2.0, 64 bit,下载 自己编译的64bit的hadoop-2.2.0,自己lab安装使用。 [INFO] Reactor Summary: [INFO] [INFO] Apache Hadoop Main ................................ SUCCESS [1.834s] [INFO] Apache ...

    spark-2.2.0-yarn-shuffle.jar

    spark-2.2.0-yarn-shuffle.jar

    spark-2.2.0-bin-hadoop2.6.tgz

    spark-2.2.0-bin-hadoop2.6.tgz是用于支持Spark on YARN模式的安装的包

    hadoop补丁

    windows下hadoop-2.2.0命令行传参出错补丁 The system cannot find the batch label specified - make_command_arguments

    ranger-2.0.0-usersync.tar.gz

    随着Apache YARN的出现,Hadoop平台现在可以支持真正的数据湖架构。企业可以在多租户环境中运行多个工作负载。Hadoop中的数据安全性需要发展以支持多种用例进行数据访问,同时还需要提供一个框架来对安全策略进行...

    MahoutHadoopUseCase:电影推荐(1. 下载并预处理数据集;2. 将数据放入 hadoop HDFS;3. 在 Hadoop 上使用 MapReduce 运行 Mahout 协作过滤 4. 获取推荐的前 k 部电影列表)

    (问题已于 14 年 2 月 25 日解决),我想找出一种在 Hadoop 2.2.0 上使用 Mahout 0.8 协同过滤库运行用例的替代方法 在 Eclipse 和 Yarn 上运行 hadoop 程序 步骤: sbin/start_classicCF.sh 该脚本用于下载数据...

    Spark的安装(Standalone模式,高可用模式,基于Yarn模式)

    1、将spark-2.2.0-bin-hadoop2.7.tgz 上传到 /usr/local/spark/ 下,然后解压 2、进入到conf中修改名字 改为 .sh 结尾的 3、编辑 spark-env.sh 4、修改slaves 的名字 并且编辑他 5、发送到其他两台虚拟机上...

Global site tag (gtag.js) - Google Analytics