[YARN] MRAppMaster心跳原理

NotFound 发布于2019-08-14 12:21 / 2417人阅读

摘要：博客原文最近集群遇到一个问题就是集群在跑任务的时候，会超时而被，但任务重跑则成功，问题是随机的出现的，所以初步怀疑是因为心跳汇报出现问题或则因为繁忙住，因为某些机制导致等待不汇报心跳，所以我们还是先了解，是如何向汇报心跳的。

博客原文
hackshell

最近集群遇到一个问题,就是集群在跑任务的时候，AM会超时10min而被KILL，但任务重跑则成功，问题是随机的出现的，所以初步怀疑是因为AM心跳汇报出现问题或则RM因为繁忙hang住，AM因为某些机制导致等待10min不汇报心跳，所以我们还是先了解，AM是如何向RM汇报心跳的。

在MRAppMaster中，ContainerAllocatorRouter负责向RM申请资源（发送心跳）

RMContainerAllocator其最终父类是RMCommunicator，它实现了RMHeartbeatHandler接口

public interface RMHeartbeatHandler {
  long getLastHeartbeatTime(); // 获取上一次心跳的时间
  void runOnNextHeartbeat(Runnable callback); // 回调注册到callback队列的callback函数
}

每一次心跳回来，都会执行一次注册在heartbeatCallbacks中的回调函数：

allocatorThread = new Thread(new Runnable() {
      @Override
      public void run() {
        while (!stopped.get() && !Thread.currentThread().isInterrupted()) {
              ......
              heartbeat();            
              lastHeartbeatTime = context.getClock().getTime();// 记录上一次心跳时间
              executeHeartbeatCallbacks(); // 执行回调函数
              ....
});

RMCommunicator类中：

private void executeHeartbeatCallbacks() {
    Runnable callback = null;
    while ((callback = heartbeatCallbacks.poll()) != null) {
      callback.run();
    }
  }

在RMCommunicator启动时，首先会向RM注册，把自己的host和port告诉RM，然后在启动一条线程（startAllocatorThread）定期的调用RMContainerAllocator中实现的heartbeat方法（向RM申请资源，定期汇报信息，告诉RM自己还活着）。

AM初始化同时也会初始化RMCommunicator：

protected void serviceStart() throws Exception {
  scheduler= createSchedulerProxy(); // 获取RM的代理
  register(); // 注册
  startAllocatorThread(); // 心跳线程
....
}

AM的ContainerAllocatorRouter事件处理流程如下图：

注册流程：

调用RMCommunicator远程调用ApplicationMasterService的registerApplicationMaster方法，设置维护responseId，然后把它加入AMLivelinessMonitor中，并使用map记录时间，用来监控AM是否因为长时间没有心跳而超时，如果AM长时间没有心跳信息更新，RM就会通知NodeManager把AM移除。

心跳线程：

在发送心跳的过程中，即也是获取资源的过程

@Override
  protected synchronized void heartbeat() throws Exception {
    scheduleStats.updateAndLogIfChanged("Before Scheduling: ");
    List allocatedContainers = getResources();// 重要的方法
    if (allocatedContainers.size() > 0) {
      scheduledRequests.assign(allocatedContainers);
    }
   ......
  }

获取资源的过程：

private List getResources() throws Exception {
     ...
     response = makeRemoteRequest(); // 和RM进行交互
     ...
     // 优先处理RM发送过来的命令
     if (response.getAMCommand() != null) {
         switch(response.getAMCommand()) {
                case AM_RESYNC:
                case AM_SHUTDOWN:
                     eventHandler.handle(new JobEvent(this.getJob().getID(),
                                     JobEventType.JOB_AM_REBOOT));
                     throw new YarnRuntimeException("Resource Manager doesn"t recognize AttemptId: " +
                             this.getContext().getApplicationID());
                default:
                     ....
      }
     // 等等一系列处理
}
}

构建请求：

protected AllocateResponse makeRemoteRequest() throws IOException {
    AllocateRequest allocateRequest =
        AllocateRequest.newInstance(lastResponseID,
          super.getApplicationProgress(), new ArrayList(ask),
          new ArrayList(release), blacklistRequest);
    AllocateResponse allocateResponse;
    allocateResponse = scheduler.allocate(allocateRequest); // RPC调用ApplicationMasterService的allocate方法
    .....
}

每一次心跳的调用都会刷新AMLivelinessMonitor的时间，代表AM还活着

而且我们通过代码可以看出，资源请求被封装为一个ask，即一个ResourceRequest的ArrayList的资源列表例如：

priority:20 host:host9 capability:
priority:20 host:host2 capability:
priority:20 host:host10 capability:
priority:20 host:/rack/rack3203 capability:
priority:20 host:/rack/rack3202 capability:
priority:20 host:* capability:

然而，ask是如何被构造的呢？

RMContainerAllocator中的addMap,addReduce,assign方法中对ask的数据内容进行了修改

addContainerReq --> addResourceRequest --> addResourceRequestToAsk;

通过在代码自己添加日志可以看出，资源会被分为local，rack，和any级别去申请资源

最终变为一个ask list发送到RM上：

 ask Capability: ResourceName:* NumContainers:384 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:/rack/rack3201 NumContainers:227 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:/rack/rack3202 NumContainers:231 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:/rack/rack3203 NumContainers:152 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:/rack/rack3204 NumContainers:158 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:host1 NumContainers:46 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:host5 NumContainers:52 Priority:20 RelaxLocality:true
 ask Capability: ResourceName:host6 NumContainers:38 Priority:20 RelaxLocality:true

类似日志为：

getResources() for application_1438330253091_0004: ask=29 release= 0 newContainers=0 finishedContainers=0 resourcelimit= knownNMs=24

GPU云服务器云服务器 MRAppMaster Yarn yarn安装 yarn-cluster

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/64422.html

0011 - YARN核心设计解析

摘要：包括等，它们共同维护了一个事件与事件处理器的映射表，用来处理各个事件。例如内部包含一个中央异步调度器，并注册了等一系列事件事件处理器，由中央异步调度器统一管理和调度。当状态机转换到最终状态时，则退出。大数据梦工厂（ 0011 - YARN核心设计解析）1 - YARN RPC架构设计YARN RPC Serv...

KoreyLee 2021-11-22 14:56 评论0 收藏0

发表评论

登陆后可评论

0条评论

NotFound

男|高级讲师

我要关注我要私信

TA的文章

SpringCloud升级之路2020.0.x版-36. 验证断路器正确性

阅读 3751·2021-11-18 10:07
SpartanHost：高性能AMD Ryzen 3950X处理器的KVM VPS补货，1核/512

阅读 1843·2021-11-04 16:08
GigsGigsCloud：马来西亚VPS，1核500M内存/15G SSD/30M带宽，$6.8/

阅读 1806·2021-11-02 14:43
SpartanHost西雅图E5系列VPS补货,10Gbps端口,NVMe硬盘,月付8折

阅读 1327·2021-10-09 09:59
LetBox：$38.5/年/2核/2GB内存/30GB NVMe+256GB空间/10TB流量/1

阅读 1114·2021-09-08 10:43
如何抓取http请求/拦截器用法

阅读 1396·2021-09-07 09:59
快杰云主机 SSH登录缓慢的排查和解决

阅读 1291·2019-12-27 11:56
第三天

阅读 1407·2019-08-30 15:56

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

[YARN] MRAppMaster心跳原理

相关文章

**0011 - YARN核心设计解析**

发表评论

0条评论

NotFound

男|高级讲师

TA的文章

SpringCloud升级之路2020.0.x版-36. 验证断路器正确性

SpartanHost：高性能AMD Ryzen 3950X处理器的KVM VPS补货，1核/512

GigsGigsCloud：马来西亚VPS，1核500M内存/15G SSD/30M带宽，$6.8/

SpartanHost西雅图E5系列VPS补货,10Gbps端口,NVMe硬盘,月付8折

LetBox：$38.5/年/2核/2GB内存/30GB NVMe+256GB空间/10TB流量/1

如何抓取http请求/拦截器用法

快杰云主机 SSH登录缓慢的排查和解决

第三天

最新活动