【深入淺出 Yarn 架構與實現】4-1 ResourceManager 功能概述

2022-11-22 21:00:45

前面幾篇文章對 Yarn 基本架構、程式基礎庫、應用設計方法等進行了介紹。之後幾篇將開始對 Yarn 核心元件進行剖析。
ResourceManager(RM)是 Yarn 的核心管理服務,負責叢集管理、任務排程、狀態機管理等,本篇將對 RM 總體架構進行介紹。

一、RM 基本職能

主要包含以下幾個功能:

  • Client 互動:處理來自 Client 的請求;
  • 管理 ApplicationMaster:啟動、管理、重啟等;
  • 管理 Nodemanager:接收 NM 彙報的資源資訊,並下達管理指令;
  • 資源管理與排程:接收 AM 的資源請求,並分配資源。

如上圖所示,RM 中各元件通過對應 RPC 與各 Client 進行通訊:

  • ResourceTrackerProtocol: NodeManager(NM)通過該 RPC 協定向 RM 註冊、彙報節點健康狀況和 Container 執行狀態,並領取 RM 下達的命令。NM 與 RM 之間採用了「pull模型」,NM 總是週期性地主動向 RM 發起請求(心跳),並領取下達給自己的命令。
  • ApplicationMasterProtocol: 應用程式的 ApplicationMaster 通過該 RPC 協定向 RM 註冊、申請資源和釋放資源。(AM 與 RM 互動參考上一篇文章「3-3 Yarn Application Master 編寫」)
  • ApplicationClientProtocol: 應用程式的使用者端通過該 RPC 協定向 ResourceManager 提交應用程式、查詢應用程式狀態和控制應用程式(比如殺死應用程式)等。(AppClient 與 RM 互動參考文章「3-2 Yarn Client 編寫」

從以上介紹中可以看出,與 RM 通過 RPC 通訊的元件都採用「Pull 模型」,各個「Client」通過心跳定期向 RM 彙報,在心跳返回值中領取 RM 下達的指令。

二、RM 內部架構

本節將深入 RM 內部,看其內部組織結構和主要模組,架構圖如下所示:

一)使用者互動模組

RM 分別針對普通使用者、管理員和 Web 提供了三種對外服務:

  • ClientRMService: 為普通使用者提供的服務,它處理來自使用者端各種RPC請求,比如提交應用程式、終止應用程式、獲取應用程式執行狀態等;
  • AdminService: RM 為管理員提供了一套獨立的服務介面,以防止管理員傳送的管理命令餓死,管理員可通過這些介面管理叢集,比如動態更新節點列表、更新ACL列表、更新佇列資訊等;
  • WebApp: 更加友好地展示叢集資源使用情況和應用程式執行狀態等資訊。

二) NM 管理模組

  • NMLivelinessMonitor: 監控 NM 是否活著,長時間(預設為10min)內未彙報心跳資訊,則認為其掛了;
  • NodesListManager: 維護正常節點和異常節點列表,管理exclude(類似於黑名單)和include(類似於白名單)節點列表,這兩個列表均是在組態檔中設定的,可以動態載入;
  • ResourceTrackerService: 處理來自 NM 的請求,主要包括註冊和心跳兩種請求。

三) AM 管理模組

  • AMLivelinessMonitor: 監控AM是否活著,長時間未彙報心跳,它上面所有正在執行的 Container 將被置為失敗狀態,而 AM 本身會被重新分配到另外一個節點上執行(AM 重試次數預設是2);
  • ApplicationMasterLauncher: 與某個 NM 通訊,要求它為某個應用程式啟動 ApplicationMaster;
  • ApplicationMasterService(AMS): 處理來自 AM 的請求,主要包括註冊和心跳兩種請求。其中心跳彙報資訊包含所需資源描述、待釋放的Container列表、黑名單列表等,而 AMS 則為之返回相應的 Container 資訊。

四) Application 管理模組

  • ApplicationACLsManage: 管理應用程式存取許可權,包含兩部分許可權:檢視許可權和修改許可權;
  • RMAppManager: 管理應用程式的啟動和關閉;
  • ContainerAllocationExpirer: 當 AM 收到 RM 新分配的一個 Container 後,必須在一定的時間內啟動該 Container,否則將被回收。

五)狀態機管理模組

RM 共維護四類狀態機:

  • RMApp: 維護一個 Application 的整個執行週期,可能會包括多次 Attempt;
  • RMAppAttempt: 一個範例執行失敗後,可能再次啟動一個重新執行,而每次啟動稱為一次執行嘗試用 「RMAppAttempt」描述,RMAppAttempt 維護了一次執行嘗試的整個生命週期;
  • RMContainer: 維護一個 Container 的執行週期。RM 將資源封裝成 Container 傳送給應用程式的 AM,而AM 則會在 Container 中啟動任務;
  • RMNode: 維護一個 NM 的生命週期,包括啟動到執行結束整個過程。

六)安全管理模組

RM 有非常全面的許可權管理機制,主要包括:

  • ClientToAMSecretManager
  • ContainerTokenSecretManager
  • ApplicationTokenSecretManager

七)資源分配模組

該模組主要涉及一個元件「ResourceScheduler」。其是資源排程器,按照一定的約束條件(比如佇列容量限制等)將叢集中的資源分配給各個應用程式。
ResourceScheduler 是一個插拔式模組,自帶三個排程器,使用者可以自己客製化:

  • FIFO:先進先出,單使用者
  • Fair Scheduler:公平排程器(FairScheduler基本上具備其它兩種的所有功能)
  • Capacity Scheduler:容量排程器

此部分將在後面文章中更詳細的介紹。

三、RM事件與事件處理器

Yarn採用了事件驅動機制,而RM是的實現則是最好的例證。所有服務和元件均是通過中央非同步排程器組織在一起的,不同元件之間通過事件互動,從而實現了一個非同步並行的高效系統。
下面是詳細的表格:

四、小結

在 YARN 中,ResourceManager 負責叢集中所有資源的統一管理和分配,它接收來自各個節點(NodeManager)的資源彙報資訊,並把這些資訊按照一定的策略分配給各個應用程式。
本篇對 ResourceManager 總體架構進行了介紹。對其基本職能、內部結構、處理的事件進行了梳理。後續文章中將會對每個部分深入原始碼進行更深入討論。


參考文章:
《Hadoop 技術內幕 - 深入解析 Yarn 結構設計與實現原理》第五章