【Hadoop Yarn】Hadoop Yarn 基于优先级的调度算法

简介: 【4月更文挑战第7天】【Hadoop Yarn】Hadoop Yarn 基于优先级的调度算法

image.png

基于优先级的调度算法是一种常见的调度算法,它确保具有更高优先级的任务或作业在资源分配时优先考虑。下面是一个简单的示例代码,演示了如何在YARN中使用基于优先级的调度算法:

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.yarn.api.records.Priority;
import org.apache.hadoop.yarn.api.records.Resource;
import org.apache.hadoop.yarn.api.records.ResourceRequest;
import org.apache.hadoop.yarn.client.api.YarnClient;
import org.apache.hadoop.yarn.client.api.async.AMRMClientAsync;
import org.apache.hadoop.yarn.client.api.async.NMClientAsync;

public class PriorityBasedSchedulerExample {
   
   

    public static void main(String[] args) throws Exception {
   
   
        // 创建YARN客户端
        Configuration conf = new Configuration();
        YarnClient yarnClient = YarnClient.createYarnClient();
        yarnClient.init(conf);
        yarnClient.start();

        // 创建AM资源管理器客户端
        AMRMClientAsync<AMRMClientAsync.CallbackHandler> rmClient = AMRMClientAsync.createAMRMClientAsync(new RMCallbackHandler());
        rmClient.init(conf);
        rmClient.start();

        // 创建Node资源管理器客户端
        NMClientAsync nmClient = NMClientAsync.createNMClientAsync(new NMCallbackHandler());
        nmClient.init(conf);
        nmClient.start();

        // 请求资源
        Priority priority = Priority.newInstance(1); // 设置优先级为1
        Resource capability = Resource.newInstance(1024, 1); // 请求资源:1个CPU核心,1024MB内存
        ResourceRequest request = ResourceRequest.newInstance(priority, "*", capability, 1);

        // 提交资源请求给ResourceManager
        rmClient.addResourceRequest(request);

        // 等待资源分配和作业执行
        while (true) {
   
   
            Thread.sleep(1000);
            // 处理资源更新
            rmClient.handleEvents();
        }
    }

    // AM资源管理器回调处理器
    static class RMCallbackHandler implements AMRMClientAsync.CallbackHandler {
   
   
        // 实现回调处理方法
        @Override
        public void onContainersAllocated(List<Container> containers) {
   
   
            // 分配到资源后的处理逻辑
            for (Container container : containers) {
   
   
                // 启动容器执行任务
                nmClient.startContainerAsync(container, containerLaunchContext);
            }
        }
        // 其他回调方法的实现
        // ...
    }

    // Node资源管理器回调处理器
    static class NMCallbackHandler implements NMClientAsync.CallbackHandler {
   
   
        // 实现回调处理方法
        @Override
        public void onContainerStarted(ContainerId containerId, Map<String, ByteBuffer> allServiceResponse) {
   
   
            // 容器启动后的处理逻辑
        }
        // 其他回调方法的实现
        // ...
    }
}

在这个示例中,我们使用YARN的Java API创建了一个简单的YARN应用程序,其中包含一个基于优先级的资源请求。具体来说,我们通过Priority.newInstance()创建了一个优先级为1的优先级对象,并通过Resource.newInstance()创建了一个资源请求对象。然后,我们将资源请求添加到AM资源管理器客户端中,并等待资源分配和作业执行。

在实际的生产环境中,基于优先级的调度算法通常与队列管理结合使用,以确保高优先级的作业或任务能够在资源有限的情况下得到更多的资源分配。通过适当配置队列和优先级,可以实现更灵活和高效的资源管理。


基于Java 算法实现:

基于优先级的调度算法是一种常见的调度算法,它确保具有更高优先级的任务或作业在资源分配时优先考虑。下面是一个简单的基于优先级的调度算法的实现代码:

import java.util.PriorityQueue;

class Task implements Comparable<Task> {
   
   
    int priority;
    String name;

    public Task(int priority, String name) {
   
   
        this.priority = priority;
        this.name = name;
    }

    @Override
    public int compareTo(Task other) {
   
   
        // 较高优先级的任务排在队列的前面
        return other.priority - this.priority;
    }
}

public class PriorityScheduler {
   
   
    private PriorityQueue<Task> queue;

    public PriorityScheduler() {
   
   
        // 初始化优先级队列
        queue = new PriorityQueue<>();
    }

    public void addTask(int priority, String name) {
   
   
        // 添加任务到优先级队列
        Task task = new Task(priority, name);
        queue.offer(task);
    }

    public Task getNextTask() {
   
   
        // 获取下一个要执行的任务
        return queue.poll();
    }

    public static void main(String[] args) {
   
   
        PriorityScheduler scheduler = new PriorityScheduler();

        // 添加一些任务到调度器
        scheduler.addTask(3, "Task 1");
        scheduler.addTask(1, "Task 2");
        scheduler.addTask(2, "Task 3");

        // 从调度器中获取下一个要执行的任务
        Task nextTask = scheduler.getNextTask();
        System.out.println("Next task to execute: " + nextTask.name);
    }
}

在这个示例中,我们首先定义了一个Task类来表示任务,每个任务包括优先级和名称两个属性,并实现了Comparable接口以便在优先级队列中进行比较。然后,我们创建了一个PriorityScheduler类来实现基于优先级的调度算法,其中使用了Java标准库中的PriorityQueue作为优先级队列。在addTask()方法中,我们将任务添加到优先级队列中;在getNextTask()方法中,我们从队列中取出具有最高优先级的任务。

相关文章
|
2月前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
78 5
|
2月前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
36 4
|
2月前
|
XML 分布式计算 资源调度
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
168 5
|
2月前
|
XML 资源调度 网络协议
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
123 4
|
2月前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
82 4
|
3月前
|
资源调度 分布式计算 Hadoop
YARN(Hadoop操作系统)的架构
本文详细解释了YARN(Hadoop操作系统)的架构,包括其主要组件如ResourceManager、NodeManager和ApplicationMaster的作用以及它们如何协同工作来管理Hadoop集群中的资源和调度作业。
149 3
YARN(Hadoop操作系统)的架构
|
3月前
|
资源调度 分布式计算 Hadoop
使用YARN命令管理Hadoop作业
本文介绍了如何使用YARN命令来管理Hadoop作业,包括查看作业列表、检查作业状态、杀死作业、获取作业日志以及检查节点和队列状态等操作。
58 1
使用YARN命令管理Hadoop作业
|
3月前
|
分布式计算 资源调度 Hadoop
Hadoop YARN资源管理-容量调度器(Yahoo!的Capacity Scheduler)
详细讲解了Hadoop YARN资源管理中的容量调度器(Yahoo!的Capacity Scheduler),包括队列和子队列的概念、Apache Hadoop的容量调度器默认队列、队列的命名规则、分层队列、容量保证、队列弹性、容量调度器的元素、集群如何分配资源、限制用户容量、限制应用程序数量、抢占申请、启用容量调度器以及队列状态管理等方面的内容。
89 3
|
3月前
|
分布式计算 资源调度 Hadoop
Hadoop YARN资源管理-公平调度器(Fackbook的Fair Scheduler)
详细介绍了Hadoop YARN资源管理中的公平调度器(Fair Scheduler),包括其概述、配置、队列结构、以及如何将作业提交到指定队列,展示了公平调度器如何通过分配文件(fair-scheduler.xml)来控制资源分配,并提供了配置示例和如何通过命令行提交作业到特定队列的方法。
169 0
Hadoop YARN资源管理-公平调度器(Fackbook的Fair Scheduler)
|
4月前
|
图形学 数据可视化 开发者
超实用Unity Shader Graph教程:从零开始打造令人惊叹的游戏视觉特效,让你的作品瞬间高大上,附带示例代码与详细步骤解析!
【8月更文挑战第31天】Unity Shader Graph 是 Unity 引擎中的强大工具,通过可视化编程帮助开发者轻松创建复杂且炫酷的视觉效果。本文将指导你使用 Shader Graph 实现三种效果:彩虹色渐变着色器、动态光效和水波纹效果。首先确保安装最新版 Unity 并启用 Shader Graph。创建新材质和着色器图谱后,利用节点库中的预定义节点,在编辑区连接节点定义着色器行为。
279 0