开发者社区> 问答> 正文

DAG 2.0支持新型计算机模式的具体表现形式是什么?

DAG 2.0支持新型计算机模式的具体表现形式是什么?

展开
收起
曦情兮 2022-05-09 22:39:10 301 0
1 条回答
写回答
取消 提交回答
  • 在 DAG 2.0 的框架上,为了更准确的描述节点之间的调度和运行关系,引入并且实现了 concurrent edge 的概念:通过 concurrent edge 连接的上下游节点,在调度上存在先后,但是可以同时运行。而调度的时机也可以灵活配置:可以上下游同步调度,也可以在上游运行到一定程度后,通过事件来触发下游的调度。在这种灵活的描述能力上, PS 作业可以通过如下这种 DAG 来描述,这不仅使得作业节点间的关系描述更加准确,而且使得 AM 能够理解作业的拓扑,进行更加有效的作业管理,包括在不同计算节点发生 failover 时不同的处理策略等。,DAG 2.0 新的描述模型,也允许 PAI 平台上的 Tensorflow/PS 作业实现更多的动态优化,并进行新的创新性工作。在上图的 dynamic PS DAG 中,就引进了一个额外的 control 节点,这一节点可以在作业运行过程中(包括 PS workload 运行之前和之后),对作业的资源申请,并发度等进行动态的调整,确保作业的优化执行。

    2022-05-10 12:59:38
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Flink中的两类新型状态存储 立即下载
为并行图数据处理提供高层抽象/语言 立即下载
软件定义的数据智能 立即下载