开发者社区> 问答> 正文

RDD中stage内部为什么要尽可能多地包含具有窄依赖关系的transformations操作呢?

已解决

RDD中每个阶段stage内部为什么要尽可能多地包含一组具有窄依赖关系的transformations操作呢?

展开
收起
游客dof4ggxyen75u 2022-11-01 16:50:51 2218 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    每个阶段stage内部尽可能多地包含一组具有窄依赖关系的transformations操作,以便将它们流水线并行化(pipeline)。边界有两种情况:一是宽依赖上的Shuffle操作;二是已缓存分区。

    2022-11-01 17:01:29
    赞同 展开评论 打赏
问答分类:
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
为并行图数据处理提供高层抽象/语言 立即下载
Flink中的两类新型状态存储 立即下载
Apache Flink 流式应用中状态的数据结构定义升级 立即下载