开发者社区> 问答> 正文

Spark中的Iterator函数实现的流程是什么?

Spark中的Iterator函数实现的流程是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-10 13:31:25 258 0
1 条回答
写回答
取消 提交回答
    1. 若标记了有缓存,则取缓存,取不到则进行computeOrReadCheckpoint(计算或读检查点)。完了再存入缓存,以备后续使用。

    2. 若未标记有缓存,则直接进行computeOrReadCheckpoint。

    3. “computeOrReadCheckpoint”这个过程也做两个判断:有做过checkpoint,没有做过checkpoint。做过checkpoint则可以读取到检查点数据返回。无则调该RDD的实现类的compute函数计算。compute函数实现方式就是向上递归“获取父RDD分区数据进行计算”,直到遇到检查点RDD获取有缓存的RDD。

    2021-12-10 13:31:56
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载