开发者社区> 问答> 正文

Spark中RDD(Resilient Distributed Datasets)是什么?

Spark中RDD(Resilient Distributed Datasets)是什么?

展开
收起
芯在这 2021-12-05 20:05:17 337 0
1 条回答
写回答
取消 提交回答
  • RDD是弹性分布式数据集,是只读的分区记录集合。RDD拥有的操作比MR丰富的多,不仅仅包括Map、Reduce操作,还包括右图的filter、sort、join、save、count等操作,所以Spark比MR更容易方便完成更复杂的任务。

    2021-12-05 20:06:12
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载