开发者社区> 问答> 正文

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时,每个 m

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时,每个 maptask 执行任务的节点都需要加载该数据到内存,然后需要怎么做才能保证程序成功过运行?

展开
收起
游客ysk6odvtzspxs 2021-12-05 09:29:58 593 0
1 条回答
写回答
取消 提交回答
  • 需要按连接关键字建立索引:封装 MovieRate,方便数据的排序和序列化; 编写 MapReduce 程序

    2021-12-05 09:31:24
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载

相关实验场景

更多