开发者社区 问答 正文

Spaek程序执行,有时候默认为什么会产生很多task,怎么才可以修改默认task执行个数呢?

Spaek程序执行,有时候默认为什么会产生很多task,怎么才可以修改默认task执行个数呢?

展开
收起
游客vwuxaq6iqaowc 2021-12-06 17:22:42 313 分享 版权
1 条回答
写回答
取消 提交回答
  • 有很多小文件的时候,有多少个输入block就会有多少个task启动 spark中有partition的概念,每个partition都会对应一个task,task越多,在处理大规模数据的时候,就会越有效率

    2021-12-06 17:22:57
    赞同 展开评论
问答地址: