开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

大数据计算MaxCompute自定义函数没有问题测过的就是要用的数据量比较大容易OOM,这怎么办?

大数据计算MaxCompute自定义函数没有问题,测过的,就是要用的数据量比较大,容易OOM,这怎么办?

展开
收起
真的很搞笑 2023-07-25 17:59:50 107 0
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    如果您的 MaxCompute 自定义函数在处理较大数据量时容易发生 OOM 错误,可以尝试以下几种方法:

    增加集群的资源配额:如果您的作业需要处理大量数据,可以考虑增加集群的资源配额,例如增加集群的内存和 CPU 配额等。这样可以让作业有更多的资源进行计算,从而减少 OOM 错误的发生。

    调整作业的配置:根据具体情况,可以调整作业的内存和 CPU 使用量等参数,例如可以增加作业的 mapreduce.map.memory.mb 和 mapreduce.reduce.memory.mb 参数,或者调整作业的并行度(mapreduce.job.reduces)等,以提高作业的执行效率和稳定性。

    优化代码和算法:如果您的作业代码和算法存在一些性能问题,例如使用了大量的内存或者存在内存泄漏等问题,可以尝试优化代码和算法,减少内存占用和资源消耗。例如,可以使用更合理的数据结构、算法和缓存机制,或者避免在循环中创建大量的对象等。

    2023-07-29 09:03:53
    赞同 展开评论 打赏
  • 当在大数据计算中使用MaxCompute自定义函数时,如果遇到OOM(Out of Memory)问题,以下是一些应对策略:

    1. 增加内存配额: 可以尝试增加作业的内存配额,通过调整资源配置来提供更多的可用内存。这可以通过在任务提交或作业级别设置合适的参数来实现。请注意,增加内存配额可能会对集群的整体资源分配产生影响,需要进行权衡和调整。

    2. 优化数据处理流程: 重新审视数据处理流程并优化代码逻辑,以减少内存占用。可以考虑使用合适的数据结构、减少不必要的中间结果、降低数据复制量等方法来改善性能和内存利用率。

    3. 增加集群规模: 如果内存仍然不足以处理大规模数据集,请考虑增加MaxCompute集群的规模。通过增加节点数量或升级节点规格,提供更多的计算和内存资源,从而处理更大规模的数据。

    4. 数据分区和分批处理: 将大数据集划分为更小的分区进行处理,可以减少单次操作的内存需求。通过分批处理方式,逐个处理分区,同时限制每个批次的数据量,有助于降低OOM风险。

    5. 使用增量计算: 如果业务允许,可以考虑使用增量计算方式。通过只处理增量数据,而不是全量数据集,可以大幅减少需要在内存中处理的数据量。

    6. 调整GC策略: JVM的垃圾回收(GC)策略可能对内存使用和性能产生影响。根据场景和需求,可以适当调整GC相关参数,以获得更好的内存管理和性能表现。

    2023-07-28 18:32:12
    赞同 展开评论 打赏
  • 可以调一下这个参数看看
    odps.sql.joiner.instances:设定Join Task的Instance数量,默认为-1,在[0,2000]之间调整。场景:每个Join Instance处理的数据量比较大,耗时较长,没有发生长尾,可以考虑增大使用这个参数。

    odps.sql.udf.jvm.memory:设定UDF JVM Heap使用的最大内存,单位M,默认1024M,在[256,12288]之间调整。场景:某些UDF在内存计算、排序的数据量比较大时,会报内存溢出错误,这时候可以调大该参数,不过这个方法只能暂时缓解,还是需要从业务上去优化。,此回答整理自钉群“MaxCompute开发者社区2群”

    2023-07-25 18:20:09
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 热门讨论

    热门文章

    相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载