XXLJOB：超长定时任务慢节点优化实践-阿里云开发者社区

XXLJOB：超长定时任务慢节点优化实践

2025-12-29 3

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 通过视图落表、节点拆分缓解计算堆积，结合前置裁剪与mapjoin优化数据倾斜，利用distmapjoin提升大表关联效率，并拆分节点降低回刷成本，全面提升宽表产出时效与稳定性。

.1、视图落表&节点拆分
优化的第一步，也是最简单的一步，就是将节点中涉及到的视图进行物化落表，并让我们的慢节点任务，从调用视图变成调用实体表。这一步的操作主要是为了缓解计算堆积的问题，让一部分可以提前进行的计算，尽早进行调度，不必等到大宽表所有的上游依赖都产出之后再开始。

直接引用视图：视图中的计算逻辑堆积到大宽表任务中，增加了运行时间（绿色：上游任务；蓝色：大宽表慢任务）。

视图落表：视图中的计算逻辑提前算好，缓解大宽表节点的计算压力
类似地，我们也可以对部分子查询中的逻辑进行封装落表，拆分成多个节点的方式来把计算压力分散，提早进行调度。这样不仅减轻了大宽表节点的计算压力，也让logview中的DAG图更加清晰明了，方便针对性地进行优化和调参。

4.2、前置裁剪
第二步就是解决数据倾斜的问题。对于非空值的数据倾斜，比较通用的做法有两种：mapjoin和skewjoin。
先说skewjoin，我们这种热点变动的场景（每日流量不一定有热点，热点数量和热点值也不确定），没办法准确指定热点key值，贸然使用skewjoin的话，每日动态获取重复行数top的热值计算，会产生额外资源和时间消耗，收益性价比并不高。
接下来考虑mapjoin。如果join的右表比较小，可以放到内存中，那么使用mapjoin无疑是最优的，这样可以避免大表数据的全量shuffle（在我们这个场景里，左表有几十亿行，TB量级的数据，shuffle成本还是比较高昂的），大幅提升join效率。但是很不幸，我们这里join的右表都不是省油的灯，数据量远超mapjoin能容纳的内存上限（维表行数在几亿～百亿之间不等），直接mapjoin是行不通的。
直接mapjoin走不通并不代表无计可施，通过count distinct 左表的关联key数量，我们发现虽然作为右表的标签维表数据量非常庞大，但最后关联上左表的部分只有非常小的占比（1%～5%）。

全量标签表B中只有一小部分B'实际关联到了左表A
因此，我们优化的方向就是尽量避免无用部分（B-B'）参与计算。这种情况我们可以采取两次mapjoin的方式，先对数据行进行前置裁剪后，再完成join关联。
-- 关联前进行裁剪
with TMP as -- 获取当日活跃的关联key ( select user_id from A group by user_id )
select /+ mapjoin(B1) / -- 裁剪后的维表，数据量能降低2个数量级，这时使用mapjoin变为可行 ...from Aleft join ( select /+ mapjoin(TMP) / -- 活跃key数据量相对较小，可以使用mapjoin裁剪 ... from B inner join TMP -- 根据活跃key进行裁剪，缩小行数 on B.user_id = TMP.user_id ) B1on A.user_id = B1.user_id;
裁剪后的右表数据量大大减少，部分维表此时已经可以满足mapjoin的使用条件了。这时候使用mapjoin关联回主表，自然能解决数据倾斜的问题，同时运行效率大幅提升。
相比直接的Join来说，虽然这种方案增加了计算当日活跃key的步骤（group by），但是通过两次mapjoin规避掉了右表数据中 B-B' 部分的全量排序过程，节省了Disk IO耗时，从而大大提高了join效率。

4.3、中表关联
虽然通过前置裁剪大幅缩减了join右表的数据量，但是并不是所有的右表通过裁剪之后都能放到mapjoin里，像用户标签/内容标签/粉丝标签这些维表，缩减后仍然有几千万行（几十G）的数据量，使用普通join直接关联，耗时仍然较高。
关于较大表之间的join优化，我们可以考虑采用分桶的方案，按照关联key对数据分桶后再来join。但是在这个场景里，需要关联的右表较多，并且关联key都不相同，分桶聚簇键不好设置，分桶join带来的性能提升收益并不明显。
万幸，我们发现ODPS的Distributed Mapjoin可以完美解决我们的困境。我们左表（几十亿行数据，TB量级）远大于需要关联的右表（几千万行数据，百GB左右），符合Distributed Mapjoin使用场景。所以我们对于裁剪后无法使用mapjoin的维表，改为使用distmapjoin来关联。
使用distmapjoin时，有两个参数需要配置：shard_count和replica_count，官方文档中已经有比较明确的推荐参数计算方式了：
Shard
即分片。小表数据分片到各个计算节点处理。shard_count过大会导致client端读取的时候访问过多的server，性能和稳定性受影响；shard_count过小，会导致单个worker内存使用过多报错。
在当前版本中，shard_count值建议手动指定。shard_count值可以根据小表数据量来大致估算。预估一个shard处理的数据量范围是[200M, 500M]。shard_count值最好取质数，简单也可以取奇数。
未来我们会支持shard count的自动计算和调整。
Replica
副本数。为了减少访问压力以及避免单个worker失效导致整个任务失败，同一个shard的数据，可以有多个副本。默认为1，当client端并发过多，或者环境不稳定导致server端频繁重启，可以适当提高replica_count为2或者3。
shard和replica共同决定service端的并发度：并发度 = shard_count * replica_count。
而从我们的节点多次测试对比下来，replica_count设置为2，shard_count设置为：小于 [ 中表mapper输出数据大小 / 200M ] 的最大质数，能够取得兼顾性能与稳定性的较优效果。

4.4、最终优化方案
经过了上面三步优化，我们基本解决了数据关联耗时较长的问题，产出时效有了比较明显的提升，同时也规避掉了部分冗余无用的计算，节约了计算资源。但是做到这样就够了么？回想我们当初想解决的三个问题：计算堆积、数据倾斜、回刷成本高昂。
对没错，针对回刷成本高昂的问题，我们不妨顺手也解决掉，把宽表节点拆分成两部分：关联维表进行标签补全的部分（中间临时表）、埋点解析&字段格式处理的部分（叶子结点）。这样拆分之后，在数据结构没有较大调整的情况下，未来新增埋点参数解析类的需求，只需要变更回刷相对简单的叶子结点即可，无需回刷join关联的部分，从而减少了回刷成本。

XXLJOB：超长定时任务慢节点优化实践

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

XXLJOB：超长定时任务慢节点优化实践

热门文章

最新文章

相关电子书