DataWorks同步ES 数据到opds 越来越慢，有什么可以优化的？

DataWorks同步ES 数据到opds 越来越慢，有什么可以优化的？retryCount=[30 ]
column=[["segment_id","is_error","time_bucket","statement","service_id","data_binary","start_time","endpoint_name_match","version","service_instance_id","endpoint_id","end_time","latency","service_name","endpoint_name","trace_id","service_name_match"]]
scroll=[10m ]
index=[skywalking_segment-20230726 ]
pageSize=[1000 ]
connTimeOut=[600000 ]
type=[default ]
retrySleepTime=[10000 ]
search=[{"match_all":{}} ]
envType=[0 ]
datasource=[bigdata_sla ]
readTimeOut=[600000 ]
full=[false ]
Writer: odps
partition=[dt=20230726 ]
truncate=[true ]
envType=[0 ]
datasource=[odps_first ]
isSupportThreeModel=[false ]
column=[["segment_id","is_error","time_bucket","statement","service_id","data_binary","start_time","endpoint_name_match","version","service_instance_id","endpoint_id","end_time","latency","service_name","endpoint_name","trace_id","service_name_match"]]
emptyAsNull=[false ]
tableComment=[ES中的全部数据 ]
table=[ods_skywalking_XX ]
Setting:
errorLimit=[{"record":""} ]
locale=[zh ]
speed=[{"throttle":false,"concurrent":10}]

展开

收起

真的很搞笑 2023-07-31 10:39:44 350 版权

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

当DataWorks同步ES数据到ODPS的速度逐渐变慢时，可能是由于以下原因导致的：

数据量增加：随着时间的推移，ES中存储的数据量可能越来越大，导致同步数据的时间变长。

网络问题：如果网络带宽受限或网络延迟较高，也会导致数据同步速度变慢。

资源限制：如果同步任务所在的资源池资源有限或者被其他任务占用，也会导致任务执行速度变慢。

为了优化DataWorks同步ES数据到ODPS的速度，您可以考虑以下几个方面：

调整同步任务配置：可以针对同步任务的配置进行优化，例如调整同步规则和同步条件，合理设置并发度和数据分片等参数，以提高任务执行效率。

增加资源：可以考虑增加资源池的资源，或者使用更高配置的云服务器，以提高同步任务的运行速度和并发能力。

优化网络带宽：可以优化网络带宽，例如使用更高速的网络连接、增加网络带宽等方式，以提高数据传输速度和稳定性。

定期清理数据：可以定期清理ES中不必要的数据，以减少数据量，降低同步任务的执行时间

2023-07-31 23:50:45

赞同展开评论
芯在这

可以参考一下通用的提速方式 https://developer.aliyun.com/article/979768?spm=a2c6h.12873639.article-detail.79.7d3372fbs30XBu，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-07-31 10:46:04

赞同展开评论

DataWorks同步ES 数据到opds 越来越慢，有什么可以优化的？

大数据开发治理DataWorks

相关文章

相关解决方案

热门讨论

热门文章