开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

kafka同步odps数据条数为0,为什么不立即执行完呢?

kafka同步odps数据条数为0,为什么不立即执行完呢?

展开
收起
滴滴滴~ 2023-03-22 10:23:31 245 0
2 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    可能是数据同步延迟:当新数据写入ODPS数据源时,同步作业可能需要一些时间才能检测到该数据并将其传输到Kafka主题。

    2023-03-22 10:38:50
    赞同 展开评论 打赏
  • 界面设置同步策略:1分钟读取不到新数据,但是用户12分钟都没有读取到数据一直在运行,如下图:image.png 问题原因:这是因为kafka离线同步每个分区需要启动一个子线程读取,并且读取时间至少1分钟,因为kafka的分区有12个,然后并发设置的味1,所以任务至少也要跑12分钟才能跑完,因为同步任务本身并不知道分区有没有数据,是要读了才知道的。 此答案整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-03-22 10:38:48
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 立即下载
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载