开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

断点续传是通过 datahub中订阅功能来实现的吗?

断点续传是通过 datahub中订阅功能来实现的吗?

展开
收起
十一0204 2023-04-04 22:44:38 160 0
2 条回答
写回答
取消 提交回答
  • 意中人就是我呀!

    dataworks这边记录上次停止的位点 然后从这个位点再读取。 此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-04-05 13:50:40
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云DataWorks中的断点续传功能是通过DataHub中的订阅功能来实现的。

    DataHub是阿里云数据流服务的一部分,支持高吞吐量的数据流实时处理和传输,具有低延迟、高可靠性和灵活性等特点。在DataWorks中,您可以通过DataHub作为数据源,实现数据的抽取、清洗、同步等任务。

    在数据抽取过程中,如果出现网络中断、任务中止等情况,阿里云DataWorks可以通过DataHub中的订阅功能,自动记录上次抽取数据的位置和状态,从而实现断点续传的功能。具体来说,DataWorks会将订阅位置信息和状态存储在元数据中,并在下次任务启动时读取元数据,从上次位置继续抽取数据,确保数据抽取的连续性和完整性。

    需要注意的是,为了实现DataWorks中的断点续传功能,您需要在DataHub中创建一个订阅,并在DataWorks中设置订阅相关的参数和配置,以便正确地读取和处理数据。同时,建议您根据实际情况和需求,选择合适的DataHub订阅类型和配置,以确保数据抽取的效率和稳定性。

    2023-04-05 09:30:08
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载