阿里云E-MapReduce中,想用jindo-distcp实现hdfs到oss数据同步,现在oss数据由于变为归档类型的了,有60天不得删除的限制,所以同步的时候,想让变更的hdfs数据到另外的oss目录去,原来的oss目录下数据能保持不动,该如何实现呢?
可以实现从 HDFS 到 OSS 的全量数据同步,即能够完整地复制源目录下的所有文件及其元数据到目标OSS存储中。Jindo DistCp 是阿里云针对OSS优化的分布式数据迁移工具,能够高效、稳定地在Hadoop和OSS之间进行大数据文件迁移。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。