OSS URI
在使用 E-MapReduce 时,用户将会使用两种 OSS URI,分别是:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云的E-MapReduce服务中,OSS(Object Storage Service)URI扮演着关键角色,用于指定数据存储位置,确保作业能够正确地读取输入数据和写入输出结果。您提到的两种OSS URI格式各有其特定用途:
Native URI (原生URI格式):
oss://[accessKeyId:accessKeySecret@]bucket[.endpoint]/object/path
Ref URI (引用URI格式):
ossref://bucket/object/path
注意事项中特别强调了使用OSS进行数据写入时的几点重要事项: - Multipart Upload: E-MapReduce利用OSS的多部分上传功能处理大数据量的写入。这意味着如果作业异常中断,OSS中可能会留下未完成的分片文件,需要手动清理以避免产生不必要的存储费用。 - 残留数据处理: 类似于HDFS,当作业因故中断,不仅需要删除OSS文件管理中的残留文件,还必须进入OSS的碎片管理界面清理那些未完成的上传分片。这是因为多部分上传的文件片段首先存储在临时区域,不直接显示在常规的文件列表中,因此容易被忽略。
综上所述,正确理解和应用这两种OSS URI格式对于高效、安全地在E-MapReduce作业中使用OSS存储至关重要,同时注意作业失败后的数据清理工作,以避免额外成本。