开放数据处理服务(Open Data Processing Service, 简称ODPS)是一个开放的计算平台,如果您要导入到OpenSearch的数据是由ODPS平台计算而产生的,则可以直接配置ODPS源信息,系统会自动去获取数据。[backcolor=transparent]目前只支持全量。
【需注意】ODPS内外网分离,即外网ODPS在内网区域使用会有问题,所以在使用上有很多注意事项,我们整理了接入流程,请移步
OpenSearch对接ODPS(云梯2)流程。
[backcolor=transparent]1. 入口有两个:在应用基本配置-数据源中选择ODPS作为数据来源;或者创建应用的时候直接配置ODPS源。详见通过ODPS创建应用。
[backcolor=transparent]2. 配置ODPS源信息
OpenSearch支持当前账号下的ODPS的project,或者已经授权给当前账号访问的project中获取数据。选择“ODPS”数据源后,选择“被授权的project”,输入odps中要访问的project信息进行连接校验(已成功连接的project系统会进行缓存,直接点击对应的project名称即可,无需重新连接)。
如果连接校验失败,则需要检查授权是否存在或授权最近有无变更过。(需注意ODPS表字段若没有权限或权限不对,也会报错。)
配置字段映射关系:OpenSearch为ODPS源的数据提供了若干数据转换插件,如要使用,则在配置字段对应关系的同时,点击“内容转换”列中的“+”符号,则会在源字段被同步到OpenSearch之前,先进行内容转换,再进行同步。
如果内容转换插件由于配置错误、无法连接等错误失效,则源字段仍然会被同步到目标字段,只是内容不会被转换。
【注意】对于ODPS表中的
datetime及
timestamp类型系统会自动转化为毫秒数,请将对应OpenSearch字段类型设置为INT。
[backcolor=transparent]3 .选择分区信息
3.1 根据ODPS数据特性,OpenSearch允许用户根据具体需要来指定导入的分区,高级版支持正则表达式,表示导入前一天的数据,结合应用基本信息-索引重建-定时索引重建功能,可以实现每天导入新分区数据的效果。
3.2 [backcolor=transparent]标准版只支持具体分区值的方式,如pt=20161010,不支持正则表达式,可以指定多个具体分区。(等号/逗号/分号/双竖线为系统保留字符,分区列名/列值中应避免出现这些字符):
【高级版应用每天自动导入前1天分区全量数据条件例子】
pt=%Y%m%d || -1 days 【注:pt为分区字段名】
[backcolor=transparent]不同场景下odps分区条件用法,参考如下所示:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。