在DataWorks中,如果您想将抽取的所有内容合并为一个字段,请按照以下步骤操作:
打开您的数据集并选择“数据抽取”。
在“数据抽取”页面上,单击“添加表”按钮
在“添加表”页面上,输入表的名称,并选择您要抽取的数据源。
在“数据源配置”页面上,选择“高级配置”选项卡。
在“高级配置”选项卡下,找到“提取SQL”文本框,并输入您的SQL语句。在SQL语句中,使用CONCAT函数将所有字段合并到一个字段中。例如,如果您有两个字段a和b,您可以使用以下语句将它们合并为一个字段c:
SELECT CONCAT(a, b) AS c FROM table_name;
支持全量拉取 支持将Elasticsearch中一个文档的所有内容拉取为一个字段。支持提取半结构化到结构化数据分类 描述 产生背景 Elasticsearch中的数据特征为字段不固定,且有中文名、数据使用深层嵌套的形式。为更好地方便下游业务对数据的计算和存储需求,特推出从半结构化到结构化的转换解决方案。 实现原理 将Elasticsearch获取到的JSON数据,利用JSON工具的路径获取特性,将嵌套数据扁平化为一维结构的数据。然后将数据映射至结构化数据表中,拆分Elasticsearch复合结构数据至多个结构化数据表。 此答案整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。