DataWorks支持以下几种数据域划分方式:
单个表:将数据存储在单个表中,适用于数据量较小或数据结构较为简单的情况。 分区表:将一个大表按照某个或多个字段进行分区,例如按照时间或地域进行分区,可以更好地管理数据和查询数据。 分布式表:将数据分散存储在多个表中,每个表可以在不同的节点上分布存储,适用于处理大规模数据的情况。 多维分析表:将数据按照多维分析的方式组织,适用于数据分析与挖掘的情况。 索引表:将数据的索引信息单独存储在一个表中,适用于提高查询效率的情况。 视图:通过视图的方式对数据进行组织,可以更好地管理数据和保护数据的安全性。 外部表:可以将外部文件或数据库中的数据作为表进行使用,适用于处理非关系型数据的情况。 需要注意的是,不同的划分方式适用于不同的场景和需求,需要根据具体情况进行选择。
**通常,您需要阅读各源系统的设计文档、数据字典和数据模型设计文档,研究逆向导出的物理数据模型。进而,可以进行跨源的主题域合并,跨源梳理出整个企业的数据域。数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。为保障整个体系的生命力,数据域需要抽象提炼,并长期维护更新。在划分数据域时,既能涵盖当前所有的业务需求,又能让新业务在进入时可以被包含进已有的数据域或扩展新的数据域。数据域的划分工作可以在业务调研之后进行,需要分析各个业务模块中有哪些业务活动。数据域可以按照用户企业的部门划分,也可以按照业务过程或者业务板块中的功能模块进行划分。例如A公司电商营销业务板块可以划分为如下数据域,数据域中每一部分都是实际业务过程经过归纳抽象之后得出的。数据域 业务过程 会员店铺域 注册、登录、装修、开店、关店 商品域 发布、上架、下架、重发 日志域 曝光、浏览、点击 交易域 下单、支付、发货、确认收货 服务域 商品收藏、拜访、培训、优惠券领用 采购域 商品采购、供应链管理 https://help.aliyun.com/document_detail/154240.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。