dataworks为什么添加ecs自建数据源,必须走独享数据集成吗?
对于DataWorks(DataWorks数据集成服务)添加ECS自建数据源的情况,建议首先选用内网连接方式,而非公网连接。如果要在DataWorks内实现从ECS自建数据源的数据同步、数据抽取或数据清洗等功能,确实需要通过数据集成进行调用。
这是因为,ECS自建数据源一般采用专有数据库及协议,而DataWorks对于数据源的支持是基于标准化的JDBC或者ODBC协议的。
因此,在DataWorks中,为了保证数据集成的数据安全、稳定性以及避免出现数据泄露的情况,需要将源数据从ECS上抽取到专门用来承载数据的独享资源,这样可以避免源端数据被非法窃取的情况。
故,为了保证数据安全和数据准确性,添加ECS自建数据源,确实需要通过独享数据集成进行调用。
阿里云DataWorks中添加ECS自建数据源时,不一定必须走独享数据集成。DataWorks提供了两种数据集成方式:独享数据集成和共享数据集成,用户可以根据具体的需求和场景选择合适的方式。
独享数据集成是DataWorks提供的一种高级数据集成方式,通过在VPC内部署专用的数据集成服务,实现数据源与DataWorks项目之间的数据传输。独享数据集成可以提供更高的安全性和性能,适用于对数据传输要求较高且对数据安全有较高要求的场景,如需要传输敏感数据或大量数据的场景。
共享数据集成是DataWorks提供的一种简化数据集成方式,通过公网进行数据传输,无需在VPC内部署专用的数据集成服务。共享数据集成适用于对数据传输要求较低且对数据安全要求相对较低的场景,如需要传输非敏感数据或少量数据的场景。
当添加ECS自建数据源时,DataWorks支持通过独享数据集成和共享数据集成两种方式进行数据集成。用户可以根据具体的需求和安全要求选择合适的数据集成方式。如果需要更高的安全性和性能,可以选择独享数据集成,如果对数据传输要求相对较低,可以选择共享数据集成。需要注意的是,独享数据集成可能需要在VPC内部署专用的数据集成服务,因此可能会涉及到网络设置和安全规则的配置,需要根据实际情况进行调整。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。