《云计算加速开源创新》——云时代下的DataOps开源技术演进

简介: 《云计算加速开源创新》——云时代下的DataOps开源技术演进

一、 云计算+开源

image.png

 

“云计算+开源”能够共同打造会进化的DataOps,其原因在于:

 

云按需使用、随需等特性为开源软件的传播提供有利条件。

 

云计算为开源软件创造一种以SaaS方式提供服务的盈利模式,这种模式的可行性在中国及海外都得到了验证。

 

云服务是开源原生公司最佳的技术选择之一,能够真正给客户带来开箱即用、业务聚焦价值。

 

image.png

 

云时代的开源技术有以下三种发展趋势:

 

第一,云时代的开源技术多样。例如,阿里的云上产品有200多种,每一种产品都有其适用场景。云的基础设施如数据湖、计算引擎等都有其典型商业代表,包含几十甚至上百种技术。

 

第二,开源公司发展迅速。传统的Talend、Kettle近几年市值普遍上涨,新成立的Bigeye不仅市值迅速上升,而且作为云原生新创领域的代表,该公司已经成为全球主流技术公司。

 

第三,数据消费多样。分析师、科学家、业务人员诉求各不相同,业务使用场景也十分多样。不同的技术应对于不同的场景,存在不同的数据消费类型。

 

image.png

 

云时代数据生命周期的典型特征是数据源丰富多样,不仅包括应用数据、 API/SaaS、数据库数据,还包括其他各种各样的业务数据。

 

数据有独立的生命周期,涵盖了从数据加载、数据集成、数据存储、数据处理、数据分析到数据消费的全过程。

 

数据生命周期的每一个阶段都存在多种技术,DataOps主要针对数据处理和数据分析阶段。

 

image.png

 

DataOps结合DevOps技术基础,将开发、部署、运维进行一体化整合,以应对数据需求快速变化的特点,具备三个优点:

 

第一,缩短部署分析周期时间。

 

第二,减少数据缺陷。

 

第三,构建标准化同源数据协作平台。随着云数据湖的发展,越来越多企业开始上云,数据也从先加工变成了先上云,DataOps有助于构建标准化数据同源。

DataOps旨在降低用户使用和分析数据的门槛,让人人都能够“玩数据”。

 

 

二、 DataOps重构现代技术栈

 

image.png

 

DataOps正在从不同方面重构现代数据栈。

 

云、数据湖仓引擎方面,DataOps在云服务器、数据湖、数据仓库格式、实时数据引擎及源数据引擎都进行了创新。

 

新一代数据工作流编排与集成引擎主要完成两项工作,一种是数据工作流编排,另一项是数据同步与计算。这也正是DataOps要解决两件事情。

 

此外,新一代数据工作流编排与集成引擎之上还有各种OLAP引擎及数据应用模块。

 

image.png

 

数据工作流编排开源技术发展主要经历了以下三个阶段

 

Crontab阶段:常见于Unix和Linux操作系统中,代码复用性低,无集群化部署,稳定性差,工作流编排无法满足数据要求。

 

Airflow阶段:面向工程师,使用代码编写工作流。扩展能力及多云异构能力较差。

 

新一代云原生开源工作流编排引擎阶段:不仅面向工程师,更面向普通用户,能够让工程师、分析师、科学家等普通用户简单地完成工作流编排。

 

image.png

 

数据工作流编排工具Apache DolphinScheduler的优点主要在于以下四个方面。

 

高性能、高可靠性。

简单易用性。用户能够通过界面简单操作完成交互。

使用场景丰富。

高扩展性及强云原生能力。

 

image.png

 

随着各个云的发展,越来越多的企业都在上云。多云成为趋势,数据需要同步到各个云之间。

 

新一代实时多源数据同步工具SeaTunnel作为数据集成引擎,能够完成各个云之间,库之间,以及数据源之间数据同步。其支持的数据源数量每年翻倍增长,已在100多家公司中推广使用。

 

image.png

 

一些企业已经选择了DataOps作为云原生方案,例如伊利和思科。

 

伊利集团在比较了Airfolw、Azkaban后,出于满足业务需求及稳定性的考虑,最终选择Dolphin scheduler作为大数据基础调度设施。

 

思科立足全球化部署,为满足各个国家、各个州的数据安全需求,最终选择从Airflow迁移到Dolphin schedule。

 

三、 DataOps未来

 

image.png

 

DataOps未来发展趋势主要可以概括为以下三点

 

将会以云数据湖仓为核心。海外部分企业已经开始以云上技术作为核心,中国也有越来越多的企业正在上云。

 

将会提供云原生全套服务组件。能够让用户在云上完成各项功能。

 

将会设计低代码的交互界面。让技术越来越简单、易用。

 

DataOps与现代数据栈旨在提升分析及数据自服务的灵活性,最终让数据实现自服务。

 

image.png 

 

云时代,DataOps的技术方向主要有以下四点

 

容器化:这是云时代已经现实的技术。

 

敏捷与智能化:让数据编排随着血缘关系自动串联起工作流程。

 

开箱即用:云和开源技术都应具备开箱即用的能力,且开源技术应在上云之后能够更简单得实现该能力。

 

多云能力:多云对于云服务提供商而言是一个很大的挑战。

 

云和开源不仅是“加法”关系,更是“乘法”关系,依托云计算基础设施,开源技术能够发展得更好。

相关文章
|
15天前
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
37 2
|
22天前
|
存储 安全 网络安全
云计算与网络安全:技术融合下的挑战与机遇
【10月更文挑战第9天】在数字时代,云计算和网络安全是推动企业创新和保护资产的两大支柱。本文将探讨云计算服务如何影响网络安全策略,并分析信息安全在云环境中的重要性。我们将通过实际案例来揭示云服务带来的安全挑战,同时展示如何利用最新的安全技术来增强防护。文章旨在为读者提供深入的洞见,帮助他们在享受云计算便利的同时,有效规避潜在的安全风险。
38 1
|
23天前
|
存储 安全 网络安全
云计算与网络安全:技术挑战与应对策略
【10月更文挑战第8天】随着云计算技术的飞速发展,越来越多的企业和个人开始将数据和应用迁移到云端。然而,这也带来了一系列网络安全问题。本文将探讨云计算环境下的网络安全挑战,并提出相应的应对策略。我们将从云服务模型、网络安全威胁、信息安全技术等方面进行分析,并通过代码示例展示如何实现安全措施。
|
1天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的未来之路
【10月更文挑战第30天】在数字化浪潮的推动下,云计算已成为企业信息技术架构的核心。然而,随之而来的网络安全问题也日益凸显。本文将探讨云计算与网络安全的关系,分析云服务中的安全挑战,并提出相应的解决方案。我们将通过实例展示如何在云计算环境中实现网络安全的最佳实践,以期为读者提供一条技术融合的未来之路。
|
3天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的双刃剑
【10月更文挑战第28天】本文旨在探索云计算在提供便利和效率的同时,如何成为网络安全领域的一大挑战。我们将从云服务的基本架构出发,分析其在信息安全中的关键作用,进而讨论当前网络安全面临的主要威胁及防御策略。文章还将探讨云计算环境中的数据保护、身份验证和访问控制机制,以及如何通过加密技术和安全协议来增强安全性。最后,我们将展望未来云计算与网络安全的发展趋势,并思考如何平衡技术创新与安全需求。
|
2天前
|
存储 安全 网络安全
云计算与网络安全:探索云服务中的信息安全技术
【10月更文挑战第29天】在数字化时代的浪潮中,云计算作为一种革命性的技术,正日益成为企业和个人数据存储与处理的首选方案。然而,随之而来的网络安全问题也愈发复杂和严峻。本文将深入探讨云计算服务中的网络安全挑战,并分析如何通过先进的信息安全技术来加强保护措施。我们将从云服务的基础知识出发,逐步深入到网络安全的各个方面,包括数据加密、身份验证、访问控制等关键技术的应用。通过理论与实践的结合,旨在为读者提供一套全面而实用的云计算安全指南。
|
6天前
|
安全 网络安全 API
云计算与网络安全:技术融合与挑战
【10月更文挑战第25天】在数字化时代,云计算作为信息技术的革新者,提供了强大的数据处理能力和灵活的资源管理。然而,随之而来的网络安全问题亦日益凸显,成为制约云计算发展的关键因素。本文深入探讨了云计算服务中的网络安全挑战,分析了信息安全技术的应对策略,并提出了相应的解决方案。通过实际案例分析,文章旨在为读者提供一个关于如何在享受云服务便利的同时确保数据安全的全面视角。
|
7天前
|
存储 安全 网络安全
云计算与网络安全:技术、挑战与解决方案
【10月更文挑战第24天】随着云计算技术的飞速发展,越来越多的企业和个人开始将数据和应用迁移到云端。然而,云服务的安全性问题也日益凸显,成为制约云计算发展的重要因素。本文将深入探讨云计算与网络安全之间的关系,分析当前面临的主要安全挑战,并提出相应的解决方案。通过阅读本文,读者将能够更好地理解云计算环境下的安全问题,并掌握应对策略。
|
8天前
|
存储 安全 网络安全
云计算与网络安全:技术融合下的挑战与对策
【10月更文挑战第23天】在数字化浪潮的推动下,云计算已成为企业信息技术架构的核心。然而,随之而来的网络安全问题也日益凸显,成为制约云服务发展的关键因素。本文将从云计算服务的基本概念出发,深入探讨网络安全的重要性,分析当前云计算环境中存在的安全威胁,并提出相应的防御策略。通过技术性的分析与实例说明,旨在为读者提供一套云计算环境下网络安全的实用对策。
27 1
|
10天前
|
存储 安全 网络安全
云计算与网络安全:技术融合与挑战
【10月更文挑战第21天】在数字化时代的浪潮中,云计算作为一项革命性技术正日益成为企业和个人存储、处理数据的优选方案。然而,随着云服务的快速发展和广泛应用,网络安全问题也随之浮现,成为制约云计算发展的关键因素之一。本文将探讨云计算环境中的网络安全挑战,分析信息安全的最佳实践,并提供相应的策略建议,以期为读者提供深入理解和有效应对网络威胁的方法。
36 3