带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用（1）

2023-05-25 364

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用（1）

5.3 实时计算Flink版

5.3.1 开始使用

5.3.1.1 Flink基础架构

Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台。

它能够基于同一个Flink运行时（Flink Runtime），提供支持流处理和批处理两种类型应用的功能。

现有的开源计算方案，会把流处理和批处理作为两种不同的应用类型，因为他们它们所提供的SLA是完全不相同的：

•流处理一般需要支持低延迟、Exactly-once保证

•批处理需要支持高吞吐、高效处理

所以在实现的时候通常是分别给出两套实现方法，或者通过一个独立的开源框架来实现其中每一种处理方案。

例如，实现批处理的开源方案有MapReduce、Tez、Crunch、Spark，实现流处理的开源方案有Samza、Storm。

Flink在实现流处理和批处理时，与传统的一些方案完全不同，它从另一个视角看待流处理和批处理，将二者统一起来：

•Flink是完全支持流处理，也就是说作为流处理看待时输入数据流是无界的；

•批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。

•基于同一个Flink运行时（Flink Runtime），分别提供了流处理和批处理API，而这两种API也是实现上层面向流处理、批处理类型应用框架的基础。

基础特性：

关于Flink所支持的特性，我这里只是通过分类的方式简单做一下梳理，涉及到具体的一些概念及其原理会在后面的部分做详细说明。

流处理特性

•支持高吞吐、低延迟、高性能的流处理

•支持带有事件时间的窗口（Window）操作

•支持有状态计算的Exactly-once语义

•支持高度灵活的窗口（Window）操作，支持基于time、count、session，以及data-driven的窗口操作

•支持具有Backpressure功能的持续流模型

•支持基于轻量级分布式快照（Snapshot）实现的容错

•一个运行时同时支持Batch on Streaming处理和Streaming处理

•Flink在JVM内部实现了自己的内存管理

•支持迭代计算

•支持程序自动优化：避免特定情况下Shufflfflffle、排序等昂贵操作，中间结果有必要进行缓存

API支持：

对Streaming数据类应用，提供DataStream API

对批处理类应用，提供DataSet API（支持Java/Scala）

与其他外部系统对接支持如下：

•支持HDFS

•支持来自Kafka的输入数据

•支持Apache HBase

•支持Hadoop程序

•支持Tachyon

•支持ElasticSearch

•支持RabbitMQ

•支持Apache Storm

•支持S3

•支持XtreemFS

•支持OSS

•支持Mysql

•支持Hudi

•支持SLS

《企业级云原生白皮书项目实战》——第五章大数据——5.3 实时计算Flink版——5.3.1 开始使用（2） https://developer.aliyun.com/article/1228412?groupCode=supportservice

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用（1）

5.3 实时计算Flink版

5.3.1 开始使用

5.3.1.1 Flink基础架构

阿里云支持与服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用（1）

5.3 实时计算Flink版

5.3.1 开始使用

5.3.1.1 Flink基础架构

阿里云支持与服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景