Apache Flink:全球领先的开源大数据计算引擎
Apache Flink 是一个开源的分布式大数据处理引擎, 可对有限数据流和无限数据流进行有状态计算。作为 Apache 软件基金会 (ASF) 顶级项目之一,Flink 在流处理方面具有绝对的优势,提供高吞吐、低延时的计算能力, Exactly-once 语义保证数据的准确性,亚秒级别的处理延迟确保业务的快速响应。
作为快速发展的新一代大数据引擎,Flink 本身的架构优势也吸引着越来越多的开源爱好者投入到社区的建设来。 截止到 2020 年 7 月,社区的 star 数达到 13600+ ,contributor 数达到 718,有 22989 次 commits。伴随着社区的快速发展,Flink 也成为类似阿里巴巴、腾讯、字节跳动、滴滴、美团点评等知名公司建设流处理平台的首选。
【推荐阅读】
Flink 社区技术发展风向标
更易用!Hive 集成弯道超车
Flink PMC 联合各大厂用人主管助你升职加薪
【企业案例】
• OPPO 实时数仓揭秘:从顶层设计实现离线与实时的平滑迁移:
单日总数据处理量超 10 万亿,峰值超每秒 3 亿
• bilibili 实时平台的架构与实践:
基于 Flink 的 bilibili Saber 实时计算平台
• 美团点评基于 Flink 的实时数仓平台实践:
深度解析美团点评实时数仓案例
【电子书】
• 《零基础入门:从 0 到 1 学会 Apache Flink》:
30 天成长为 Flink 大神
• 《Apache Flink 年度最佳实践》:
国内外一线大厂超大规模最佳实践案例合集
阿里云实时计算 Flink 版
实时计算 Flink版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica))是阿里云提供的基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由Apache Flink创始团队官方出品。在 PB 级别的数据集上可以支持亚秒级别的处理延时,赋能用户标准实时数据处理流程和行业解决方案;在支持 Datastream API 作业开发的同时,提供了完整的SQL语义,使得 BI 场景下的开发变得更加简单;丰富的上下游 connector 保证了与用户已使用的大数据组件无缝对接;智能作业调优和诊断功能进一步简化了用户的开发和使用。
实时计算 Flink版在 Apache Flink 核心功能的基础上还增强了企业用户所关注的集群稳定、性能优化、安全控制、系统监控和作业管理等。阿里云实时计算团队目前是全球最大、拥有 Committer 数量最多、专业性最强的 Flink 团队,为实时计算用户提供企业级的管理和咨询服务。2019 年 6 月,由数据中心联盟发起的大数据产品能力评测结果权威发布,阿里云实时计算 Flink版通过最新制定的分布式流处理平台基础能力评测,成为国内首批通过流计算产品能力评测的产品,并被数据中心联盟圈定为国内大数据流计算基础平台第一梯队。2020 年在国际知名咨询调研公司Forrester 的测评中,实时计算 Flink版成为中国唯一进入Forrester象限的实时流计算产品。
【独享月度特惠】开通实时计算产品:
master型号4核16GB+master数量1+slave型号4核16GB+slave数量2,计费周期1个月,详情:
https://common-buy.aliyun.com/?spm=a2c0j.14094430.1053885.bnt1.307976feKRl1Au&commodityCode=blinkonecs#/buy
Tips:开通成功算打卡成功
解决方案
实时计算 Flink:基于 Apache Flink 构建的大数据计算平台(附白皮书)
Tips:完成PDF阅读,算打卡成功
最佳实践
Tips:完成文章阅读,算打卡成功