开发者社区> 问答> 正文

Spark和Flink差异有哪些?

如题

展开
收起
云栖徒骇 2016-08-08 19:54:12 3645 0
1 条回答
写回答
取消 提交回答
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;

    screenshot
    经过10年的发展,通用计算引擎的区别如上图。
    spark与flink最大的区别就是计算模型,spark是RDD,flink是cycllc dataflows
    从支持实时的角度,flink延迟更低。机器学习角度,flink可以对迭代的结果做裁剪,shuffle量减少。

    其它的实现方面都是类似,codegen、cbo、off-heap、dataset api、shuffle虽然spark不支持push base,但支持也是可以的。

    另外:

    • 80%的业务场景用spark基本都可以搞定
    • spark的社区活跃度比flink强很多,生态更加丰富。

    两者都有超越现在,勇闯高峰的想法。

    2019-07-17 20:03:00
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载