暂无个人介绍
本文介绍 Celeborn 新发布的 0.3.0 版本的重要 Feature,包括但不限于:支持 Flink,支持 Native Spark(Gluten),快速优雅升级,支持 HDFS 等。
本次 CommunityOverCode Asia 2023(原 ApacheCon Asia)的流处理专题,将给大家带来 Apache 相关项目的最新资讯,现在就一起来看看吧!
字节跳动基础架构工程师李明,在 Apache Paimon Meetup 的分享。
本文将举例说明如何使用文本嵌入模型来生成文本内容的向量表示,并演示如何对生成的向量进行向量检索。我们将会在 Elasticsearch 上部署一个面向所有人群开放的模型,然后在采集管道中使用它来从文本文档生成嵌入。接下来,我们会展示如何在向量检索中使用这些嵌入来查找对于给定查询而言语义相似的文档。
知乎大数据架构负责人贾承昆,在 Flink Forward Asia 2022 平台建设专场的分享。
阿里巴巴开发工程师 Apache Flink Committer 任庆盛,阿里巴巴技术专家 Apache Flink Contributor 罗根,在 Flink Forward Asia 2022 核心技术专场的分享。
Tech Lead of Shopee Flink Runtime Team 范瑞,在 Flink Forward Asia 2022 核心技术的分享。
希望通过笔者以下的经历,回顾流计算一步一步扩大场景的过程,并引出 Apache Paimon 的前生今世。
腾讯专家级工程师李天旺,在 Flink Forward Asia 2022 AI 特征工程专场的分享。
货拉拉实时研发平台负责人王世涛,在Flink Forward Asia 2022 平台建设专场的分享。
Elasticsearch是一个基于Lucene的实时的分布式搜索和分析引擎,设计用于云计算中能够达到实时搜索,稳定,可靠,快速,并支持RESTFUL风格的url访问。全文检索、多语言检索以及基于地理位置信息检索在Elasticsearch上应用广泛,本场实验将分别介绍如何使用Elasticsearch8.5版本进行全文检索、多语言检索和地理位置查询三个Elasticsearch基础检索子场景的实现。
翼支付高级大数据工程师尹春光,在 Flink Forward Asia 2022 行业案例专场的分享。
数据研发高级工程师唐尚文,在 Flink Forward Asia 2022 数据集成专场的分享。
最新发布的 0.3.0 版本新增对 Flink 批作业 Shuffle 的支持,从此 Flink、Spark 可以同时使用统一的数据 Shuffle 服务,更大程度节省资源、降低运维成本。
XTransfer 技术专家, Flink CDC Maintainer 孙家宝,在 Flink Forward Asia 2022 数据集成专场的分享。
使用梯度提升树算法进行CTR预测
使用Swing算法实现商品推荐
中南电力设计院工程师、注册测绘师姚远,在 Flink Forward Asia 2022 行业案例专场的分享。
联通数科实时计算团队负责人、Apache StreamPark Committer 穆纯进在 Flink Forward Asia 2022 平台建设专场的分享
快手数据架构工程师张芒,阿里云工程师刘大龙,在 Flink Forward Asia 2022 生产实践专场的分享。
StarRocks 社区技术布道师谢寅,在 Flink Forward Asia 2022 实时湖仓的分享。
Streaming Lakehouse 首个 Meetup 来啦! 7 月 29 日 | 北京 | 线下,来一场 Streaming Lakehouse 实时数据湖的体验之旅!
加入升级版 Flink-Learning 实战营,动手体验真实有趣的实战场景。
Flink-Learning 训练营课前预习
使用 Prometheus 为 Flink 搭建可观测体系
本场景将以 阿里云实时计算Flink版为基础,使用 Flink 自带的 MySQL Connector 连接 RDS 云数据库实例、Elasticsearch Connector 连接 Elasticsearch 检索分析服务实例,并以一个淘宝母婴订单实时查询的例子尝试上手 Connector 的数据捕获、数据写入等功能。
Flink CDC 2.4 正式发布,新增 Vitess 数据源,PostgreSQL 和 SQL Server CDC 连接器支持增量快照,升级 Debezium 版本
想要了解如何使用 Flink 在 GitHub 中发现最热门的项目吗?本实验使用阿里云实时计算 Flink 版内置的 GitHub 公开事件数据集,通过 Flink SQL 实时探索分析 Github 公开数据集中隐藏的彩蛋!
在 6 月 18-23 日召开的 ACM SIGMOD 2023 峰会上,Apache Flink 荣获了本年度的系统奖(Systems Award)。
想要了解如何使用 Flink 实时统计最近 15 秒的商品销售额吗?本实验将以阿里云实时计算 Flink 版为基础,使用 Flink 自带的 MySQL Connector 连接 RDS 云数据库实例,并以实时商品销售数据统计的例子,引导开发者上手 Connector 的数据捕获、数据写入等功能。
阿里云检索分析服务Elasticsearch版携手阿里云开发者社区、Elastic公司,联合推出《10分钟玩转Elastcisearch》系列,第一期围绕Kibana展开超详细教程讲解,并以航班数据为例,邀请Elastic大牛手把手教大家如何四步快速创建航班数据分析仪表板,分钟内对航班状态、目的地天气、机票平均价格等关键信息做到了如指掌。
中原银行数据信息部杜威科,在 Flink Forward Asia 2022 行业案例专场的分享。
加入 Flink-Learning 实战营,动手体验真实有趣的实战场景。只需 2 小时,让您变身 Flink 实战派。实战营采取了 Flink 专家在线授课,专属社群答疑,小松鼠助教全程陪伴的学习模式。
加入 Flink-Learning 实战营,动手体验真实有趣的实战场景。只需 2 小时,让您变身 Flink 实战派。实战营采取了 Flink 专家在线授课,专属社群答疑,小松鼠助教全程陪伴的学习模式。
加入 Flink-Learning 实战营,动手体验真实有趣的实战场景。只需 2 小时,让您变身 Flink 实战派。实战营采取了 Flink 专家在线授课,专属社群答疑,小松鼠助教全程陪伴的学习模式。
加入 Flink-Learning 实战营,动手体验真实有趣的实战场景。
Shopee 研发专家李明昆在 Flink Forward Asia 2022 流批一体专场的分享。
美团买菜实时数仓技术负责人严书,在 Flink Forward Asia 2022 实时湖仓专场的分享。
阿里云实时计算 Flink 作为一款专业级别的高性能实时大数据处理系统,它在各种业务场景中都发挥了关键的作用。丰富而复杂的上下游系统让它能够支撑实时数仓、实时风控、实时机器学习等多样化的应用场景。然而,随着系统的复杂性增加,用户在日常使用中往往需要面临诸如复杂的数据开发报错分析、任务运行报错处理、任务运行调优等疑难问题。
通过本教程,您将学习如何创建、配置、共享仪表板,并与创建的仪表板进行数据交互。
通过本教程,您将通过简单的拖放操作,体验Elasticsearch Kibana Lens灵活的数据可视化功能,在仪表板中创建条形图、表格、圆环图和树状图等可视化视图。
深入解读 Apache Paimon 0.4.0 Meetup,6月15日|线上活动,敬请期待!
通过本教程,您将体验Kibana的Discover功能,包括筛选数据(查询栏下添加筛选或在查询栏中使用KQL语法筛选)、保存搜索和导出搜索结果为CSV报告。
快手技术专家刘建刚,在 Flink Forward Asia 2022 生产实践专场的分享。
本次分享围绕小米在实时数仓方面的探索与实践展开,主要涉及:Flink+Iceberg 实时数仓架构升级,稳定性与实时性优化;基于当前 Flink 实时数仓的不确定性问题,介绍 Merge into 功能和算子级状态清理的解决方案。
Flink-learning 学训平台和电商行业实践专栏来啦!
本文将从 Checkpoint 的性能优化历程出发,介绍 ChangelogStateBackend 的基本机制、应用场景和未来规划,同时介绍最新版本在 State 上的一些优化工作。
本文将基于测试结果详细分析 Hybrid Shuffle 的优势场景,并基于我们的经验给出一些使用建议。
Flink-learning 学训平台第 4 期课程——电商行业实践专栏上线啦!