2024FFA分论坛-生产实践1
FFA2024生产实践专场由Apache Flink核心贡献者与来自快手、eBay、阿里云、抖音集团、Uber、鹰角、移动云、京东、用友畅捷通、搜配云、度小满、天翼云等公司的一线技术专家带来,将聚焦于在生产中使用和部署Flink的痛点和经验以及最佳实践, 共同探讨如何在真实环境中更高效,安全,敏捷地落地实时数据处理框架。
2024FFA-分论坛-核心技术专场1
FFA2024核心技术专场由Apache Flink核心贡献者与来自阿里云智能、小红书、哔哩哔哩、Shopee、蚂蚁金服等公司的一线技术专家解析Flink技术动向与应用实践,重点探讨Flink的核心技术在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。
2024FFA主论坛
适逢Apache Flink诞生10周年,今年的FFA与广大开发者分享Flink过去十年在技术和生态方面的演进历程及关键成果。同时,基于当前AI时代的新场景,展望未来十年Flink的发展方向和规划。大会还将为您提供全面了解Flink2.0版本的机会,并与业界领袖共同探讨Apache Flink的过去、现在及未来,以及其在实际应用中的潜力。
Hologres TPC-H/点查性能开箱测试
V2.2版本开箱测试TPC-H,性能结果提升100%写入、更新、点查场景性能测试测试流程介绍,详解建表语句设计测试环境搭建及Demo演示讲师/嘉宾简介:丁烨 阿里云 Hologres PD
Havenask进阶系列第2节:分析器
视频内的参考材料: https://github.com/alibaba/havenask/tree/main/aios/plugins/havenask_plugins/analyzer_plugins Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask进阶系列课程第2课《分析器》,共讲解4部分内容。 分析器介绍 解释分析器主要配置 实战演示 总结 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云OpenSearch官网:https://www.aliyun.com/product/opensearch Havenask官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:
行业实践专场(一)
行业实践专场将由美的、芒果 TV、喜马拉雅、曹操出行、米哈游、腾讯、字节跳动、中原银行、上海汽车集团、中南电力、跨越速运、传音、传智教育等多行业实时计算领域专家详细解读 Flink 在不同企业和行业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授,帮助开发者更全面和深入地了解 Flink 技术如何在实际生产场景中落地。
流式湖仓专场(一)
流式湖仓专场邀请阿里云智能、联通、同程旅行、汽车之家、OPPO、网易、滴滴、镜舟科技、广联达、平安证券、快手等企业技术专家解读基于 Flink + Paimon 构建流式数据湖相关问题,更有基于 Paimon + StarRocks、Flink + Paimon + Hologres、Paimon + Spark 的流式湖仓最佳应用实践与分析。
【第7讲】是真的!Python可以创建Excel了,1行代码就能模拟真实数据,AI自动化办公还会远吗?
【第7讲】是真的!Python可以创建Excel了,1行代码就能模拟真实数据,AI自动化办公还会远吗?
FY24阿里云暑期夏令营“学生说”第三集
听一听参与夏令营的同学们怎么说,阿里云在这里期待迎接更多优秀的同学们!了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso
FY23阿里云暑期夏令营总回顾(下)
学生们在为期5天的夏令营中,通过探索阿里云文化、实践云上场景,了解前沿科技、感受科技魅力、探究数字经济发展趋势、快速提升创新实践能力。了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso
FY23阿里云暑期夏令营精彩瞬间(下)
来自全国不同高校的学生们相聚在阿里云园区,一声同学,一份关切,情意绵长,美好永在!了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso
基于 Kibana Discover 筛选数据,自由搜索航班信息
点此免费试用 ->本实验基于Kibana Discover 功能来搜索航班信息,例如航班号、航班状态、目的地天气等,并保存搜索和导出搜索结果为CSV报告。通过本实验,您将掌握Kibana Discover的使用方法,帮助您更加快速地筛选和搜索数据,从而提高工作效率。讲师简介刘晓国 - Elastic 首席布道师
Apache Paimon Meetup online:新一代流式数据湖平台开发动态及生产实践
Apache Paimon Meetup(第一期) 邀请到三位各大行业专家给大家带来主题分享。本次分享会介绍:Paimon 0.4 已经发布!本次 Meetup 会介绍 Paimon 0.4 的核心能力,用户场景,欢迎大家试用和反馈!字节在 Paimon 上提供了一个完整的 Streaming Warehouse 一致性视图,本次 Meetup 将会分享字节相关的实践和经验。来自同程的老师大规模落地了 Paimon,他将会介绍落地 Paimon 的生产实践。讲师/嘉宾简介阿里巴巴高级技术专家,Apache Flink PMC 李劲松(花名:之信)字节跳动基础架构工程师李明同程旅行大数据计算组负责人吴祥平
Flink Forward AI特征工程 “WX安全基于Flink实时特征开发平台实践”
Flink Forward AI特征工程 “微信安全基于Flink实时特征开发平台实践”李天旺腾讯专家级工程师
Flink Forward 实时湖仓“Flink + StarRocks:实时数据分析新范式”
Flink Forward 实时湖仓“Flink + StarRocks:实时数据分析新范式”谢寅 StartRocket 社区技术布道师
Flink Forward 平台建设“阿里实时计算Flink自动调优实践”
Flink Forward 平台建设“阿里实时计算Flink自动调优实践”钟旭阳 阿里实时计算Flink自动调休实践
Flink Forward 平台建设“阿里实时计算平台建设实践”
Flink Forward 平台建设“阿里实时计算平台建设实践”周凯波 阿里云高级技术专家
Flink Forward 行业案例“集度汽车Flink on native k8s 的应用与实践”
Flink Forward 行业案例“集度汽车Flink on native k8s 的应用与实践”顾云 集度汽车数据开发专家周磊 集度汽车数据部门实时方向负责人
Flink Forward 实时湖仓“美团买菜基于Flink的实时数据建设实践”
Flink Forward 实时湖仓“美团买菜基于Flink的实时数据建设实践”严书 美团买菜实时数仓技术负责人
Flink Forward Asia 实时风控专场 “Flink CEP 在抖音电商的业务实践”
Flink Forward Asia 实时风控专场 “Flink CEP 在抖音电商的业务实践”张健 字节跳动数据工程师
实时数仓workshop北京站"淘菜菜-基于Flink和Hologres的高可用实时数仓构架升级之路"
实时数仓workshop北京站"淘菜菜-基于Flink和Hologres的高可用实时数仓构架升级之路"汪宇阿里巴巴淘菜菜事业部数据技术专家
Flink Forward Asia 2022 流批一体 11.27上午
流批一体专场由来自快手、京东、数禾、Shopee、蚂蚁集团等企业的技术专家为你呈现流批一体的大规模应用实践案例,详细拆解落地难点和应对方案。另有来自阿里巴巴的技术专家手把手教你如何基于 Hive SQL on Flink 构建流批一体引擎。讲师/嘉宾简介祝海峰|阿里巴巴高级技术专家孙金城|字节跳动火山引擎LAS计算方向负责人,Apache Flink PMC,Apache IoTDB PMC,Apache Shenyu PMC,ASF Member罗宇侠|阿里云 开发工程师方盛凯|阿里云 开发工程师李明昆|Shopee 高级研发工程师,Flink Remote Shuffle Contributor
Flink Forward Asia 2022 生产实践 11.27
快手、美团、字节跳动、小米、运满满、蔚来汽车、中泰证券、中原银行、中信建投、中南电力设计院等多行业实时计算领域专家详细解读 Flink 在不同企业和行业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授。讲师/嘉宾简介张蛟|小米高级软件工程师,Apache Flink Contributor张芒|快手大数据架构工程师刘大龙|阿里云工程师刘畅|字节跳动基础架构工程师钟旭阳|阿里云开发工程师,Apache Flink Contributor
Flink Forward Asia 2022 AI 特征工程 11.27 下午
AI 特征工程专场将由来自腾讯、字节跳动、阿里巴巴的技术专家带来基于 Flink 的实时特征工程平台建设思路与落地实践。讲师/嘉宾简介林东|Apache Kafka Committer 和 PMC 成员李天旺|腾讯专家级工程师张颖莹|阿里云计算平台算法专家廖嘉逸|字节跳动推荐特征生产方向负责人刘首维|字节跳动推荐架构工程师
ApacheCon Asia 2022 阿帕奇亚洲大会流处理论坛 7/30
作为当今大数据领域的趋势,流式数据处理的潜在价值正在被不断发掘。如今,很多企业都渴望更及时地洞察自己的数据,曾经的“批处理”思维也正在迅速被流式处理所取代。越来越多的公司,无论大小,都在重新思考技术架构时把实时性作为第一考量,并开始用强大的开源引擎如 Apache Flink, Apache Spark, Apache Kafka, Apache Pulsar, Apache Storm 等构建自己的实时计算平台。 在本次 ApacheCon 上,Apache 软件基金会成员、阿里云 EMR 平台技术及 Flink 存储引擎团队负责人李钰将携手专家团带来“流处理”分论坛分享。在该分论坛中,您将了解到一线大厂把这些 Apache 项目应用到其生产环境中的实际经验,以及这些 Apache 项目生态的最新发展和流计算技术未来的发展方向。 讲师/嘉宾简介 徐榜江(雪尽)- 基于 Flink CDC 和 Hudi 高效地构建实时数据湖 盛宇帆 - 使用 Apache Pulsar 开发基于 Apache Flink 的流批一体化应用 毕岩(寻径) - 基于数据湖格式构建流式增量数仓——CDC 张雨霏 - 介绍用于 Pulsar 和 PulsarCatalog 的 Flink SQL 连接器 赵波 - 让 Flink 在 K8s 上运行的更好 付睿 - 以云原生的方式使用 Apache Pulsar 函数
阿里云云原生一体化数仓 — 湖仓一体新能力解读
介绍如何通过湖仓一体,打通 MaxCompute 与 Hadoop、DLF/OSS 数据湖,以及 Hologres、MySQL 等数据平台,并通过 DataWorks 做统一数据开发和治理。讲师/嘉宾简介孟硕 阿里云智能 产品专家
Flink CDC Meetup
活动介绍:为了促进 Flink CDC 技术的交流和发展,我们将于 5 月 21 日在线举办 Flink CDC Meetup。本次 Meetup 由阿里巴巴技术专家,Apache Flink PMC Member & Committer 伍翀 (云邪) 作为出品人,邀请了来自阿里巴巴、XTransfer、顺丰、OceanBase、大健云仓的大咖分享 Flink CDC 在各场景中的最佳实践、生产经验、技术原理等。嘉宾简介:伍翀(云邪)- 阿里巴巴技术专家,Apache Flink PMC Member & Committer徐榜江(雪尽)- 阿里巴巴高级开发工程师,Apache Flink Committer & Flink CDC Maintainer孙家宝 - XTransfer 资深 Java 开发工程师,Flink CDC Maintainer覃立辉 - 顺丰大数据研发工程师王赫(川粉)- OceanBase 技术专家龚中强 - 大健云仓基础架构部负责人
如何使用Delta Lake构建批流一体数据仓库【Databricks 数据洞察公开课】
从场景痛点、实践操作介绍如何使用Delta Lake同时处理批作业和流作业,快速搭建批流一体数据仓库。讲师/嘉宾简介讲师:佳亮,阿里云开源大数据平台技术工程师
阿里云 Elasticsearch 泛日志场景 Serverless 服务能力解读
阿里云Elasticsearch通过Serverless的方式,充分利用云端的服务化产品能力的优势,帮助企业在成本、日志容灾、冷热多级存储、横向扩展效率、并发性能及稳定性等痛点问题提供能力支持讲师/嘉宾简介赵弘扬 阿里云高级产品专家阿里云Elasticsearch产品团队负责人
年度回顾-阿里云Elasticsearch在泛日志场景的核心能力建设
随着国内传统企业的数字化转型,非结构化数据的规模和占比增长迅速,其中日志数据获取和加工能力也越来越受到关注。本次由阿里云Elasticsearch团队负责人,给大家聊一聊阿里云Elasticsearch围绕泛日志场景在产品和内核层面做了哪些努力,又为开发者社区提供了哪些回馈。讲师/嘉宾简介邓万禧 阿里巴巴资深技术专家阿里巴巴智能引擎事业部云服务,搜索与分析团队负责人
Flink Forward Asia 2021 行业实践 2
行业实践专场由字节跳动、网易、蔚来、中原银行、建信金融科技、中信建投等多行业实时计算领域专家详细解读 Flink 在业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授。讲师/嘉宾简介1.《Flink 在能源建设的实践》姚远 - 中南电力设计院工程师、注册测绘师2.《Apache Flink 在蔚来汽车的应用》吴江 - 蔚来汽车大数据部门数据开发,OLAP 平台 tech lead3.《Flink 在字节跳动数据流的实践》刘石伟 - 字节跳动数据平台数据流技术负责人4.《网易游戏基于 Flink 的支付环境全关联分析实践》林佳 - 网易互娱技术中心计费实时平台与 SDK 技术负责人,Apache Flink Contributor
Hologres系列课程(七)离线数仓加速之云原生加速OSS最佳实践
对象存储服务OSS是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。Hologres通过与OSS打通,支持通过创建外部表的方式,无需导入导出就能直接加速查询OSS的数据。本次主要介绍Hologres加速查询OSS原理,以及如何建外表加速查询OSS不同的文件格式(CSV、ORC等)讲师简介张露(雪胤),阿里巴巴技术专家,长期从事Hologres引擎开发工作
Hologres系列课程(二十)使用最佳实践总结
本次主要总结Hologres各项功能的使用最佳实践,了解Hologres的开发体系、优化体系和运维体系,助力快速搭建企业级一站式实时数仓讲师简介胡求,阿里巴巴开发工程师,从事于Hologres引擎开发工作
Hologres系列课程(一)30分钟学会快速使用Hologres
主要介绍如何快速使用Hologres,从开通实例到连接开发工具以及简单开发操作,能对Hologres的表结构、索引设计有初步认识,了解Hologres开发基本知识体系。讲师介绍余骏(清芬)阿里巴巴技术专家多年分布式系统经历对系统调优有丰富的经验
数据湖JindoFS+OSS 实操干货36讲 第四课(7/8讲)
【第7/8讲 直播主题】1、Flink 高效 sink 写入 OSS2、Flume 高效写入 OSS【背景】为了让更多开发者了解并使用 JindoFS,由阿里云 JindoFS+OSS 团队打造的专业公开课【数据湖 JindoFS+OSS 实操干货36讲】会在每周二16:00准时开讲!从五大板块入手,玩转数据湖!讲师介绍重湖 - 阿里巴巴计算平台事业部 EMR 高级工程师焱冰 - 阿里巴巴计算平台事业部 EMR 技术专家
阿里云EMR系列直播 - 精讲 Databricks数据洞察(介绍及案例分析)
Databricks数据洞察是企业级全托管的Spark高性能大数据分析平台,来自Apache Spark创始公司Databricks。引擎采用Databricks Runtime,性能与社区版相比,最高可达50倍提升,高效而稳定。本次直播将重点展开介绍该产品,并针对代表性案例进行分析。讲师介绍韩宗泽(棕泽),阿里云技术专家,计算平台事业部开放平台-生态企业团队负责人
第四节课:EMR 开通与演示
本节主要介绍开通EMR的环境准备、账号准备、付费情况、实操演示讲师:魏巍,花名念民,阿里巴巴 EMR 产品经理
第三节课:EMR 的存储解决方案
本节主要介绍EMR针对云上大数据的存储解决方案,如何为计算提供灵活高效的存储基础讲师:姚舜扬,花名辰山,阿里巴巴计算平台事业部 EMR 高级开发工程师,目前从事大数据存储方面的开发和优化工作
搜索与推荐技术场景化构建与核心价值
【开发者优惠来了】全网最低价,阿里云爆款服务器低至8.1元/月,更有针对学生的专享福利全面升级,戳:http://click.aliyun.com/m/1000188819/介绍搜索与推荐技术在业务中如何可持续的、高质量的交付价值,以及为什么选择阿里云的开放搜索与智能推荐技术服务讲师信息讲师:曾罗花名:是溪头衔:阿里巴巴集团产品专家
OpenSearch知名客户业务实践分享——企查查
企查查作为企业征信行业的搜索引擎,一直以来都与阿里云开放搜索团队有深度合作。本次朱总独家揭秘,开放搜索陪伴企查查从创业初期到成为企业征信行业的独角兽的过程中,是如何满足企查查产品海量数据的精准搜索需求的讲师介绍:朱正亮-企查查运维测试总监
EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework
EMR团队探索并开发了SparkSQL Native Codegen框架,为SparkSQL换了引擎,新引擎带来最高4倍性能提升,为EMR再次获取世界第一立下汗马功劳,本次直播将详细介绍Native Codegen框架。讲师简介:周克勇,花名一锤,阿里巴巴计算平台事业部EMR团队技术专家,大数据领域技术爱好者,对Spark有浓厚兴趣和一定的了解,目前主要专注于EMR产品中开源计算引擎的优化工作。参考文章:EMR Spark-SQL性能极致优化揭秘 Native Codegen Frameworkhttps://developer.aliyun.com/article/765156?spm=a2c6h.12873581.0.dArticle765156.5f6f47b4Mj7VpM&groupCode=aliyunemr
Spark on Zeppelin
Apache Zeppelin 是一个交互式的大数据开发Notebook,从一开始就是为Spark定制的。Zeppelin Notebook的开发环境与传统IDE开发环境相比有几大优势:不需要编译Jar,环境配置简单,交互式开发,数据结果可视化等等。本次直播将会介绍Spark on Zeppelin的一些基本使用方式以及应用场景。章剑锋(简锋),开源界老兵,Apache Member,曾就职于 Hortonworks,目前在阿里巴巴计算平台事业部任高级技术专家,并同时担任 Apache Tez、Livy 、Zeppelin 三个开源项目的 PMC ,以及 Apache Pig 的 Committer。
MaxCompute管家详解
本次直播为您介绍MaxCompute管家功能,本功能为用户提供作业信息查看、资源消耗查看(涵盖CU资源和存储资源)、项目查看及调整、配额组增删改查等涉及日常MaxCompute运维能力。讲师介绍婉鱼 阿里云智能 技术专家
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。