Streaming Lakehouse Meetup
Streaming Lakehouse Meetup · Online 。由阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家,Apache Flink PMC,Paimon PPMC 李劲松(花名:之信)作为出品人,联合业内大咖共同分享 Apache Paimon 在各场景中的最佳实践、生产经验、技术原理等。
大数据&AI实战派 第2期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
全链路数据治理-主动数据治理
2万字揭秘阿里巴巴数据治理平台建设实践。阿里巴巴一直将数据作为自己核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续优酷、高德、菜鸟等板块,面对各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从7个方面为大家揭秘数据治理平台建设实践。
数字孪生核心技术揭秘
作者专注于数字孪生技术领域,长期担任阿里集团双十一GMV数据大屏、云栖大会指挥中心、城市大脑系列、智慧城市/交通/水利等相关数字孪生大型项目的架构师/PM;本书从一线实战角度出发,对数字孪生应用相关的核心技术如渲染引擎、三维模型资产、地理空间数据、BIM、三维城市智能生成等主题进行了较为深入探讨,比较了各类主流技术的特点与实现成本,为于数字孪生应用的技术选型提供参考价值。
Elastic(中国)基础开发宝典
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为上册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书不仅向读者介绍了Elastic的基础开发技能,还解答了日常工作中的常见问题,例如Elasticsearch 内存管理和故障排除等。通过阅读本书,开发者可以从中获取必要的基础技能和理论知识。
中国云原生数据湖应用洞察 白皮书
近年来,在数字经济的背景下,互联网行业及传统企业加速云化转型,中国整体云服务市场的规模逐年扩增,云成为新一代IT基础设施已经成为不争的事实。其中,企业云化转型的深入以及用云思维的转变,驱动了PaaS市场份额的增长,基于云的能力创新已成为基础云发展新的增长引擎。云特有的“池化、弹性、成本、敏捷”等优势让数据层与应用层的很多设想得以实现,拥抱云原生成为数据湖乃至大数据的必然选择。
实时数仓Hologres技术实战一本通2.0版(上)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
实时数仓“王炸组合”实时计算Flink版+Hologres
精品的内容促使训练营非常受大家的欢迎,为满足大家求知学习的劲头,我们现将《实时数仓入门训练营》的课程内容全部整理了出来!汇编成《实时数仓“王炸组合”-实时计算Flink版+Hologres》的合集电子书!供各位小伙伴学习参考,免费下载!
《阿里云实时数仓Hologres最佳实践合集》
Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。
Apache Spark 中文实战攻略下册
Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略(下册)》让企业大数据平台性能更优。阿里、Databricks、领英、Intel都在用!Spark 企业级最佳实践中文解读全收纳!
FFA2024分论坛-行业解决方案
FFA2024行业解决方案专场由 Apache Flink 核心贡献者与来自中国联通、阿里云、腾讯、中国电信、微财、谙流科技、平凯星辰、飞轮科技等公司的一线技术专家带来分享,探讨Apache Flink在关键行业场景中落地的实时数据驱动决策和分析的方案,通过这些案例,一起解析技术挑战,分享业务成果,促进实时数据处理技术的创新与发展。
Paimon ✖️ StarRocks,共话实时湖仓架构
8月3日 Streaming Lakehouse Meetup · Online 邀请到了 Apache Paimon PMC ,阿里云,饿了么,喜马拉雅,同程旅行等众多业内大咖,为大家分享 Apache Paimon + StarRocks 在各场景中的最佳实践、生产经验和技术原理。
基于 Flink SQL + Paimon 构建流式湖仓新方
《基于 Flink SQL + Paimon 构建流式湖仓新方》展示了如何构建新一代流式湖仓体系,以满足低延迟、高并发、强一致性的实时数据分析需求,为数据驱动的决策制定提供强有力的支持。
PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
Elastic与阿里云合作宣传信息白皮书
阿里云是 Elastic 在中国最早开展合作的伙伴,长期的合作积淀了深厚的技术实践和丰富的业务经验,本白皮书介绍了自合作以来阿里云和Elastic的联合价值主张、产品功能与优势、客户案例等。
2022年开源大数据热力报告
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
俞航翔|基于Log的通用增量Checkpoint
《俞航翔|基于Log的通用增量Checkpoint》本书介绍了Checkpoint性能优化之路,拥有更稳定的Checkpoint,更快速的Checkpoint,更小的端到端延迟,更少的数据回追。
大数据&AI实战派 第1期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例。电子书第1期以《阿里云大数据知识图谱》为核心,通过阿里云大数据&AI产品能力介绍结合操作实践,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
Flink CDC Meetup PPT - 王赫
2022.5.21 Flink CDC Meetup|王赫 - Flink CDC + OceanBase 全增量一体化数据集成方案
SaaS模式云原生数据仓库应用场景实践
MaxCompute 是阿里云推出的一款简单、易用、全托管的面向分析的企业级 Saas 模式云数据仓库,能够匹配业务发展进行灵活弹性扩展,面向云上开发者, MaxCompute 支持机器学习、数据湖、传统数仓、近实时数仓等多种业务分析场景,并 提供更开放的开发生态。
Apache Flink-实时计算正当时
为了方便用户更快更好更高效的完成业务工作,阿里云开发者社区联合Apache Flink创始团队推出《Apache Flink-实时计算正当时》一书。本书将为开发者们在第一时间 get Apache Flink 1.13 版本新特色和功能提升;同时剖析知乎、腾讯、民生银行、B站等厂商提供 Flink 在多场景中的实战经验,让你轻松 Get 企业大数据服务能力!
《SaaS模式云数据仓库实践手册》
本书的制作目的在于让MaxCompute帮助企业构建全托管的现代化数仓,简化数据洞察、加速价值实现。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水区玩法。— 《“伏羲”神算》现在可以免费下载阅读啦,快来先睹为快吧。
阿里巴巴大数据及AI实战
深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。
实时即未来
甄选 Apache Flink 及大数据领域顶级盛会 Flink Forward Asia 大会嘉宾精彩分享,覆盖国内外一线大厂实时平台构建的经验分享与实时数仓的应用实践,为你揭秘实时计算平台从无到有到有、持续优化的详细细节!《Apache Flink 年度最佳实践》首次一次性公布来自B站、美团点评、小米、快手、菜鸟、Lyft、Netflix 等精彩内容,9篇深度文章揭秘一线大厂实时平台构建实践。
UPN512技术架构白皮书(英文版)
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
FFA2024分论坛-流批一体
FFA 2024 流批一体专场由 Apache Flink 核心贡献者与来自阿里云智能、小米、快手、美团、腾讯及抖音集团公司的一线技术专家聚焦于流批一体的最新进展与实践,涵盖从理论探索到实际应用的全方位内容。围绕构建高效、统一的流批处理架构展开深入探讨。
FFA2024分论坛-Data+AI
FFA2024Data+AI专场由 Apache Flink 核心贡献者与来自哔哩哔哩、抖音集团、Elastic、京东、硕橙科技等公司的一线技术专家带来,聚焦实时大数据处理与人工智能的前沿融合,共同探讨如何利用Flink助力AI大模型技术的实时化升级,议题涵盖但不限于特征工程、训练、推理、大模型架构优化、以及实时AI大模型在各行业领域的创新应用。
FFA2024分论坛-生产实践
FFA 2024生产实践专场由 Apache Flink 核心贡献者与来自快手、eBay、阿里云、抖音集团、Uber、鹰角、移动云、京东、用友畅捷通、搜配云、度小满、天翼云等公司的一线技术专家带来,将聚焦于在生产中使用和部署Flink的痛点, 经验以及最佳实践, 共同探讨如何在真实环境中更高效, 安全, 敏捷地落地实时数据处理框架。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。