MaxCompute半结构化数据思考与创新
《MaxCompute半结构化数据思考与创新》介绍了半结构化数据模型简析,与传统方案优劣对,MaxCompute思考与实践,以及收益分析。
全链路数据治理-主动数据治理
2万字揭秘阿里巴巴数据治理平台建设实践。阿里巴巴一直将数据作为自己核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续优酷、高德、菜鸟等板块,面对各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从7个方面为大家揭秘数据治理平台建设实践。
Flink CDC Meetup PPT - 王赫
2022.5.21 Flink CDC Meetup|王赫 - Flink CDC + OceanBase 全增量一体化数据集成方案
中国云原生数据湖应用洞察 白皮书
近年来,在数字经济的背景下,互联网行业及传统企业加速云化转型,中国整体云服务市场的规模逐年扩增,云成为新一代IT基础设施已经成为不争的事实。其中,企业云化转型的深入以及用云思维的转变,驱动了PaaS市场份额的增长,基于云的能力创新已成为基础云发展新的增长引擎。云特有的“池化、弹性、成本、敏捷”等优势让数据层与应用层的很多设想得以实现,拥抱云原生成为数据湖乃至大数据的必然选择。
SaaS模式云原生数据仓库应用场景实践
MaxCompute 是阿里云推出的一款简单、易用、全托管的面向分析的企业级 Saas 模式云数据仓库,能够匹配业务发展进行灵活弹性扩展,面向云上开发者, MaxCompute 支持机器学习、数据湖、传统数仓、近实时数仓等多种业务分析场景,并 提供更开放的开发生态。
Apache Flink 必知必会
“实时计算”不再只是未来趋势,它已经融入到企业生产的各个环节之中。一线开发同学如何掌握大数据极致算力应用,企业如何全面提升数据服务能力? 本书不仅有PMC 及 Committer 坐阵,全方位解析 Flink 底层架构、核心功能模块、社区生态等,知其然更知其所以然,还能带你手把手实操演示,轻松掌握 Flink 应用场景与功能实现的生产开发技能!零基础上手实战,7天轻松学会 Flink~
《实时数仓技术入门一本通》
云原生Hologres作为HSAP服务与分析一体化理念的最佳实践,到底有哪些核心技术优势?Hologres实时数仓原理是什么?又有哪些常见的写入场景?针对传统数据库痛点, Hologres 落地具体业务场景的最佳实践又是什么样的呢?这些问题都可以在本书找到答案!本书通过详细的图文介绍,指导读者搞定融合实时数仓&报表、数据仓库、传统OLAP迁移等10+个实战场景,助力实现服务和分析一体化实时数仓。
Apache Flink 十大技术难点实战
《Apache Flink 十大技术难点实战》由 Apache Flink 核心贡献者及一线大厂生产环境使用者总结分享,内容全面丰富,涵盖原理解析、应用实践、demo演示、Flink 1.10 生态等总结生产环境十大常见难点。10篇技术实战文章帮你完成故障识别、问题定位、性能优化等全链路过程,实现从基础概念的准确理解到上手实操的精准熟练,从容应对生产环境中的技术难题!
FFA2024分论坛-行业解决方案
FFA2024行业解决方案专场由 Apache Flink 核心贡献者与来自中国联通、阿里云、腾讯、中国电信、微财、谙流科技、平凯星辰、飞轮科技等公司的一线技术专家带来分享,探讨Apache Flink在关键行业场景中落地的实时数据驱动决策和分析的方案,通过这些案例,一起解析技术挑战,分享业务成果,促进实时数据处理技术的创新与发展。
FFA2024分论坛-流批一体
FFA 2024 流批一体专场由 Apache Flink 核心贡献者与来自阿里云智能、小米、快手、美团、腾讯及抖音集团公司的一线技术专家聚焦于流批一体的最新进展与实践,涵盖从理论探索到实际应用的全方位内容。围绕构建高效、统一的流批处理架构展开深入探讨。
FFA2024分论坛-云原生
FFA2024云原生专场由 Apache Flink 核心贡献者与来自阿里云、网易游戏、小红书、美团、哔哩哔哩等公司的一线技术专家带来,聚焦Flink与云原生技术的结合,探讨如何在云原生环境中高效部署和深度优化Flink流批任务。通过实战经验分享,帮助开发者利用容器化、K8s、Serverless等工具,在稳定、性能、成本之间取得平衡。
FFA2024分论坛-Data+AI
FFA2024Data+AI专场由 Apache Flink 核心贡献者与来自哔哩哔哩、抖音集团、Elastic、京东、硕橙科技等公司的一线技术专家带来,聚焦实时大数据处理与人工智能的前沿融合,共同探讨如何利用Flink助力AI大模型技术的实时化升级,议题涵盖但不限于特征工程、训练、推理、大模型架构优化、以及实时AI大模型在各行业领域的创新应用。
中国零售行业数智化成熟度白皮书
基于零售企业数智化成熟度模型,瓴羊联动IDC对300+企业进行数智化调研,深入了解企业目前的数据管理状况,将核心结论集结成册,形成中国零售行业数智化成熟度白皮书 《以数智化引擎促增长,探索零售发展新机遇》。 企业数智化成熟度测评:https://home.lydaas.com/model
2022年开源大数据热力报告
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
Elastic(中国)基础开发宝典
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为上册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书不仅向读者介绍了Elastic的基础开发技能,还解答了日常工作中的常见问题,例如Elasticsearch 内存管理和故障排除等。通过阅读本书,开发者可以从中获取必要的基础技能和理论知识。
Flink CDC Meetup PPT - 龚中强
2022.5.21 Flink CDC Meetup|龚中强 - Flink CDC 在大健云仓的实践
Flink CDC Meetup PPT - 孙家宝
2022.5.21 Flink CDC Meetup|孙家宝 - Flink CDC MongoDB Connector 的实现原理和使用实践
《“后红海”时代,独家揭秘当下大数据体系》
《“后红海”时代,独家揭秘当下大数据体系》从系统架构的角度,就大数据架构热点,每条技术线的发展脉络,以及技术趋势和未解问题等方面做一概述。特别的,大数据领域仍然处于发展期,部分技术收敛,但新方向和新领域层出不穷。本文内容和作者个人经历相关,是个人的视角,难免有缺失或者偏颇,同时限于篇幅,也很难全面。仅作抛砖引玉,希望和同业共同探讨。
《实时计算 Flink 版独家实战秘籍》
从结绳记事到量子计算,从飞鸽传书到万物互联,人类文明奔流不息,数字技术变革不止。如今,IT上云与业务互联网化已成必然态势。作为一线开发者,置身于数字化技术变革浪潮之中,如何保持自身核心竞争力,实现技术的积累、进阶与升级?实时计算 Flink 版独家实战秘籍,由阿里巴巴实时计算核心研发团队出品,技术大佬手把手教学,从基础场景解析到进阶任务迁移、demo实操等,9天帮您轻松Get企业级实时计算能力!
阿里巴巴大数据及AI实战
深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。
阿里云开源大数据Workshop·杭州站
阿里云开源大数据Workshop·杭州站,旨在和开发者朋友们一起了解流式湖仓、湖仓一体架构的最近演进方向和企业云上湖仓实践案例。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。