领军行业大数据及AI实战
飞天大数据平台不仅是阿里经济体大数据生产的基石,更为各行业客户提供大数据整体解决方案和强劲算力。上一册介绍阿里巴巴内部大数据实战的电子书《阿里巴巴大数据及AI实战》推出后,受到了广大开发者的认可。本次带来不同行业下企业的大数据&AI案例和实战电子书《领军行业大数据及AI实战》,希望能给广大企业和开发者带来更多受益。
Streaming Lakehouse Meetup
Streaming Lakehouse Meetup · Online 。由阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家,Apache Flink PMC,Paimon PPMC 李劲松(花名:之信)作为出品人,联合业内大咖共同分享 Apache Paimon 在各场景中的最佳实践、生产经验、技术原理等。
大数据&AI实战派 第2期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
数字孪生核心技术揭秘
作者专注于数字孪生技术领域,长期担任阿里集团双十一GMV数据大屏、云栖大会指挥中心、城市大脑系列、智慧城市/交通/水利等相关数字孪生大型项目的架构师/PM;本书从一线实战角度出发,对数字孪生应用相关的核心技术如渲染引擎、三维模型资产、地理空间数据、BIM、三维城市智能生成等主题进行了较为深入探讨,比较了各类主流技术的特点与实现成本,为于数字孪生应用的技术选型提供参考价值。
数据湖技术解析
数据湖无疑是近几年大数据领域最火热的一个方向,那到底什么是数据湖?数据湖的架构和核心技术有哪些?企业应该如何构建、管理和使用数据湖?阿里云开源大数据团队结合在数据湖领域多年的深耕和实战经验,通过本书全方位介绍了从数据湖架构到核心技术到平台构建的内容。
阿里云云原生一体化数仓新能力解读
云原生一体化数仓是阿里云推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、 全链路数据治理四大核心能力。本书将分为离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解炙手可热的云数据产品最新演进趋势,为大数据开发者讲述一体化数仓的核心产品能力以及在业务中的应用。
Elastic(中国)产品应用实战
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为下册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书为读者详解了Elastic的功能实战和开发效能,呈现了行业中应用Elastic产品能力的实践案例,例如追踪最近的客户订单、获取数据视图等等,供开发者学习并加以实践。
Apache Flink 案例集(2022版)
希望通过本手册,可以让大家了解到大量来自不同领域的公司在数据集成、数据分析、人工智能、云原生以及企业数字化转型等应用场景中使用 Apache Flink 解决实际生产问题的成功案例,其中既包含传统和新兴的互联网公司,也包含通信、证券、银行等传统企业。希望这些生产实践案例和经验能够帮助大家更好的理解和使用 Apache Flink,加速更多企业的实时化平台搭建和业务转型。
Databricks数据洞察:从入门到实践
Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。
Flink CDC Meetup PPT - 覃立辉
2022.5.21 Flink CDC Meetup|覃立辉 - Flink CDC + Hudi 海量数据入湖在顺丰的实践
Flink CDC Meetup PPT - 徐榜江
2022.5.21 Flink CDC Meetup|徐榜江 - 基于 Flink CDC 实现海量数据的实时同步和转换
EMR StarRocks 白皮书
StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容,⾦融级⾼可⽤,兼容 MySQL 5.7 协议和 MySQL ⽣态,提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案,适⽤于对性能、实时性、并发能⼒和灵活性有较⾼ 要求的各类应⽤场景。
实时数仓Hologres技术实战一本通2.0版(上)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
Flink CDC:新一代数据集成框架
为了帮助读者能更全面地了解 Flink CDC,我们特地编撰了这本中文专刊。在这本专刊里你可以了解到:Flink CDC 的底层原理设计是什么样的?Flink CDC 如何保证数据读取的一致性?如何一步步快速上手 Flink CDC?以及 Flink CDC 在生产实践上的宝贵经验!
实时数仓“王炸组合”实时计算Flink版+Hologres
精品的内容促使训练营非常受大家的欢迎,为满足大家求知学习的劲头,我们现将《实时数仓入门训练营》的课程内容全部整理了出来!汇编成《实时数仓“王炸组合”-实时计算Flink版+Hologres》的合集电子书!供各位小伙伴学习参考,免费下载!
Apache Spark 中文实战攻略下册
Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略(下册)》让企业大数据平台性能更优。阿里、Databricks、领英、Intel都在用!Spark 企业级最佳实践中文解读全收纳!
FFA2024分论坛-流式湖仓
FFA 2024 流式湖仓专场由 Apache Flink 核心贡献者与来自淘天集团、抖音集团、vivo、小米、中原银行、阿里云智能、蚂蚁集团、贝壳找房、货拉拉等公司的一线技术专家解析流批一体、存算分离、湖仓融合的实时湖仓架构,探讨以 Apache Paimon 为流批一体湖存储的湖仓架构建设实践,如何帮助业务获得更实时的数据来驱动业务决策,并实现数据管理的降本增效。
FFA2024分论坛-生产实践
FFA 2024生产实践专场由 Apache Flink 核心贡献者与来自快手、eBay、阿里云、抖音集团、Uber、鹰角、移动云、京东、用友畅捷通、搜配云、度小满、天翼云等公司的一线技术专家带来,将聚焦于在生产中使用和部署Flink的痛点, 经验以及最佳实践, 共同探讨如何在真实环境中更高效, 安全, 敏捷地落地实时数据处理框架。
面向Web应用的三维建模实战
得益于游戏产业的发展,目前主流桌面端三维引擎如UE、Unity等三维模型的工作流非常成熟;但是Web端的三维模型开发却面临工作流混乱、规范缺失、人才匮乏等挑战,阻碍了三维模型Web应用的推广。Blender是支持WebGL引擎最好的DCC软件之一,结合pbr/gltf规范可以搭建完整的Web端三维模型工作流,为三维模型Web应用开发提供支撑。
基于 Flink SQL + Paimon 构建流式湖仓新方
《基于 Flink SQL + Paimon 构建流式湖仓新方》展示了如何构建新一代流式湖仓体系,以满足低延迟、高并发、强一致性的实时数据分析需求,为数据驱动的决策制定提供强有力的支持。
PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
Hologres 一站式实时数仓客户案例集
本案例集收录电商/教育/游戏等6个行业共计17家客户,通过Hologres分析服务一体化架构,替换各类OLAP分析引擎与KV数据库,实现海量半结构化/结构化数据的实时写入、实时更新、实时分析。
Elastic与阿里云合作宣传信息白皮书
阿里云是 Elastic 在中国最早开展合作的伙伴,长期的合作积淀了深厚的技术实践和丰富的业务经验,本白皮书介绍了自合作以来阿里云和Elastic的联合价值主张、产品功能与优势、客户案例等。
阿里云实时数仓Hologres技术揭秘2.0
由阿里巴巴多位技术专家精心打磨内容,通过详细的图文介绍,深度剖析实时数仓面临挑战与发展趋势,详细介绍Holologres的技术原理和核心技术优势,并融合多维分析、实时大屏、网络监控、实时数仓等多个热门场景的最佳实践,助力实现服务和分析一体化实时数仓。期望大家在阅读完本书后,能在技术成长的路上更进一步!
开源与云:Elasticsearch应用剖析
本书基于【Elasticsearch生态&技术峰会Online】阿里巴巴集团副总裁、Elastic创始人&CEO Shay Bannon等10位资深大咖演讲内容整理而成,对当下热门Elasticsearch技术领域与云生态下开源共生之路的探讨。10大章节,10位大咖,讲透4大技术场景,分享3大云服务应用场景!通过本书,大家能对Elasticsearch开源体系、云原生和数字化转型有更加深刻的了解。
开源大数据前瞻与应用实战
大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。作为一线技术骨干,每天沉在业务里,怎样才能快速和时代接轨,让自己不落伍?Flink社区重磅推出2021理论与实战精解系列电子书!《开源大数据前瞻与理论实战》收录了多位大数据领域行业开拓者对未来前沿趋势的洞察,揭秘Apache Flink及开源生态的前沿独家应用!
《阿里云实时数仓Hologres最佳实践合集》
Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。
《SaaS模式云数据仓库实践手册》
本书的制作目的在于让MaxCompute帮助企业构建全托管的现代化数仓,简化数据洞察、加速价值实现。
FFA2024分论坛-数据集成
FFA 2024数据集成专场由 Apache Flink 核心贡献者与来自阿里云智能、杭州银行、光大银行、货拉拉、数新智能、镜舟科技等公司的一线技术专家聚焦于实时技术在数据集成场景的价值与发展,讨论实时技术如何提升数据处理的全链路时效性,分析如何基于 Flink 设计实时数据集成框架,以及实时数据集成技术在不同业务领域的最佳实践。
FFA2024主论坛
适逢 Apache Flink 诞生 10 周年,今年的 FFA 主论坛将与广大开发者分享 Flink 过去十年在技术和生态方面的演进历程及关键成果。同时,基于当前 AI 时代的新场景,展望未来十年 Flink 的发展方向和规划。还将为您提供全面了解 Flink 2.0 版本的机会,并与业界领袖共同探讨 Apache Flink 的过去、现在及未来,以及其在实际应用中的潜力。
FFA2024分论坛-核心技术
FFA 2024 核心技术专场由 Apache Flink 核心贡献者与来自阿里云智能、小红书、哔哩哔哩、蚂蚁金服、Shopee等公司的一线技术专家解析 Flink 技术动向与应用实践,重点探讨 Flink 的核心技术(如状态管理、容错机制、数据传输、大规模调度和核心算法等)在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。
Paimon ✖️ StarRocks,共话实时湖仓架构
8月3日 Streaming Lakehouse Meetup · Online 邀请到了 Apache Paimon PMC ,阿里云,饿了么,喜马拉雅,同程旅行等众多业内大咖,为大家分享 Apache Paimon + StarRocks 在各场景中的最佳实践、生产经验和技术原理。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。