全链路数据治理-智能数据建模
DataWorks智能数据建模沉淀阿里巴巴数据中台建模方法论,以维度建模为基础,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让数据仓库的建设向规范化,可持续发展方向演进。 通过本书,你可以学习到: 1. 数据建模理论与规范 2. 菜鸟、大淘系数据建模实践 3. 工业、汽车行业数据建模实践 4. 零售电商数据建模实操案例
全链路数据治理-全域数据集成
DataWorks全链路数据治理包含智能数据建模、全域数据集成、高效数据开发、主动数据治理、全面数据安全、快速分析服务六大产品能力,覆盖数据的全生命周期。本篇全域数据集成向开发者介绍通过DataWorks数据集成在多表多表、多表到单表、单表到单表等场景下,进行实时或离线同步的技术选型与核心能力,并以MaxCompute与Hologres引擎为例,演示云上数据同步操作步骤最佳实践。
Elastic Stack 实战手册(早鸟版)
开源搜索引擎这十来年的发展,基本就是 Lucene 体系的发展。而基于 Lucene 的诸多搜索引擎中,Elasticsearch 以其极好的易用性、开箱即用的体验迅速折服了开发者。其边界也从最早的搜索引擎,扩展到了日志全观察、安全分析等场景,形成了今天的 Elastic Stack,具备从数据采集、处理、分析到展示的强大生态能力。
Hologres 一站式实时数仓客户案例集
本案例集收录电商/教育/游戏等6个行业共计17家客户,通过Hologres分析服务一体化架构,替换各类OLAP分析引擎与KV数据库,实现海量半结构化/结构化数据的实时写入、实时更新、实时分析。
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)
Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。
PAI-ChatLearn 灵活易用大规模RLHF高训练框架
《PAI-ChatLearn 灵活易用大规模RLHF高训练框架》介绍了PAI-ChatLearn框架,且通过实际案例演示了PAI-ChatLearn的功能。
阿里云 JindoFS+OSS 数据上云实战
为了帮助读者能更全面地了解 JindoFS,我们特地编撰了这本电子书。从架构到场景到实操,全方面解读jindoFS。
Elastic Stack 实战手册
本书由数十位 Elasticsearch 技术圈的优秀开发者共创而成,得到了许多资深业界精英,社区技术大咖,Elastic Stack 相关书籍作者的支持,凝聚了众多创作人的实践经验和创作能力。 书籍涵盖了一位 Elastic Stack 开发者所需的必要知识,尤其对于刚入门的开发者,从上篇基础的 Elastic Stack 产品能力到下篇的应用实践,提供了系统性学习参考的上手指南。
基于 Flink SQL + Paimon 构建流式湖仓新方
《基于 Flink SQL + Paimon 构建流式湖仓新方》展示了如何构建新一代流式湖仓体系,以满足低延迟、高并发、强一致性的实时数据分析需求,为数据驱动的决策制定提供强有力的支持。
Databricks数据洞察:从入门到实践
Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。
EMR StarRocks 白皮书
StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容,⾦融级⾼可⽤,兼容 MySQL 5.7 协议和 MySQL ⽣态,提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案,适⽤于对性能、实时性、并发能⼒和灵活性有较⾼ 要求的各类应⽤场景。
Apache Flink 十大技术难点实战
《Apache Flink 十大技术难点实战》由 Apache Flink 核心贡献者及一线大厂生产环境使用者总结分享,内容全面丰富,涵盖原理解析、应用实践、demo演示、Flink 1.10 生态等总结生产环境十大常见难点。10篇技术实战文章帮你完成故障识别、问题定位、性能优化等全链路过程,实现从基础概念的准确理解到上手实操的精准熟练,从容应对生产环境中的技术难题!
13个专题6万字详解,Hologres一体化实时湖仓实践手册
Hologres 3.0 全新升级为一体化实时湖仓平台,通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+Al 一体,发布全新 Dynamic Table、External Database、分时弹性、Query Queue、NL2SQL 等能力,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率。
阿里云MaxCompute百问百答
为了更好地帮助广大MaxCompute用户解决可能遇到的问题,阿里云 MaxCompute团队基于MaxCompute开发者社区和其它渠道反馈的问题,总结归纳 出MaxCompute各个功能点的常见问题,希望可以给正在学习和使用MaxCompute 的用户提供一些帮助。
《阿里云实时数仓Hologres最佳实践合集》
Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。
UPN512技术架构白皮书
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
MaxCompute半结构化数据思考与创新
《MaxCompute半结构化数据思考与创新》介绍了半结构化数据模型简析,与传统方案优劣对,MaxCompute思考与实践,以及收益分析。
阿里云云原生一体化数仓新能力解读
云原生一体化数仓是阿里云推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、 全链路数据治理四大核心能力。本书将分为离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解炙手可热的云数据产品最新演进趋势,为大数据开发者讲述一体化数仓的核心产品能力以及在业务中的应用。
Apache Flink-实时计算正当时
为了方便用户更快更好更高效的完成业务工作,阿里云开发者社区联合Apache Flink创始团队推出《Apache Flink-实时计算正当时》一书。本书将为开发者们在第一时间 get Apache Flink 1.13 版本新特色和功能提升;同时剖析知乎、腾讯、民生银行、B站等厂商提供 Flink 在多场景中的实战经验,让你轻松 Get 企业大数据服务能力!
FFA2024分论坛-流批一体
FFA 2024 流批一体专场由 Apache Flink 核心贡献者与来自阿里云智能、小米、快手、美团、腾讯及抖音集团公司的一线技术专家聚焦于流批一体的最新进展与实践,涵盖从理论探索到实际应用的全方位内容。围绕构建高效、统一的流批处理架构展开深入探讨。
Apache Flink 案例集(2022版)
希望通过本手册,可以让大家了解到大量来自不同领域的公司在数据集成、数据分析、人工智能、云原生以及企业数字化转型等应用场景中使用 Apache Flink 解决实际生产问题的成功案例,其中既包含传统和新兴的互联网公司,也包含通信、证券、银行等传统企业。希望这些生产实践案例和经验能够帮助大家更好的理解和使用 Apache Flink,加速更多企业的实时化平台搭建和业务转型。
阿里云实时数仓Hologres技术揭秘2.0
由阿里巴巴多位技术专家精心打磨内容,通过详细的图文介绍,深度剖析实时数仓面临挑战与发展趋势,详细介绍Holologres的技术原理和核心技术优势,并融合多维分析、实时大屏、网络监控、实时数仓等多个热门场景的最佳实践,助力实现服务和分析一体化实时数仓。期望大家在阅读完本书后,能在技术成长的路上更进一步!
Elastic(中国)基础开发宝典
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为上册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书不仅向读者介绍了Elastic的基础开发技能,还解答了日常工作中的常见问题,例如Elasticsearch 内存管理和故障排除等。通过阅读本书,开发者可以从中获取必要的基础技能和理论知识。
领军行业大数据及AI实战
飞天大数据平台不仅是阿里经济体大数据生产的基石,更为各行业客户提供大数据整体解决方案和强劲算力。上一册介绍阿里巴巴内部大数据实战的电子书《阿里巴巴大数据及AI实战》推出后,受到了广大开发者的认可。本次带来不同行业下企业的大数据&AI案例和实战电子书《领军行业大数据及AI实战》,希望能给广大企业和开发者带来更多受益。
Flink CDC:新一代数据集成框架
为了帮助读者能更全面地了解 Flink CDC,我们特地编撰了这本中文专刊。在这本专刊里你可以了解到:Flink CDC 的底层原理设计是什么样的?Flink CDC 如何保证数据读取的一致性?如何一步步快速上手 Flink CDC?以及 Flink CDC 在生产实践上的宝贵经验!
SaaS模式云原生数据仓库应用场景实践
MaxCompute 是阿里云推出的一款简单、易用、全托管的面向分析的企业级 Saas 模式云数据仓库,能够匹配业务发展进行灵活弹性扩展,面向云上开发者, MaxCompute 支持机器学习、数据湖、传统数仓、近实时数仓等多种业务分析场景,并 提供更开放的开发生态。
阿里云实时计算Flink版解决方案白皮书-2021版
实时计算Flink版是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理平台。为了帮助读者快速掌握实时计算Flink版,阿里云Apache Flink 创始团队特此推出本书。本书详细介绍了实时计算Flink版的产品结构、产品功能及优势。并以结合场景案例的方式在金融、电商、广告等九大行业的应用上给出相应的解决方案供读者学习,帮助读者在实践中学习使用阿里云实时计算 Flink 版。
一站式大数据开发治理DataWorks使用宝典
零基础如何开发治理大数据?阿里专家告诉你!《一站式大数据开发治理DataWorks使用宝典》由9位阿里巴巴DataWorks产品专家领学精心打造,全面介绍了DataWorks十大功能模块,以动手实操的方式清晰使用方法及开发流程,帮助用户快速上手DataWorks核心功能。如果你有自定义数据治理方面的需求,学习DataWorks绝对是你的不二选择。此书也定能成为你学习之路的宝典,快来一起过关斩将吧!
零基础入门:从0到1学会 Apache Flink
大数据实时计算及 Apache Flink 年度Flink 年度学习资料大礼包,300+页实战应用精华总结!本书内容包含:1、零基础入门,30 天成长为 Flink 大神的经典教程。2、Apache Flink 核心贡献者及阿里巴巴技术专家的一线实战经验总结。3、收录来自 bilibili、美团点评、小米、OPPO、快手、Lyft、Netflix 等国内外一线大厂实时计算平台及实时数仓最佳实践案例
2022年开源大数据热力报告
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
中国开发者调查报告
为了了解Elasticsearch 中国开发者群体,结合1186位开发者的调研数据和18位社区专家的深度访谈,Elastic 技术社区、阿里巴巴 Elasticsearch 技术团队和阿里云开发者社区联合发布了《Elasticsearch 中国开发者调查报告》。免费下载,抢先一步读懂这个“族群”吧。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。