全链路数据治理-全域数据集成
DataWorks全链路数据治理包含智能数据建模、全域数据集成、高效数据开发、主动数据治理、全面数据安全、快速分析服务六大产品能力,覆盖数据的全生命周期。本篇全域数据集成向开发者介绍通过DataWorks数据集成在多表多表、多表到单表、单表到单表等场景下,进行实时或离线同步的技术选型与核心能力,并以MaxCompute与Hologres引擎为例,演示云上数据同步操作步骤最佳实践。
PAI-ChatLearn 灵活易用大规模RLHF高训练框架
《PAI-ChatLearn 灵活易用大规模RLHF高训练框架》介绍了PAI-ChatLearn框架,且通过实际案例演示了PAI-ChatLearn的功能。
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)
Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一,十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水玩法,快来先睹为快吧。
实时数仓Workshop(北京站)- 乐洋
《实时数仓Workshop(北京站)》--阿里云实时计算Flink版产品介绍,2022-9 新版本发布能力介绍。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水区玩法。— 《“伏羲”神算》现在可以免费下载阅读啦,快来先睹为快吧。
大数据工程师必读手册
阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。
阿里云实时计算Flink版解决方案白皮书-2021版
实时计算Flink版是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理平台。为了帮助读者快速掌握实时计算Flink版,阿里云Apache Flink 创始团队特此推出本书。本书详细介绍了实时计算Flink版的产品结构、产品功能及优势。并以结合场景案例的方式在金融、电商、广告等九大行业的应用上给出相应的解决方案供读者学习,帮助读者在实践中学习使用阿里云实时计算 Flink 版。
UPN512技术架构白皮书
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
全链路数据治理-智能数据建模
DataWorks智能数据建模沉淀阿里巴巴数据中台建模方法论,以维度建模为基础,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让数据仓库的建设向规范化,可持续发展方向演进。 通过本书,你可以学习到: 1. 数据建模理论与规范 2. 菜鸟、大淘系数据建模实践 3. 工业、汽车行业数据建模实践 4. 零售电商数据建模实操案例
阿里云MaxCompute百问百答
为了更好地帮助广大MaxCompute用户解决可能遇到的问题,阿里云 MaxCompute团队基于MaxCompute开发者社区和其它渠道反馈的问题,总结归纳 出MaxCompute各个功能点的常见问题,希望可以给正在学习和使用MaxCompute 的用户提供一些帮助。
俞航翔|基于Log的通用增量Checkpoint
《俞航翔|基于Log的通用增量Checkpoint》本书介绍了Checkpoint性能优化之路,拥有更稳定的Checkpoint,更快速的Checkpoint,更小的端到端延迟,更少的数据回追。
阿里云 JindoFS+OSS 数据上云实战
为了帮助读者能更全面地了解 JindoFS,我们特地编撰了这本电子书。从架构到场景到实操,全方面解读jindoFS。
Elastic Stack 实战手册(早鸟版)
开源搜索引擎这十来年的发展,基本就是 Lucene 体系的发展。而基于 Lucene 的诸多搜索引擎中,Elasticsearch 以其极好的易用性、开箱即用的体验迅速折服了开发者。其边界也从最早的搜索引擎,扩展到了日志全观察、安全分析等场景,形成了今天的 Elastic Stack,具备从数据采集、处理、分析到展示的强大生态能力。
Apache Spark 中文实战攻略上册
《Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。 《Apache Spark 中文实战攻略(上册)》全新收录了Spark+AI Summit 2020 中文精华版峰会,Apache Spark 3.0性能优化与基础实战一书看遍!
零基础入门:从0到1学会 Apache Flink
大数据实时计算及 Apache Flink 年度Flink 年度学习资料大礼包,300+页实战应用精华总结!本书内容包含:1、零基础入门,30 天成长为 Flink 大神的经典教程。2、Apache Flink 核心贡献者及阿里巴巴技术专家的一线实战经验总结。3、收录来自 bilibili、美团点评、小米、OPPO、快手、Lyft、Netflix 等国内外一线大厂实时计算平台及实时数仓最佳实践案例
实时即未来
甄选 Apache Flink 及大数据领域顶级盛会 Flink Forward Asia 大会嘉宾精彩分享,覆盖国内外一线大厂实时平台构建的经验分享与实时数仓的应用实践,为你揭秘实时计算平台从无到有到有、持续优化的详细细节!《Apache Flink 年度最佳实践》首次一次性公布来自B站、美团点评、小米、快手、菜鸟、Lyft、Netflix 等精彩内容,9篇深度文章揭秘一线大厂实时平台构建实践。
UPN512技术架构白皮书(英文版)
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
13个专题6万字详解,Hologres一体化实时湖仓实践手册
Hologres 3.0 全新升级为一体化实时湖仓平台,通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+Al 一体,发布全新 Dynamic Table、External Database、分时弹性、Query Queue、NL2SQL 等能力,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率。
开启云上 AIGC 动手实践,探索技术创意
面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。
大数据&AI实战派 第1期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例。电子书第1期以《阿里云大数据知识图谱》为核心,通过阿里云大数据&AI产品能力介绍结合操作实践,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
Elastic Stack 实战手册
本书由数十位 Elasticsearch 技术圈的优秀开发者共创而成,得到了许多资深业界精英,社区技术大咖,Elastic Stack 相关书籍作者的支持,凝聚了众多创作人的实践经验和创作能力。 书籍涵盖了一位 Elastic Stack 开发者所需的必要知识,尤其对于刚入门的开发者,从上篇基础的 Elastic Stack 产品能力到下篇的应用实践,提供了系统性学习参考的上手指南。
实时数仓Hologres技术实战一本通2.0版(下)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
一站式大数据开发治理DataWorks使用宝典
零基础如何开发治理大数据?阿里专家告诉你!《一站式大数据开发治理DataWorks使用宝典》由9位阿里巴巴DataWorks产品专家领学精心打造,全面介绍了DataWorks十大功能模块,以动手实操的方式清晰使用方法及开发流程,帮助用户快速上手DataWorks核心功能。如果你有自定义数据治理方面的需求,学习DataWorks绝对是你的不二选择。此书也定能成为你学习之路的宝典,快来一起过关斩将吧!
Apache Flink-实时计算正当时
为了方便用户更快更好更高效的完成业务工作,阿里云开发者社区联合Apache Flink创始团队推出《Apache Flink-实时计算正当时》一书。本书将为开发者们在第一时间 get Apache Flink 1.13 版本新特色和功能提升;同时剖析知乎、腾讯、民生银行、B站等厂商提供 Flink 在多场景中的实战经验,让你轻松 Get 企业大数据服务能力!
中国开发者调查报告
为了了解Elasticsearch 中国开发者群体,结合1186位开发者的调研数据和18位社区专家的深度访谈,Elastic 技术社区、阿里巴巴 Elasticsearch 技术团队和阿里云开发者社区联合发布了《Elasticsearch 中国开发者调查报告》。免费下载,抢先一步读懂这个“族群”吧。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。