开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

Databricks数据洞察:从入门到实践

30788 570

作者: 灵杰开发者

状态:完结

状态:完结

发布时间:2022-07-15

章节数:10

8.8
(77人评分) 评价这本书
30788次
在线阅读
570次
下载

技术作品介绍

Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。

作者信息

灵杰开发者

来源圈子
邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号:Apache Spark技术交流社区 为 Spark 爱好者提供一个交流技术和传递资讯的平台,在这里你可以掌握大数据计算领域最前沿的资讯,可以与 Spark 技术大牛面对面交流,还有不定期社区福利领取哟~
+ 订阅

热门书评

相关技术作品

  • 数据湖技术解析

    9.6

    数据湖无疑是近几年大数据领域最火热的一个方向,那到底什么是数据湖?数据湖的架构和核心技术有哪些?企业应该如何构建、管理和使用数据湖?阿里云开源大数据团队结合在数据湖领域多年的深耕和实战经验,通过本书全方位介绍了从数据湖架构到核心技术到平台构建的内容。

    44090
    941
  • 阿里云实时计算Flink版解决方案白皮书-2021版

    9.9

    实时计算Flink版是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理平台。为了帮助读者快速掌握实时计算Flink版,阿里云Apache Flink 创始团队特此推出本书。本书详细介绍了实时计算Flink版的产品结构、产品功能及优势。并以结合场景案例的方式在金融、电商、广告等九大行业的应用上给出相应的解决方案供读者学习,帮助读者在实践中学习使用阿里云实时计算 Flink 版。

    6200
    1627
  • 超大规模机器学习在EMR的实践

    10.0

    from yq.aliyun.com

    142
    17
  • CarbonData:大数据交互式分析实践

    10.0

    from yq.aliyun.com

    125
    18

版权信息

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号:Apache Spark技术交流社区 为 Spark 爱好者提供一个交流技术和传递资讯的平台,在这里你可以掌握大数据计算领域最前沿的资讯,可以与 Spark 技术大牛面对面交流,还有不定期社区福利领取哟~
+ 订阅