备案控制台

健身不健身_个人页

健身不健身

文章

4

问答

0

视频

0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

文章
问答
视频

发表了文章 2022-04-14

Hive 数仓迁移 JindoFS/OSS 数据湖最佳实践

Hive 数仓是大多数迁移客户都会遇到的场景。在迁移过程中，不建议同时在新集群进行业务升级（比如从 Hive on MR 迁移到 Hive on Tez 或 Spark SQL等），这些业务升级可以在迁移完成后进行。1. 元数据同步Hive 元数据是对于 Hive 表来说非常关键，除了表结构信息，里面还记录着 Hive 表与底层文件系统的关联关系，许多上层服务都依赖 Hive 元数据提供服务。a.
发表了文章 2019-10-08

2019杭州云栖大会回顾之Spark Relational Cache实现亚秒级响应的交互式分析

本文来自2019杭州云栖大会大数据生态专场中的分享《Spark Relational Cache实现亚秒级响应的交互式分析》
发表了文章 2019-08-10

EMR Spark Relational Cache 利用数据预组织加速查询

在利用Relational Cache进行查询优化时，我们需要通过预计算，存储大量数据。而在查询时，我们真正需要读取的数据量也许并不大。为了能让查询实现秒级响应，这就涉及到优化从大量数据中快速定位所需数据的场景。
发表了文章 2019-06-15

EMR Spark Relational Cache的执行计划重写

背景 EMR Spark提供的Relational Cache功能，可以通过对数据模型进行预计算和高效地存储，加速Spark SQL，为客户实现利用Spark SQL对海量数据进行即时查询的目的。Relational Cache的工作原理类似物化视图，在用户提交SQL语句时对语句进行分析，并选出可用的预计算结果来加速查询。

暂无更多信息

发表了文章 2022-04-14

Hive 数仓迁移 JindoFS/OSS 数据湖最佳实践
发表了文章 2019-10-08

2019杭州云栖大会回顾之Spark Relational Cache实现亚秒级响应的交互式分析
发表了文章 2019-08-10

EMR Spark Relational Cache 利用数据预组织加速查询
发表了文章 2019-06-15

EMR Spark Relational Cache的执行计划重写

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息