EMR Spark Relational Cache的执行计划重写
背景
EMR Spark提供的Relational Cache功能,可以通过对数据模型进行预计算和高效地存储,加速Spark SQL,为客户实现利用Spark SQL对海量数据进行即时查询的目的。Relational Cache的工作原理类似物化视图,在用户提交SQL语句时对语句进行分析,并选出可用的预计算结果来加速查询。
HBase实操 | 使用Spark通过BulkLoad快速导入数据到HBase
HBase社区直播本期分享专家:明惠(网名:过往记忆)-阿里云数据架构师
视频地址:
https://yq.aliyun.com/live/590?spm=a2c4e.11155435.0.0.460177969kCLxf
PPT地址:
https://yq.aliyun.com/download/3033
PS:欢迎关注HBase+Spark团队号 https://yq.aliyun.com/teams/382 博客,问答,直播,各类HBase资料,线下meetup都会发布到这里。
Spark修炼之道(基础篇)——Linux大数据开发基础:第三节:用户和组
本节主要内容
理解用户和组的概念
用户管理
组管理
权限分配
1. 理解用户和组的概念
在第一讲中我们提到,linux是一种多任务、多用户的操作系统,在讲ls -l命令行我们看到如下文件详细信息:
root@ubuntu:/home/xtwy# ls -l
total 48
drwxr-xr-x 2 xtwy xtwy 4096 2015-08-20 23:31