Hive架构优点及使用场景
先阅读初识hive
Hive在大数据生态环境中的位置
Hive架构图
client 三种访问方式
1、CLI(hive shell)、command line interface(命令行接口)
2、JDBC/ODBC(ja.
阿里云 MaxCompute 2020-7 月刊
2020年7月,MaxCompute发布使用包年包月计算资源作业支持优先级功能等8项功能,并于8月5日重磅发布企业级安全新能力,解读SaaS模式云数据仓库MaxCompute数据的持续保护。
Spark SQL玩起来
标签(空格分隔): Spark
[toc]
前言
Spark SQL的介绍只包含官方文档的Getting Started、DataSource、Performance Tuning和Distributed SQL Engine部分。
分布式工作流任务调度系统Easy Scheduler正式开源
Easy Scheduler是一个分布式工作流任务调度系统,主要解决数据研发ETL错综复杂的依赖关系,而不能直观监控任务健康状态等问题。Easy Scheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。