一次设计演进之旅 | 张逸
我们需要实现对存储在HDFS中的Parquet文件执行数据查询,并通过REST API暴露给前端以供调用。由于查询的结果可能数量较大,要求API接口能够提供分页查询。在第一阶段,需要支持的报表有5张,需要查询的数据表与字段存在一定差异,查询条件也有一定差异。
每个报表的查询都牵涉到多张...
Spark-Yarn架构介绍
1.简介
MapReduct框架从hadoop-0.23版本以后发生了重大的变革, 新的计算框架我们称为MapReudce 2.0 或者 YARN(Yet-Another-Resource-Negotiator)
这篇文章主要是简单的介绍YARN的架构, 因为后续我们都会使用YARN提交Spark程序
MapReduct 2.