开源大数据平台 E-MapReduce的搜索结果_热门

寒沙牧

|

博文

|

来自：大数据与机器学习

E-MapReduce集群搭建HAWQ实践

HAWQ是一种基于HDFS的MPP(Massively Parallel Processing) SQL引擎，支持标准SQL/事务处理，性能比原生Hive快几百倍。本文介绍在E-MapReduce集群上面如何搭建HAWQ。

# 开源大数据平台 E-MapReduce # 资源调度 # 分布式计算 # Hadoop # 关系型数据库 # 网络安全

梅熙

|

博文

|

来自：大数据与机器学习

EMR集群上capacity scheduler的ACL实现

本文接着yarn capacity scheduler的实现原理，介绍了capacity scheduler的设置和其中需要注意的问题，并结合EMR集群做了实际操作实验。

# 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # Hadoop

寒沙牧

|

博文

|

来自：大数据与机器学习

SparkSQL自适应执行

阿里云EMR-3.13.0版本的SparkSQL支持自适应执行功能，用来解决Reduce个数的动态调整/数据倾斜/执行计划的动态优化问题。

# 开源大数据平台 E-MapReduce # SQL # 调度 # 分布式计算 # Spark

梅熙

|

博文

|

来自：大数据与机器学习

利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制

本文结合EMR集群，讲述了如何利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源quota限制与管控。

# 开源大数据平台 E-MapReduce # 分布式计算 # 资源调度 # 大数据 # Hadoop # 调度

eric-li

|

博文

|

来自：大数据与机器学习

Hive MetaStore同步方法

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # SQL # 关系型数据库 # MySQL # 数据库 # HIVE

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

玩转阿里云EMR三部曲-高级篇交互式查询及统一数据源

利用阿里云EMR生态定制化集群，实现数据仓库满足商业/运营的查询需求，并提供横向扩展提升性能的空间，结合多样服务达到数据交互查询及统一数据源下的最佳成本控制。

# 开源大数据平台 E-MapReduce # 域名与网站 # 云数据库 MongoDB 版 # 云数据库 RDS MySQL 版 # 对象存储 # SQL # 应用服务中间件 # 对象存储 # HIVE # nginx

封神

|

博文

|

来自：大数据与机器学习

E-Mapreduce如何处理RDS的数据

目前网站的一些业务数据存在了数据库中，这些数据往往需要做进一步的分析，如：需要跟一些日志数据关联分析，或者需要进行一些如机器学习的分析。在阿里云上，目前E-Mapreduce可以满足这类进一步分析的需求。

# 云数据库 RDS MySQL 版 # 数据集成 Data Integration # 对象存储 # 开源大数据平台 E-MapReduce # 分布式计算 # 关系型数据库 # MySQL # Hadoop # RDS

开源大数据EMR

|

博文

|

来自：大数据与机器学习

E-MapReduce 4.0产品新特性

E-MapReduce是运行在阿里云平台上的一大数据处理的系统解决方案。在2019年10月，阿里巴巴将发布EMR4.0版本。本篇介绍EMR4.0的新特性，包括在EMR基础能力，技术栈，生态集成和数据迁移等方面的升级，EMR4.0为用户提供更高的计算性能和更低的产品价格，将技术的红利让给用户。

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Apache Spark中国技术交流社区历次直播回顾（持续更新）

Apache Spark中国技术交流社区，由阿里巴巴开源大数据技术团队成立，持续输出spark相关技术直播、原创文章、精品翻译，钉钉群内千人交流学习，欢迎加入。钉钉入群 https://qr.dingtalk.com/action/joingroup?code=v1,k1,jmHATP9Tk+okK7QZ5sw2oWSNLhkt2lCRvfHRdW7XhUQ=&_dt_no_comment=1&origin=11 更多视频和ppt资料请入群获得。

# 开源大数据平台 E-MapReduce # 表格存储 # 容器服务Kubernetes版 # 实时计算 Flink版 # 云原生大数据计算服务 MaxCompute # 分布式计算 # Spark # 大数据 # Apache # 机器学习/深度学习 # 存储 # 流计算 # SQL # Hadoop # 人工智能

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

浅谈 Spark 的多语言支持

Spark架构和设计上的优秀毋庸置疑，从一出道便抢了 Hadoop 的 C 位。在开源大数据的黄金十年一时风头无两，在当下人工智能时代仍然能够与时俱进，通天之处不遑多言，美中不足之处也有不少。小的方面，比如调度模型跟 MapReduce 这种计算范式过于耦合，Spark 最近引入 Barrier 调度模式就是为了支持深度学习这种新的计算类型，所幸在于对框架的改动不会伤筋动骨；有些缺陷则不然，影响全局，调整起来绝非易事。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 机器学习/深度学习 # 分布式计算 # Java # 大数据 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce