备案控制台

分布式计算

# 分布式计算 #

3 关注

37824内容

最新热门文章问答视频电子书课程

大数据史记

|

博文

用Spark分析Amazon的8000万商品评价（内含数据集、代码、论文）

尽管数据科学家经常通过分布式云计算来处理数据，但是即使在一般的笔记本电脑上，只要给出足够的内存，Spark也可以工作正常（在这篇文章中，我使用2016年MacBook Pro / 16GB内存，分配给Spark 8GB内存）。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 数据可视化 # 大数据 # Spark # Python

最佳实践小文

|

博文

EMR弹性低成本离线大数据分析

布式计算框架系统分别为Hadoop、Spark和Storm, Hadoop可以运用在很多商业应用系统，可以轻松集成结构化、半结构化以及非结构化数据集，Spark采用了内存计算，允许数据载入内存作反复查询，融合数据仓库、流处理和图形计算等多种计算范式，Spark能够与Hadoop 很好地结合，Storm用于处理高速、大型数据流的分布式实时计算系用，为Hadoop添加可靠的实时数据处理能力。

# 弹性计算 # 分布式计算 # 监控 # Hadoop # 数据挖掘 # 数据处理 # 对象存储 # Spark # 流计算

晋恒

|

博文

|

来自：大数据与机器学习

吴刚专访--大数据和 MaxCompute 技术和故事

2019大数据技术公开课第一季《技术人生专访》来袭，本季将带领开发者们探讨大数据技术，分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访，将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # MaxCompute # 存储 # Apache # 大数据

场景研读

|

博文

|

来自：大数据与机器学习

Python+大数据计算平台，PyODPS架构手把手教你搭建

在2016年10月的云栖社区在线培训上，来自阿里云大数据事业部的秦续业分享了《双剑合壁——Python和大数据计算平台的结合实战》。他主要介绍了数据分析和机器学习的方法、DataFrame整体架构以及基础API、前端、后端、机器学习的具体实现方法。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # MaxCompute # Python

技术小能手

|

博文

大数据学习~Hadoop初识三Yarn模式

我们都知道在如今的Hadoop中主要有三个重要的执行管理器。一个HDFS,一个MapReduce,还有就是我们今天要看的 YARN。 2.0以前的Hadoop 在2.0以前的hadoop中是没有Yarn这个模式管理的。

# 云原生大数据计算服务 MaxCompute # 资源调度 # 分布式计算 # Hadoop # 容器 # 调度 # Spark # Hbase # 分布式数据库 # 程序员 # 监控

隐林

|

博文

|

来自：大数据与机器学习

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

“用户每天产生的日志量大约在2TB。我们需要将这些海量的数据导入云端，然后分天、分小时的展开数据分析作业，分析结果再导入数据库和报表系统，最终展示在运营人员面前。”墨迹天气运维部经理章汉龙介绍，整个过程中数据量庞大，且计算复杂，这对云平台的大数据能力、生态完整性和开放性提

# 云原生大数据计算服务 MaxCompute # 日志服务 # 存储 # 分布式计算 # 监控 # 大数据 # MaxCompute

场景研读

|

博文

伏羲—阿里云分布式调度系统

在12月12日的云栖社区在线培训上，“飞天”分布式系统核心开发人员陶阳宇分享了《伏羲-阿里云分布式调度系统》。他主要从伏羲系统架构、任务调度、资源调度、容错机制、规模挑战、安全与性能隔离方面介绍了伏羲分布式系统架构和设计理念。

# 云原生大数据计算服务 MaxCompute # 资源调度 # 分布式计算 # 安全 # 大数据 # 调度

隐林

|

博文

|

来自：大数据与机器学习

干货：解码OneData，阿里的数仓之路。

据IDC报告，预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)，这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘，它有可能成为商业世界的“新能源”，变革我们的生产，影响我们生活。当我们面对如此庞大的数据之时，如果我们不能有序、有结构的进行分类组织

# 云原生数据仓库AnalyticDB MySQL版 # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 搜索推荐 # 大数据 # MaxCompute

隐林

|

博文

|

来自：大数据与机器学习

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

想用阿里云数加·大数据计算服务（MaxCompute），但是现在数据还在hadoop上，怎么办？别烦恼，跟着我们走，来一次MaxCompute零基础数据迁移之旅～Let’s Go！

# 云原生大数据计算服务 MaxCompute # 云服务器 ECS # 弹性计算 # 分布式计算 # Hadoop # 大数据 # MaxCompute # 数据安全/隐私保护 # DataX # Linux # Go

晋恒

|

博文

|

来自：大数据与机器学习

阿里云MaxCompute 2019-5月刊

5月MaxCompute新功能发布，精彩技术好文推荐，技术干货下载，6月重要活动抢先知道，尽在5月刊。

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 大数据 # MaxCompute

1

2

3

4

...

20

免费试用