Spark的搜索结果_热门_第13页-阿里云开发者社区

开源大数据EMR

|

博文

|

来自：大数据与机器学习

开源大数据周刊-第5期

浅谈大数据在传统行业的落地之痛，Spark如何简化大数据工作

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # Hadoop # 数据库 # Spark

云无谓

|

博文

|

来自：大数据与机器学习

在E-MapReduce集群内运行Spark GraphX作业

Spark GraphX是一个比较流行的图计算框架，如果你使用了阿里云的E-MapReduce服务，可以很方便的运行图计算的作业。下面以PageRank为例，看看如何运行GraphX作业

# 开源大数据平台 E-MapReduce # 分布式计算 # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Spark on Kubernetes原生支持浅析

概述 Kubernetes自推出以来，以其完善的集群配额、均衡、故障恢复能力，成为开源容器管理平台中的佼佼者。从设计思路上，Spark以开放Cluster Manager为理念，Kubernetes则以多语言、容器调度为卖点，二者的结合是顺理成章的。

# 容器服务Kubernetes版 # 分布式计算 # Spark # 容器 # Perl # Kubernetes

colleen

|

博文

PySpark安装+Jupyter Notebook配置（Ubuntu 18.06）

学校一门Big Data Computing需要学习Spark in Python。这篇文章记录一下安装PySpark和Jupyter Notebook上运行Spark的步骤。

# 分布式计算 # Ubuntu # Spark # Python # Java # Hadoop # 开发工具

知与谁同

|

博文

一个SparkSQL作业的一生可能只是一集琅琊榜

# SQL # 分布式计算 # Hadoop # HIVE # Spark

徐雷知行合一

|

博文

Hadoop大数据平台实战(05)：深入Spark Cluster集群模式YARN vs Mesos vs Standalone vs K8s

Hadoop大数据平台实战(05)：Spark Cluster集群模式YARN, Mesos,Standalone和K8s深入对比。监控，调度，监控，安全机制，特性对比，哪个才是最好的Spark集群管理工具。

# 容器服务Kubernetes版 # 云原生大数据计算服务 MaxCompute # 微服务引擎 # 密钥管理服务 # 资源管理 # 分布式计算 # 大数据 # Spark # 容器 # Kubernetes

hadoop实操

|

博文

0030-如何在CDH中安装Kudu&Spark2&Kafka

# 云消息队列 Kafka 版 # Web App开发 # 消息中间件 # 分布式计算 # Kafka # Spark

小猫吃鱼569

|

博文

【Spark Summit East 2017】使用Alluxio提升Spark效率

本讲义出自Gene Pang与Haoyuan Li在Spark Summit East 2017上的演讲，主要介绍了Alluxio，前身为Tachyon，是内存加速虚拟分布式存储系统，该系统可以利用内存存储数据，并且加速访问从不同的数据存储系统的数据。

# 存储 # 分布式计算 # 大数据 # Spark # MaxCompute

中间件小哥

|

博文

|

来自：云原生

Spark随谈（二）—— 安装攻略

本来安装这件事情，不用单独开一篇谈的。但是Spark的安装实在是一件点蛋疼的事情，这和Spark的语言和框架两者有颇大的关系。 Spark是Scala语言写的，所以要先安装Java和Scala，而底层的调度框架是Mesos，Mesos是C++写的，所以又对机器的glibc和gcc环境有一定的要求。

# 分布式计算 # Java # Scala # C语言 # Spark

aron.tao

|

博文

Spark Parquet file split

# 分布式计算 # Spark # Go # 数据处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark