Spark的搜索结果_热门_第9页-阿里云开发者社区

周志湖

|

博文

Spark修炼之道（进阶篇）——Spark入门到精通：第十五节 Kafka 0.8.2.1 集群搭建

作者：周志湖微信号：zhouzhihubeyond 本节为下一节Kafka与Spark Streaming做铺垫主要内容 1.kafka 集群搭建 1. kafka 集群搭建 kafka 安装与配置到下面的地址下载：Scala 2.10 - kafka_2.10-0.8.2.1.tgz http://kafka.apache.org/downloa

# 云消息队列 Kafka 版 # 微服务引擎 # 消息中间件 # 分布式计算 # Kafka # Spark # 流计算

雨客

|

博文

Reading List 2015-03

# 云原生大数据计算服务 MaxCompute # 机器学习/深度学习 # 分布式计算 # 搜索推荐 # 算法 # Spark

小猫吃鱼569

|

博文

【Spark Summit East 2017】Spark中的草图数据和T-Digest

本讲义出自Erik Erlandson在Spark Summit East 2017上的演讲，大型数据集的草图概率分布的算法是现代数据科学的一个基本构建块，草图在可视化、优化数据编码、估计分位数以及数据合成等不同的应用中都有应用之地，T-Digest是一个通用的的草图的数据结构，并且非常适合于map-reduce模式，演讲中演示了Scala原生的T-Digest草图算法实现并证实了其在Spark的可视化展示、分位数估计以及数据合成的作用。

# 分布式计算 # 算法 # 大数据 # Spark # 数据可视化 # MaxCompute # Scala

taotao9229

|

博文

小米新一代大数据统计平台大公开

# 云原生大数据计算服务 MaxCompute # 云数据库HBase版 # 分布式计算 # druid # 大数据 # Spark # 流计算 # Hbase # 分布式数据库 # 前端开发 # SQL # 消息中间件

技术小甜

|

博文

Databricks缓存提升Spark性能--为什么NVMe固态硬盘能够提升10倍缓存性能（原创翻译）

我们兴奋的宣布Databricks缓存的通用可用性，作为统一分析平台一部分的 Databricks 运行时特性，它可以将Spark工作负载的扫描速度提升10倍，并且这种改变无需任何代码修改。 1、在本博客中，我们将介绍这个新特性的两个主要特点：易用性和性能。

# 存储 # 缓存 # 分布式计算 # Spark # 内存技术

小猫吃鱼569

|

博文

【Spark Summit EU 2016】Sparklint:Spark监控，识别与优化利器

本讲义出自Simon Whitear在Spark Summit EU 2016上的演讲，主要介绍了用于监控，识别并优化低效Spark的工具Sparklint。由于成功的Spark集群的规模往往会迅速扩张，往往会出现能力与任务不匹配的情况并造成资源竞争，为了使得Spark集群的效率得到提升，所以需要Sparklint这样的监控优化工具。

# 分布式计算 # 监控 # Spark # MaxCompute # 大数据

中间件小哥

|

博文

里程碑 | Apache RocketMQ 正式开源分布式事务消息

近日，Apache RocketMQ 社区正式发布4.3版本。此次发布不仅包括提升性能，减少内存使用等原有特性增强，还修复了部分社区提出的若干问题，更重要的是该版本**开源了社区最为关心的分布式事务消息**，而且实现了对外部组件的零依赖。接下来，本文将详细探秘RocketMQ事务消息的设计原理以及实现机制。

# 云消息队列 MQ # 存储 # 消息中间件 # Apache # 数据库 # RocketMQ # 微服务 # 算法 # 流计算 # 分布式计算 # Spark

周志湖

|

博文

Spark修炼之道（基础篇）——Linux大数据开发基础：第五节：vi、vim编辑器（一）

本节主要内容 vim编辑器的三种模式移动光标输入模式修改文本作者：周志湖微信号：zhouzhihubeyond 网名：摇摆少年梦 1. vi编辑器的三种模式学会使用vi编辑器是学习linux系统的必备技术之一，因为一般的linux服务器是没有GUI界面的，linux运维及开发人员基本上都是通过命令行的方式进行文本编辑或程序编写的。vi编辑器是linu

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # Linux # 开发工具 # Spark

祝威廉

|

博文

|

来自：云原生

为什么用Yarn来做Docker容器调度引擎

这篇文章是在一个微信群里和人聊天，然后整理出来的文字。当时Hulu推出了基于Yarn的Docker调度引擎。我正好那段时间也实现了一个类似的，经过交流，发现最后的实现基本是一致的。然而业界用的较多的是Mesos,这篇文章就是为了解释为什么选择用Yarn而不是Mesos来做。

# 资源管理 # 资源调度 # 分布式计算 # 调度 # Docker # 容器 # Hadoop # 数据中心 # Java # Spark # 大数据

jurassic_1

|

博文

创业一年来经历的技术风雨

本文来自中生代技术群的分享，BigEye科技联合创始人与技术负责人张逸将为大家分享来自于自身创业一年来经历的技术风雨。创业的路上，且行且珍惜。

# 云数据库 RDS MySQL 版 # 云解析DNS # SQL # 分布式计算 # 前端开发 # Scala # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark