Spark的搜索结果_热门_第4页-阿里云开发者社区

aron.tao

|

博文

Maven 依赖 install

# Java # Maven # 容器 # 应用服务中间件 # 分布式计算 # Spark # Perl

琸然

|

博文

|

来自：云存储

Tablestore+Delta Lake(快速开始)

本文介绍如何在E-MapReduce中通过Tablestore Spark Streaming Source将TableStore中的数据实时导入到Delta Lake中。背景介绍近些年来HTAP(Hybrid transaction/analytical processing)的热度越来越高，通过将存储和计算组合起来，既能支持传统的海量结构化数据分析，又能支持快速的事务更新写入，是设计数据密集型系统的一个成熟的架构。

# 表格存储 # NoSQL # 分布式计算 # 存储 # Java # Spark

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

章剑锋（简锋），开源界老兵，Apache Member，曾就职于 Hortonworks，目前在阿里巴巴计算平台事业部任高级技术专家，并同时担任 Apache Tez、Livy 、Zeppelin 三个开源项目的 PMC ，以及 Apache Pig 的 Committer。

# 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 大数据 # 分布式计算 # 流计算 # Spark # Hadoop

技术小能手

|

博文

Kaggle大神带你上榜单Top2%：点击预测大赛纪实（上）

# 机器学习/深度学习 # 分布式计算 # 算法 # 测试技术 # Spark

五维空间s

|

博文

Spark基本的RDD算子之groupBy，groupByKey，mapValues

1. groupby def groupBy[K: ClassTag](f: T => K): RDD[(K, Iterable[T])] def groupBy[K: ClassTag](f: T => K, numPartitions: Int): RDD[(K, Iterable[T])] def groupBy[K: ClassTag](f: T => K, p: Partitioner): RDD[(K, Iterable[T])] groupBy算子接收一个函数，这个函数返回的值作为key，然后通过这个key来对里面的元素进行分组。

# 分布式计算 # Spark

潜水到明朝

|

博文

Spark之RDD的transformation&action（Java&Scala实现）

# 分布式计算 # Java # Spark # Scala # Hbase # 分布式数据库 # SQL # HIVE # 算法 # 关系型数据库

雨客

|

博文

Spark本地模式运行

# 日志服务 # 分布式计算 # Java # Spark # Python

大数据史记

|

博文

分布式编程模型的设计与演化

本文主要内容是分布式编程模型设计与演化，具体分为分布式编程模型的背景、MapReduce编程模型、关系型数据编程模型、分布式图计算模型分布式编程未来展望五部分。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # MaxCompute # 图计算 # Spark

寒沙牧

|

博文

|

来自：大数据与机器学习

E-MapReduce中Spark 2.x读写MaxCompute数据

最新的`aliyun-emapreduce-sdk`将`MaxCompute`数据以`DataSource`的方式接入Spark 2.x，用户可以使用类似Spark 2.x中读写`json/parquet/csv`的方式来访问MaxCompute.

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # 分布式计算 # MaxCompute # Spark # SQL # API

许鹏

|

博文

Apache Spark技术实战（一）Standalone部署模式下的临时文件清理&日志级别修改

在Standalone部署模式下，Spark运行过程中会创建哪些临时性目录及文件，这些临时目录和文件又是在什么时候被清理，本文将就这些问题做深入细致的解答；并讨论日志级别修改问题。

# 日志服务 # 存储 # 分布式计算 # Java # Apache # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark