分布式计算的搜索结果_热门_第11页-阿里云开发者社区

小鱼小虾

|

博文

C:\Program 不是内部或外部命令，也不是可运行的程序

今天在Win10上安装启动Spark的时候遇到此错误，查了下，发现是因为64位的Java安装在C:\Program Files\下，导致最终的PATH中包含了空格解决方法是将JAVA_HOME改成C:\progra~1

# Java # 分布式计算 # Spark

明惠

|

博文

|

来自：数据库

深入理解 Apache Spark Delta Lake 的事务日志

深入理解 Apache Spark Delta Lake 的事务日志事务日志是理解 Delta Lake 的关键，因为它是贯穿许多最重要功能的通用模块，包括 ACID 事务、可扩展的元数据处理、时间旅行（time travel）等。

# 日志服务 # 分布式计算 # Spark # 数据格式 # JSON # Apache

zhujiajunup

|

博文

mac os 下安装hadoop-2.7.3+hive-2.1.1＋sqoop-1.99.3

hadoop+hive+sqoop安装与使用

# 云数据库 RDS MySQL 版 # SQL # 分布式计算 # Hadoop # Java # HIVE

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

章剑锋（简锋），开源界老兵，Apache Member，曾就职于 Hortonworks，目前在阿里巴巴计算平台事业部任高级技术专家，并同时担任 Apache Tez、Livy 、Zeppelin 三个开源项目的 PMC ，以及 Apache Pig 的 Committer。

# 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 大数据 # 分布式计算 # 流计算 # Spark # Hadoop

数澜科技大数据

|

博文

菜鸟的Hadoop快速入门

一、相关概念 1、大数据大数据是一门概念，也是一门技术，是以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。大数据包括了以Hadoop和Spark为代表的基础大数据框架，还包括实时数据处理，离线数据处理，数据分析，数据挖掘和用机器算法进行预测分析等技术。

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Hadoop # 大数据 # 数据挖掘 # Java # 数据处理 # 资源调度 # 缓存 # 算法

wqnmbdd

|

博文

说说阿里增量计算框架Galaxy

增量计算模型 (一) 背景 Galaxy是阿里数据平台事业部，实时计算组自研的增量计算框架。今年双十一，阿里直播大屏就是Galaxy支持和保障的重要业务之一，相信大家可能看过双十一之后网上一些介绍性的文章了，比如阿里研发实时计算平台每秒运算量将超千万，不过这篇文章面向非技术人员，最后的比喻也是有点醉。还这篇比较新的阿里巴巴实时数据公共层助力双11媒体直播。

# SQL # 分布式计算 # 双11 # Spark # 流计算 # API # HIVE # 调度 # 存储 # 开发者

雨客

|

博文

通过Cloudera Manager安装CDH

# 云数据库HBase版 # 微服务引擎 # 云原生数据库 PolarDB # SQL # 分布式计算 # Hadoop # 分布式数据库 # Hbase

金融豆豆

|

博文

|

来自：大数据与机器学习

阿里云大数据实验室：MaxCompute使用体验

阿里云大数据实验室时阿里云开发的一站式大数据教学实践和科研创新平台，提供创业创新大赛平台，为各行业用户提供简单易用的大数据真实环境，让数据价值触手可及。在阿里云大数据实验室中集成了MaxCompute。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # BI # MaxCompute # 开发工具

Database-Learning-helper

|

博文

阿里开发者招聘节 | 阿里巴巴数据技术及产品部诚招技术人才啦！

云上数据中台，未来无限可能～

# 云原生数据仓库AnalyticDB MySQL版 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 新零售 # 分布式计算 # 算法 # 大数据 # Java

五维空间s

|

博文

Spark基本的RDD算子之groupBy，groupByKey，mapValues

1. groupby def groupBy[K: ClassTag](f: T => K): RDD[(K, Iterable[T])] def groupBy[K: ClassTag](f: T => K, numPartitions: Int): RDD[(K, Iterable[T])] def groupBy[K: ClassTag](f: T => K, p: Partitioner): RDD[(K, Iterable[T])] groupBy算子接收一个函数，这个函数返回的值作为key，然后通过这个key来对里面的元素进行分组。

# 分布式计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算