分布式计算的搜索结果_热门_第18页-阿里云开发者社区

场景研读

|

博文

|

在票选最美云上大数据暨大数据技术峰会上，来自飞天一部的朋春从MaxCompute提供的离线、实时数据通道入手，延伸到DTS、Logstash、DataX等官方/开源软件，向大家介绍如何从数据库、本地文件等多种存储向MaxCompute导入数据，分享最后还介绍了如何在Python和R语言中使用MaxCompute。

# 云原生大数据计算服务 MaxCompute # 数据总线 DataHub # 数据集成 Data Integration # 分布式计算 # 大数据 # 数据库 # DataX # MaxCompute

xiangel

|

博文

|

来自：大数据与机器学习

odps之sql性能优化

前一段时间做了一些作业成本优化的工作，这里做下总结。首先说明本篇中谈及的优化主要的目标是在不大幅度增加作业运行时长的条件下对作业运行成本的优化。 ## 1. odps的优化引擎并没有那么智能 odps自带的优化引擎会对sql作业做一定的优化处理，如列裁剪、分区裁剪和谓词下推。

# 云原生大数据计算服务 MaxCompute # 日志服务 # 云解析DNS # SQL # 分布式计算 # MaxCompute

晋恒

|

博文

阿里云MaxCompute 2019-11 月刊

# 云原生大数据计算服务 MaxCompute # SQL # 存储 # 分布式计算 # DataWorks # 数据可视化 # Java # Hadoop # 数据库连接 # MaxCompute

阿里云柳璃

|

博文

SQL解析过程详解

# 云原生大数据计算服务 MaxCompute # 云解析DNS # SQL # 分布式计算 # 自然语言处理 # 算法 # MaxCompute

六翁

|

博文

Spark机器学习1·编程入门(scala/java/python)

Spark机器学习1·编程入门

# 分布式计算 # Java # Apache # Spark # Python

雨客

|

博文

HDFS配置Kerberos认证

# 日志服务 # 分布式计算 # Hadoop # Java # 网络安全 # 数据安全/隐私保护

ulinkm

|

博文

三天100元从零开始搭建Hadoop集群

三天时间高效搭建Hadoop集群：第一天启动集群并编译Word Count；第二天建立集群的远程自动控制系统；第三天，学习中文分词。高效的经验：和阿里团队互动，多要工程而不是代码，对阿里有关产品清楚认识

# 对象存储 # 云服务器 ECS # 分布式计算 # 自然语言处理 # Java # Hadoop # 对象存储 # 弹性计算 # 网络安全 # 大数据 # Android开发

传学

|

博文

MaxCompute MapReduce

大数据计算服务(MaxCompute)的功能详解和使用心得

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Java # MaxCompute

machongmc

|

博文

Spark计算过程分析

### 基本概念 ---------- Spark是一个分布式的内存计算框架，其特点是能处理大规模数据，计算速度快。Spark延续了Hadoop的MapReduce计算模型，相比之下Spark的计算过程保持在内存中，减少了硬盘读写，能够将多个操作进行合并后计算，因此提升了计算速度。同时Spark也提供了更丰富的计算API。 MapReduce是Hadoop和Spark的计算模型，其特点

# 分布式计算 # 资源调度 # 调度 # Spark

上单

|

博文

|

来自：大数据与机器学习

阿里云大数据利器Maxcompute学习之--窗口函数实现分组TopN

看到很多用户经常会问如何对分组内进行排序。官方文档：https://help.aliyun.com/document_detail/34994.html?spm=5176.doc27891.6.611.

# 云原生大数据计算服务 MaxCompute # 移动开发 # 分布式计算 # 大数据 # MaxCompute

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算