分布式计算的搜索结果_热门_第15页-阿里云开发者社区

雨客

|

博文

Zookeeper配置Kerberos认证

# 微服务引擎 # 分布式计算 # Hadoop # 网络安全 # 数据安全/隐私保护 # Hbase

祎休

|

博文

|

来自：大数据与机器学习

MaxCompute（原ODPS）开发入门指南——数据上云篇

根据《MaxCompute（原ODPS）开发入门指南——计量计费篇》的了解，大家清楚了MaxCompute可以做什么，计费模式如何，想必大家也开通了MaxCompute想进行一次POC，但是大家遇到第一个问题一定是我的数据如何上云？

# 云原生大数据计算服务 MaxCompute # 日志服务 # 云原生数据库 PolarDB # 云数据库 RDS MySQL 版 # 数据总线 DataHub # 数据集成 Data Integration # 分布式计算 # SQL # 监控 # 大数据 # 数据库

巴客

|

博文

|

来自：数据库

X-Pack Spark归档POLARDB数据做分析

简介 POLARDB数据库是阿里云自研的下一代关系型云数据库，100%兼容MySQL，性能最高是MySQL的6倍，但是随着数据量不断增大，面临着单条SQL无法分析出结果的现状。X-Pack Spark为数据库提供分析引擎，旨在打造数据库闭环，借助X-Pack Spark可以将POLARDB数据归档至列式存储Parquet文件，一条SQL完成复杂数据分析，并将分析结果回流到业务库提供查询。

# 云原生数据库 PolarDB # 云数据库 RDS MySQL 版 # 云数据库HBase版 # 分布式计算 # 测试技术 # 分布式数据库 # 数据库 # Spark

cloudcoder

|

博文

Spark SQL性能优化

# SQL # 分布式计算 # Spark # Java

开源大数据EMR

|

博文

|

来自：大数据与机器学习

EMR Spark Relational Cache的执行计划重写

作者：王道远，花名健身，阿里巴巴计算平台EMR技术专家。背景 EMR Spark提供的Relational Cache功能，可以通过对数据模型进行预计算和高效地存储，加速Spark SQL，为客户实现利用Spark SQL对海量数据进行即时查询的目的。

# 开源大数据平台 E-MapReduce # 云解析DNS # SQL # 存储 # 缓存 # 分布式计算 # Spark # HIVE # Apache # 数据挖掘 # 数据库 # 大数据

gissync

|

博文

一分钟“零代码”生成API，DataWorks数据服务快速上手指南

DataWorks数据服务提供了快速生成API的能力，可以一分钟“零代码”生成API，本文是一篇快速上手指南，帮助你快速认识数据服务。

# 大数据开发治理平台 DataWorks # API 网关 # 云原生大数据计算服务 MaxCompute # 云原生数据库 PolarDB # 分布式计算 # DataWorks # API # MaxCompute # 测试技术

沐远

|

博文

|

来自：数据库

云HBase X-Pack解决传统数据仓库瓶颈，赋能客户计算分析业务

某游戏公司随着业务快速发展，用户行为日志快速增长，需要从海量的点击流日志和激活日志中挖掘数据的价值，比如广告转化率、激活率，每日安装用户成本等等。原来使用GreenPlum做实时计算和统计分析遇到一些瓶颈，最终使用阿里云HBase X-Pack构建了满足业务需求的数据处理平台。

# 云数据库HBase版 # 日志服务 # SQL # 分布式计算 # 监控 # 分布式数据库 # Hbase

smartloli

|

博文

Flink 案例整合

# 实时计算 Flink版 # SQL # 分布式计算 # Hadoop # HIVE # 流计算 # Java # 监控 # 存储 # API # 资源调度

【方向】

|

博文

Python数据预处理：使用Dask和Numba并行化加速

本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度，非常直观，可供参考。

# 数据采集 # 大数据 # Python # 数据处理 # 程序员 # 机器学习/深度学习 # 分布式计算 # Spark # 网络协议 # C++

勿烦

|

博文

|

来自：大数据与机器学习

SQL优化器原理 - Auto Hash Join

在MaxCompute中，Join操作符的实现算法之一名为"Hash Join"，其实现原理是，把小表的数据全部读入内存中，并拷贝多份分发到大表数据所在机器，在 map 阶段直接扫描大表数据与内存中的小表数据进行匹配。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # MaxCompute

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算