Spark的搜索结果_热门_第15页-阿里云开发者社区

Echo_Wish

|

5天前

|

博文

|

来自：大数据与机器学习

数据湖不是湖，是江湖：Delta Lake / Iceberg / Hudi 到底该选谁？

# SQL # 分布式计算 # 架构师 # 关系型数据库 # Spark

不语奈何

|

博文

Yarn REST API 使用指南

yarn

# 实时计算 Flink版 # 分布式计算 # 资源调度 # Hadoop # 大数据 # API # 调度 # 网络架构 # 流计算 # Spark # 容器

xleesf

|

博文

一文了解Apache Hudi架构、工具和最佳实践

# 存储 # 分布式计算 # Hadoop # Apache # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

超详攻略！Databricks 数据洞察 - 企业级全托管 Spark 大数据分析平台及案例分析

5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察产品链接：https://www.aliyun.com/product/bigdata/spark（当前产品提供￥599首购试用活动，欢迎试用！）

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 机器学习/深度学习 # 人工智能 # 分布式计算 # 大数据 # 数据挖掘 # BI # 调度 # 对象存储 # Spark

游客7wkr3y7oxyt7a

|

3月前

|

博文

终于有人把数据倾斜讲清楚了

本文深入剖析大数据处理中的“数据倾斜”问题，从现象到本质，结合真实踩坑经历，讲解数据倾斜的成因、典型场景及四步精准定位方法，帮助开发者从根本上理解和解决这一常见难题。

# SQL # 分布式计算 # 监控 # 大数据 # Spark

潭潭

|

博文

|

来自：云存储

表格存储Tablestore权威指南（持续更新）

表格存储本着提升用户体验的思路，打造《表格存储Tablestore权威指南》。为用户提供可借鉴的开发指导、经典案例。经典案例按照场景应用类型划分，目前提供五类场景：元数据、消息数据、轨迹溯源、科学大数据以及物联网；每个类型下都会提供多种经典场景。

# 表格存储 # 云原生大数据计算服务 MaxCompute # 存储 # NoSQL # 大数据 # SQL # 流计算 # 数据管理 # 分布式计算 # Spark # 数据挖掘 # 关系型数据库

阿里云IoT-杜尘

|

博文

|

来自：物联网

如何解决IoT数据的存储计算的实践案例

物联网数据往往来自于智能设备或者传感器设备，这些设备只要运行中，将持续不断产生设备数据。同时这些数据的使用价值根据场景千差万别，其中时效性对不同场景有很大影响，如何解决好存储和计算是物联网数字化场景的关键问题。

# 物联网平台 # 存储 # SQL # 人工智能 # 分布式计算 # 物联网 # 大数据 # Hadoop # 数据库 # 流计算 # Spark

AIweker

|

博文

机器学习分布式框架Ray

Ray是UC Berkeley RISELab推出的一个高性能分布式执行框架，它比Spark更具计算优势，部署简单，支持机器学习和深度学习的分布式训练。Ray包括节点（head和worker）、本地调度器、object store、全局调度器（GCS），用于处理各种分布式计算任务。它支持超参数调优（Ray Tune）、梯度下降（Ray SGD）、推理服务（Ray SERVE）等。安装简单，可通过`pip install ray`。使用时，利用`@ray.remote`装饰器将函数转换为分布式任务，通过`.remote`提交并用`ray.get`获取结果。5月更文挑战第15天

# GPU云服务器 # 机器学习/深度学习 # 分布式计算 # 调度 # 算法框架/工具 # Spark

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Flink + Iceberg 全场景实时数仓的建设实践

Apache Flink 是目前大数据领域非常流行的流批统一的计算引擎，数据湖是顺应云时代发展潮流的新型技术架构，以 Iceberg、Hudi、Delta 为代表的解决方案应运而生，Iceberg 目前支持 Flink 通过 DataStream API /Table API 将数据写入 Iceberg 的表，并提供对 Apache Flink 1.11.x 的集成支持。

# 实时数仓 Hologres # 实时计算 Flink版 # 云原生大数据计算服务 MaxCompute # 云消息队列 Kafka 版 # 云原生数据仓库AnalyticDB MySQL版 # SQL # 存储 # 消息中间件 # 分布式计算 # Kafka # OLAP # Apache # 调度 # 流计算 # Spark

小山猪

|

博文

【Hive】Hive开启远程连接及访问方法

# 云数据库 RDS MySQL 版 # SQL # 分布式计算 # Ubuntu # Java # 关系型数据库 # MySQL # Hadoop # 数据库连接 # HIVE # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark