开源大数据平台 E-MapReduce的搜索结果_热门

扬流

|

博文

|

来自：大数据与机器学习

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

# 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # Spark # Apache

CiiLii西里网

|

博文

|

来自：大数据与机器学习

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型，预训练于多样化数据集，支持18亿至720亿参数规模。在多模态英文任务中表现出色，且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互，提供智能体验。然而，模型在逻辑题和指令理解上存在不足，需在特定领域进行优化。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 搜索推荐 # 机器人

真的很搞笑

|

问答

|

来自：大数据与机器学习

阿里云E-MapReduce jindodistcp迁移hdfs到oss的时候会忽略正在写入的块么？

# 对象存储 # 开源大数据平台 E-MapReduce # 对象存储

扬流

|

博文

|

来自：大数据与机器学习

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 对象存储 # 负载均衡 # 存储 # 分布式计算 # Kubernetes # 负载均衡 # 网络性能优化 # Apache # 对象存储 # Spark # 混合部署 # 容器

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Spark 3.0 对于 DATE 和 TIMESTAMP 的改进

本文将会深入介绍DATE和TIMESTAMP

# 开源大数据平台 E-MapReduce # 云解析DNS # SQL # 存储 # 分布式计算 # Java # API # Scala # Apache # 数据库 # Spark # Python

阿里云大数据

|

8月前

|

博文

|

来自：大数据与机器学习

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求，采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升，支持业务快速发展、计算效率提升，增强SLA保障，稳定性提升，降低运维成本，并支撑全球化数据架构部署。

# 函数计算 # 开源大数据平台 E-MapReduce # SQL # 分布式计算 # Serverless # 调度 # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Spark Operator浅析

Spark Operator浅析本文介绍Spark Operator的设计和实现相关的内容. Spark运行时架构经过近几年的高速发展,分布式计算框架的架构逐渐趋同. 资源管理模块作为其中最通用的模块逐渐与框架解耦,独立成通用的组件.

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 资源管理 # 可观测监控 Prometheus 版 # 分布式计算 # Spark # 容器 # Kubernetes # Perl

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR Serverless StarRocks3.x，极速统一的湖仓新范式

EMR StarRocks 线上公开课第1期，直播主题：EMR Serverless StarRocks3.x，极速统一的湖仓新范式。

# 云原生数据仓库AnalyticDB MySQL版 # 大数据开发治理平台 DataWorks # 开源大数据平台 E-MapReduce # 弹性伸缩 # 函数计算 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 对象存储 # 存储 # SQL # 数据可视化 # OLAP # 对象存储

扬流

|

博文

|

来自：大数据与机器学习

重磅发布！阿里云全链路数据湖开发治理解决方案

阿里云重磅发布全链路数据湖解决方案，主要包含开源大数据平台E-MapReduce(EMR) + 一站式大数据数据开发治理平台DataWorks + 数据湖构建DLF + 对象存储OSS等核心产品。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 数据安全中心 # 对象存储 # 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # 数据集成 Data Integration # 数据采集 # SQL # 弹性计算 # 运维 # 分布式计算 # DataWorks # 数据可视化 # 大数据 # 调度 # 对象存储

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR StarRocks VS 开源版本功能差异介绍

阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务，提供高性能、全场景、极速统一的数据分析体验，具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks，性能比传统 OLAP 引擎提升 3-5 倍，助力企业高效构建大数据应用。本篇文章重点介绍阿里云 EMR StarRocks 与开源 StarRocks 的对比与客户案例。

# 实时计算 Flink版 # 函数计算 # 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # SQL # 运维 # Serverless # OLAP # BI

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce