开源大数据平台 E-MapReduce的搜索结果_热门

雪哥哥

|

问答

|

来自：大数据与机器学习

咨询个问题，starrocks，如何像mysql一样，查询有无锁以及造成锁的sql？

# 云数据库 RDS MySQL 版 # 开源大数据平台 E-MapReduce # SQL # 关系型数据库 # MySQL

阿里云大数据

|

8月前

|

博文

|

来自：大数据与机器学习

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

# 函数计算 # 开源大数据平台 E-MapReduce # 存储 # 运维 # Serverless # BI # OLAP

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

本文整理自阿里云 EMR 数据开发团队负责人孙一凡（Evans 忆梵），在 Apache Spark & DS Meetup 的分享

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Cloud Native # 数据可视化 # IDE # 大数据 # 测试技术 # 调度 # 开发工具 # Spark

bean_stalk

|

博文

|

来自：大数据与机器学习

阿里云EMR Remote Shuffle Service在小米的实践，以及开源

阿里云EMR自2020年推出Remote Shuffle Service(RSS)以来，帮助了诸多客户解决Spark作业的性能、稳定性问题，并使得存算分离架构得以实施，与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构，在小米的实践，以及开源。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 对象存储 # 存储 # SQL # 缓存 # 分布式计算 # 固态存储 # 测试技术 # 对象存储 # HIVE # Spark # 流计算

我是搞电商ap接口的

|

博文

|

来自：大数据与机器学习

小红书 API 接口使用指南：笔记详情数据接口的接入与使用

小红书是一款广受喜爱的生活方式分享社交平台，涵盖旅行、美食等领域。其API允许开发者批量获取笔记内容、图片链接及用户互动数据，助力内容分析与营销策略优化。要使用API，需先注册开发者账号并通过认证获取密钥；随后依据官方文档构建与发送HTTP请求，最后处理JSON格式响应数据。整个过程中，请务必遵循平台使用条款，尊重用户隐私权。

# 开源大数据平台 E-MapReduce # JSON # API # 开发者 # 数据格式 # Python

扬流

|

博文

|

来自：大数据与机器学习

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

本文为作者在 StarRocks Summit Asia 2022 上的分享

# 开源大数据平台 E-MapReduce # 对象存储 # 存储 # SQL # 缓存 # Kubernetes # 数据挖掘 # Apache # 调度 # 对象存储 # HIVE # 容器

扬流

|

博文

|

来自：大数据与机器学习

关于 Data Lake 的概念、架构与应用场景介绍

本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。

# 开源大数据平台 E-MapReduce # 数据管理 # 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 大数据开发治理平台 DataWorks # 云原生数据仓库AnalyticDB MySQL版 # 存储 # 数据采集 # 运维 # 分布式计算 # 大数据 # 数据管理 # MaxCompute # 对象存储 # 流计算 # 数据格式

阿里云大数据

|

9天前

|

博文

|

来自：大数据与机器学习

活动报名 | Apache Spark Meetup · 上海站，助力企业构建高效数据平台

2025年12月20日，上海 · 阿里巴巴徐汇滨江园区，Apache Spark Meetup 助力企业构建高效数据平台，欢迎报名！

# 开源大数据平台 E-MapReduce # 分布式计算 # Serverless # 数据处理 # Apache # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

JindoFS: 云上大数据的高性能数据湖存储方案

JindoFS 是EMR打造的高性能大数据存储服务，可以为不同的计算引擎提供不同的存储服务，可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场，阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。

# 云原生大数据计算服务 MaxCompute # 对象存储 # 性能测试 # 开源大数据平台 E-MapReduce # 对象存储 # 存储 # 分布式计算 # Spark # 测试技术 # 大数据

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析，云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍，希望给想了解和实践数据湖架构的企业和朋友一个参考。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 数据安全中心 # 存储 # SQL # 分布式计算 # 运维 # 大数据 # Hadoop # 调度 # 对象存储 # 数据安全/隐私保护 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce