开源大数据平台 E-MapReduce-博文-第2页-阿里云开发者社区-阿里云

扬流

|

存储 SQL 缓存

|

博文

【报名中】阿里云 x StarRocks：极速湖仓第二季—上海站

阿里云 x StarRocks：极速湖仓第二季，7月20日阿里巴巴上海徐汇滨江园区，现场签到丰富奖品等你拿，不见不散！

605 7 7

扬流

|

存储数据挖掘 OLAP

|

博文

阿里云 EMR Serverless StarRocks OLAP 数据分析场景解析

阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务，提供高性能、全场景、极速统一的数据分析体验，具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks，性能比传统 OLAP 引擎提升 3-5 倍，助力企业高效构建大数据应用。本篇文章对阿里云EMR Serverless StarRocks OLAP 数据分析场景进行解析、存算分离架构升级以及 Trino 兼容，无缝替换介绍。

19858 12 12

DreamSpark

|

SQL 分布式计算 Java

|

博文

E-MapReduce Serverless Spark体验评测

从了解到部署实践，全方位带你体验大数据平台EMR Serverless Spark的魅力。

868 7 7

扬流

|

分布式计算运维 Serverless

|

博文

EMR Serverless Spark 实践教程 | 通过 EMR Serverless Spark 提交 PySpark 流任务

在大数据快速发展的时代，流式处理技术对于实时数据分析至关重要。EMR Serverless Spark提供了一个强大而可扩展的平台，它不仅简化了实时数据处理流程，还免去了服务器管理的烦恼，提升了效率。本文将指导您使用EMR Serverless Spark提交PySpark流式任务，展示其在流处理方面的易用性和可运维性。

659 7 7

电力程序小学童

|

调度知识图谱

|

博文

【综合能源】含氢气氨气综合能源系统优化调度【免费】

该程序参考《_基于氨储能技术的电转氨耦合风–光–火综合能源系统双层优化调度》模型，对制氨工厂、风力发电、电制氢、燃气轮机、火电机组等主体进行建模分析，以火电机组启停成本、煤耗成本、弃风成本和购气成本形成的综合成本为目标，程序采用matlab+cplex求解，注释清晰，方便学习!

592 0 0

时不我与爱铭

|

消息中间件存储大数据

|

博文

深度分析：Apache Kafka及其在大数据处理中的应用

Apache Kafka是高吞吐、低延迟的分布式流处理平台，常用于实时数据流、日志收集和事件驱动架构。与RabbitMQ（吞吐量有限）、Pulsar（多租户支持但生态系统小）和Amazon Kinesis（托管服务，成本高）对比，Kafka在高吞吐和持久化上有优势。适用场景包括实时处理、数据集成、日志收集和消息传递。选型需考虑吞吐延迟、持久化、协议支持等因素，使用时注意资源配置、数据管理、监控及安全性。

1046 0 0

扬流

|

分布式计算运维数据挖掘

|

博文

【评测有奖】参加 EMR Serverless Spark 产品评测，赢机械键盘、充电宝等礼品！

即日起至2024年7月18日，参加 EMR Serverless Spark 产品评测，赢机械键盘、充电宝等礼品！

447 7 7

扬流

|

分布式计算 Serverless 调度

|

博文

EMR Serverless Spark：结合实时计算 Flink 基于 Paimon 实现流批一体

本文演示了使用实时计算 Flink 版和 Serverless Spark 产品快速构建 Paimon 数据湖分析的流程，包括数据入湖 OSS、交互式查询，以及离线Compact。Serverless Spark完全兼容Paimon，通过内置的DLF的元数据实现了和其余云产品如实时计算Flink版的元数据互通，形成了完整的流批一体的解决方案。同时支持灵活的作业运行方式和参数配置，能够满足实时分析、生产调度等多项需求。

61456 107 111

扬流

|

SQL 分布式计算监控

|

博文

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用

本文演示了使用 EMR Serverless Spark 产品搭建一个日志分析应用的全流程，包括数据开发和生产调度以及交互式查询等场景。

57184 7 8

扬流

|

存储 SQL 数据可视化

|

博文

阿里云 EMR Serverless StarRocks3.x，极速统一的湖仓新范式

EMR StarRocks 线上公开课第1期，直播主题：EMR Serverless StarRocks3.x，极速统一的湖仓新范式。

1810 1 1

扬流

|

存储分布式计算 Serverless

|

博文

阿里云 EMR Serverless Spark 版开启免费公测

EMR Serverless Spark 版免费公测已开启，预计于2024年06月25日结束。公测阶段面向所有用户开放，您可以免费试用。

1910 5 5

CiiLii西里网

|

自然语言处理搜索推荐机器人

|

博文

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型，预训练于多样化数据集，支持18亿至720亿参数规模。在多模态英文任务中表现出色，且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互，提供智能体验。然而，模型在逻辑题和指令理解上存在不足，需在特定领域进行优化。

6046 1 1

长梦

|

分布式计算资源调度 Hadoop

|

博文

Apache Hadoop入门指南：搭建分布式大数据处理平台

【4月更文挑战第6天】本文介绍了Apache Hadoop在大数据处理中的关键作用，并引导初学者了解Hadoop的基本概念、核心组件（HDFS、YARN、MapReduce）及如何搭建分布式环境。通过配置Hadoop、格式化HDFS、启动服务和验证环境，学习者可掌握基本操作。此外，文章还提及了开发MapReduce程序、学习Hadoop生态系统和性能调优的重要性，旨在为读者提供Hadoop入门指导，助其踏入大数据处理的旅程。

1543 0 0

扬流

|

SQL 分布式计算大数据

|

博文

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

119978 30 32

winx_19970108018

|

API 开发者

|

博文

1688API接口推荐：1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret，通过POST或GET请求接口，输入淘口令代码和参数，返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款，确保合法使用API。

1201 0 0

小白学大数据

|

数据采集 JavaScript 前端开发

|

博文

实用工具推荐：适用于 TypeScript 网络爬取的常用爬虫框架与库

775 0 0

winx_19970108018

|

机器学习/深度学习算法 API

|

博文

1688API接口推荐：1688按图搜索拍立淘数据接口

1069 4 4

扬流

|

SQL 数据可视化数据挖掘

|

博文

EMR Notebook 开启公测，提供交互式数据分析平台

EMR Notebook 是一个 Serverless 化的交互式数据分析和探索平台，满足大数据和 AI 融合下的数据处理需求，现已开启免费公测，欢迎体验！

667 4 4

游客wxcco55wjbm5g

|

云安全弹性计算 Linux

|

博文

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定：从入门到精通

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定：从入门到精通。

1191 0 0

扬流

|

分布式计算运维大数据

|

博文

阿里云 EMR Serverless Spark 版免费邀测中

阿里云 EMR Serverless Spark 版，以 Spark Native Engine 为基础，旨在提供一个全托管、一站式的数据开发平台。诚邀您参与 EMR Serverless Spark 版免费测试，体验 100% 兼容 Spark 的 Serverless 服务：https://survey.aliyun.com/apps/zhiliao/iscizrF54

1295 0 0

扬流

|

存储分布式计算 Apache

|

博文

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

65829 1 1

扬流

|

SQL Serverless OLAP

|

博文

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心，阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营，从 0-1 轻松上手 StarRocks 湖仓分析。

1713 0 0

扬流

|

存储人工智能运维

|

博文

轻喜到家基于 EMR-StarRocks 构建实时湖仓分析平台实践

本文从轻喜到家的历史技术架构与痛点问题、架构升级需求与 OLAP 选型过程、最新技术架构及落地场景应用等方面，详细介绍了轻喜到家基于 EMR-StarRocks 构建实时湖仓分析平台实践经验。

1820 0 1

游客2ybt27odjah3k

|

存储运维数据可视化

|

博文

【技术分析】低代码平台的专有存储技术

低代码是一个新兴的技术，有着非常明确而鲜明的技术特点，比如：拖拽组件、可视化编程、零代码编程等等。但传统软件企业在进行技术融合时却往往是困难重重，旧有的技术积累很难能继承应用过来。本文作为一组技术分析，来逐一分解低代码背后的支撑技术。今天我们给大家带来的一个专题分析是，低代码平台的专有存储技术。

784 0 0

winx_19970108018

|

XML JSON API

|

博文

Json实现根据关键词搜索请求唯品会商品列表数据方法，唯品会商品列表数据接口，唯品会API接口申请指南，支持全站

392 1 1

winx_19970108018

|

JSON API 数据格式

|

博文

Json实现根据关键词搜索请求1688商品列表数据方法，1688商品列表数据接口，1688API接口申请指南

436 0 0

扬流

|

关系型数据库 MySQL BI

|

博文

用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓实战分享

本文从用友畅捷通公司介绍及业务背景；数据仓库技术选型、实际案例及未来规划等方面，分享了用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓的实战经验。

2035 0 0

扬流

|

存储 SQL Java

|

博文

王日宇：基于 StarRocks 和 Paimon 打造湖仓分析新范式

本文根据 StarRocks Summit 2023 演讲实录整理而成，主要分享了基于 StarRocks 和 Paimon 打造湖仓分析方案及背后的技术原来和未来规划。

2656 1 2

扬流

|

存储人工智能大数据

|

博文

2023云栖陈守元，阿里云开源大数据产品年度发布

阿里云计算平台事业部开源大数据产品总监陈守元围绕EMR、Flink Streaming Lakehouse、 Elasticsearch、Milvus等产品发布展开分享介绍。

876 3 3

扬流

|

缓存运维 Cloud Native

|

博文

李钰：从 OLAP 到湖仓，阿里云与 StarRocks 的共创共荣

本文根据 StarRocks Summit 2023 演讲实录整理而成

1329 2 2

小白学大数据

|

数据采集安全中间件

|

博文

python爬虫中 HTTP 到 HTTPS 的自动转换

418 0 0

扬流

|

存储 SQL 缓存

|

博文

【云栖2023】李钰：阿里云 E-MapReduce 全面开启 Serverless 时代

本文根据 2023 云栖大会，阿里云资深技术专家、阿里云开源大数据平台EMR负责人李钰演讲实录整理而成。

1111 1 3

扬流

|

存储人工智能 Cloud Native

|

博文

耳朵经济快速增长背后，喜马拉雅数据价值如何释放 | 创新场景

喜马拉雅和阿里云的合作，正走在整个互联网行业的最前沿，在新的数据底座之上，喜马拉雅的AI、大数据应用也将大放光彩。本文摘自《云栖战略参考》

47869 5 5

灵杰开发者

|

存储 OLAP 云栖大会

|

博文

来云栖大会看 “ 云+StarRocks 3.0：极速统一的湖仓新范式 ”

2023 云栖大会来啦，众多主题活动与你同聚，门票免费领取中，数量有限，先到先得！

799 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据关键词搜索请求淘宝商品列表数据方法，淘宝商品列表数据接口，淘宝API接口申请指南

557 0 0

扬流

|

SQL 分布式计算 Cloud Native

|

博文

杭州 Meetup｜ Apache Kyuubi & Celeborn，助力 Spark 拥抱云原生

10月14日13:00-17:30，Apache Kyuubi & Celeborn 社区将在杭州举办「Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生」Meetup，欢迎报名参会！

1167 0 0

扬流

|

存储 SQL 监控

|

博文

阿里云“玩转云上 StarRocks3.0 湖仓分析”训练营火热报名中，开启数据分析新范式

阿里云 EMR OLAP 团队与 StarRocks 社区联合出品，玩转云上 StarRocks3.0 湖仓分析训练营，围绕 StarRocks3.0 系列解读、EMR Serverless StarRocks 存算分离功能与应用场景介绍，开启数据分析新范式！

1142 0 0

aliyun4381607004

|

数据库数据安全/隐私保护

|

博文

阿里云E-MapReduce集群-开源Ldap密码不安全问题解决方案

社区开源Ldap密码不安全问题解决方案

737 0 0

带你读小助手

|

SQL 弹性计算分布式计算

|

博文

使用EMR+DLF+OSS-HDFS进行数据湖分析

本实验通过使用EMR，搭建EMR集群，对OSS-HDFS进行数据湖分析

1482 0 0

aliyun4381607004

|

分布式计算 Java API

|

博文

阿里云E-MapReduce集群不同计算引擎sleep task使用笔记

需求：日常在E-MapReduce集群中进行相关测试，验证一些切换或变更是否会影响业务的运行导致任务failed。所以需要在测试集群中运行指定资源数（vcore及memory）或者指定运行时间的任务。目前用到MapReduce和spark任务两种，其余的持续更新补充中……

766 0 0

aliyun4381607004

|

存储弹性计算资源调度

|

博文

阿里云E-MapReduce节点优雅下线-基于Yarn Node Labels特性

背景：阿里云E-MapReduce集群（简称EMR集群）部分节点需要下线迁移，但集群资源常年跑满，诉求是节点下线迁移过程中不影响任一任务执行。本次方案基于Yarn Node Labels的特性进行资源隔离后下线。下期对官网Graceful Decommission of YARN Nodes的方案进行验证，参考：https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/GracefulDecommission.html。

1179 1 1

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求天猫商品详情数据方法，天猫商品详情API接口，天猫API接口申请指南

719 1 1

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求淘宝商品详情数据方法，淘宝商品详情API接口，淘宝API接口申请指南

622 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求1688商品详情数据方法，1688商品详情API接口，1688API接口申请指南

522 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求京东商品详情数据方法，京东商品详情API接口，京东API接口申请指南

629 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求唯品会商品详情数据方法，唯品会商品详情API接口，唯品会API接口申请指南

548 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求阿里巴巴商品详情数据方法，阿里巴巴商品详情API接口，阿里巴巴API接口申请指南

500 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求亚马逊商品详情数据方法，亚马逊商品详情API接口，亚马逊API接口申请指南

529 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求易贝商品详情数据方法，ebay商品详情API接口，易贝API接口申请指南

610 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求微店商品详情数据方法，微店商品详情API接口，微店API接口申请指南

398 0 0

开源大数据平台 E-MapReduce

最新

博文

用户案例

免费试用

问答

视频

电子书

学习

活动

【报名中】阿里云 x StarRocks：极速湖仓第二季—上海站

阿里云 EMR Serverless StarRocks OLAP 数据分析场景解析

E-MapReduce Serverless Spark体验评测

EMR Serverless Spark 实践教程 | 通过 EMR Serverless Spark 提交 PySpark 流任务

【综合能源】含氢气氨气综合能源系统优化调度【免费】

深度分析：Apache Kafka及其在大数据处理中的应用

【评测有奖】参加 EMR Serverless Spark 产品评测，赢机械键盘、充电宝等礼品！

EMR Serverless Spark：结合实时计算 Flink 基于 Paimon 实现流批一体

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用

阿里云 EMR Serverless StarRocks3.x，极速统一的湖仓新范式

阿里云 EMR Serverless Spark 版开启免费公测

阿里巴巴的通义千问大模型

Apache Hadoop入门指南：搭建分布式大数据处理平台

Paimon 与 Spark 的集成（二）：查询优化

1688API接口推荐：1688口令转换真实链接接口

实用工具推荐：适用于 TypeScript 网络爬取的常用爬虫框架与库

1688API接口推荐：1688按图搜索拍立淘数据接口

EMR Notebook 开启公测，提供交互式数据分析平台

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定：从入门到精通

阿里云 EMR Serverless Spark 版免费邀测中

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

轻喜到家基于 EMR-StarRocks 构建实时湖仓分析平台实践

【技术分析】低代码平台的专有存储技术

Json实现根据关键词搜索请求唯品会商品列表数据方法，唯品会商品列表数据接口，唯品会API接口申请指南，支持全站

Json实现根据关键词搜索请求1688商品列表数据方法，1688商品列表数据接口，1688API接口申请指南

用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓实战分享

王日宇：基于 StarRocks 和 Paimon 打造湖仓分析新范式

2023云栖陈守元，阿里云开源大数据产品年度发布

李钰：从 OLAP 到湖仓，阿里云与 StarRocks 的共创共荣

python爬虫中 HTTP 到 HTTPS 的自动转换

【云栖2023】李钰：阿里云 E-MapReduce 全面开启 Serverless 时代

耳朵经济快速增长背后，喜马拉雅数据价值如何释放 | 创新场景

来云栖大会看 “ 云+StarRocks 3.0：极速统一的湖仓新范式 ”

Json实现根据关键词搜索请求淘宝商品列表数据方法，淘宝商品列表数据接口，淘宝API接口申请指南

杭州 Meetup｜ Apache Kyuubi & Celeborn，助力 Spark 拥抱云原生

阿里云“玩转云上 StarRocks3.0 湖仓分析”训练营火热报名中，开启数据分析新范式

阿里云E-MapReduce集群-开源Ldap密码不安全问题解决方案

使用EMR+DLF+OSS-HDFS进行数据湖分析

阿里云E-MapReduce集群不同计算引擎sleep task使用笔记

阿里云E-MapReduce节点优雅下线-基于Yarn Node Labels特性

Json实现根据商品ID请求天猫商品详情数据方法，天猫商品详情API接口，天猫API接口申请指南

Json实现根据商品ID请求淘宝商品详情数据方法，淘宝商品详情API接口，淘宝API接口申请指南

Json实现根据商品ID请求1688商品详情数据方法，1688商品详情API接口，1688API接口申请指南

Json实现根据商品ID请求京东商品详情数据方法，京东商品详情API接口，京东API接口申请指南

Json实现根据商品ID请求唯品会商品详情数据方法，唯品会商品详情API接口，唯品会API接口申请指南

Json实现根据商品ID请求阿里巴巴商品详情数据方法，阿里巴巴商品详情API接口，阿里巴巴API接口申请指南

Json实现根据商品ID请求亚马逊商品详情数据方法，亚马逊商品详情API接口，亚马逊API接口申请指南

Json实现根据商品ID请求易贝商品详情数据方法，ebay商品详情API接口，易贝API接口申请指南

Json实现根据商品ID请求微店商品详情数据方法，微店商品详情API接口，微店API接口申请指南

活跃用户

相关产品