数据湖构建的搜索结果_热门-阿里云开发者社区

云原生数据湖分析DLA

|

博文

一步即可！阿里云数据湖分析服务构建MySQL低成本分析方案

通过一键建湖能简单便捷的构建Mysql分析。它的特性是易用，分析能力强，成本极低，对源库影响很低。

# 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # SQL # 存储 # 分布式计算 # 关系型数据库 # MySQL # 数据挖掘 # 大数据 # 数据库 # HIVE # BI

游客vue2tkys3v2fi

|

12天前

|

博文

阿里云数据湖构建DLF完整对接指南：从元数据管理到多引擎集成实践

本文系统介绍了阿里云数据湖构建（DLF）的核心功能与对接使用方法。DLF作为全托管统一元数据管理平台，提供了元数据管理、权限控制、数据入湖、存储优化等核心能力。文章详细阐述了DLF的架构设计、Catalog/数据库/表的三层元数据模型，以及如何与EMR、Flink、MaxCompute、Hologres、DataWorks等主流计算引擎无缝对接。重点涵盖：DLF服务开通与角色授权、Catalog创建与配置、EMR集群切换DLF元数据的具体配置步骤、Flink通过DLF Catalog实现数据入湖的完整流程与代码示例、DataWorks数据集成同步至DLF的配置方法、MaxCompute湖仓一体

# 数据湖构建 # 数据管理 # 存储 # 分布式计算 # 数据管理 # MaxCompute # 流计算

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析，云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍，希望给想了解和实践数据湖架构的企业和朋友一个参考。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 数据安全中心 # 存储 # SQL # 分布式计算 # 运维 # 大数据 # Hadoop # 调度 # 对象存储 # 数据安全/隐私保护 # Spark

扬流

|

博文

|

来自：大数据与机器学习

数据湖架构及概念简介

本文整理自阿里云开源大数据技术专家陈鑫伟在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # Hadoop # 大数据 # 对象存储 # HIVE # Spark # 流计算

skin778

|

博文

|

来自：数据库

“数据湖”：概念、特征、架构与案例

作者：惊玄

# 云原生大数据计算服务 MaxCompute # 终端访问控制系统 # 日志服务 # 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 数据湖构建 # 数据管理 # 函数计算 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 对象存储 # 实时计算 Flink版 # 访问控制 # 存储 # SQL # 分布式计算 # 大数据 # 数据挖掘 # 数据处理 # 数据库 # 对象存储 # Spark # 流计算

扬流

|

博文

|

来自：大数据与机器学习

数据湖统一元数据与权限

本文整理自阿里云数据湖构建与分析研发熊佳树在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 数据管理 # 云原生数据仓库AnalyticDB MySQL版 # 表格存储 # SQL # 存储 # 分布式计算 # 大数据 # 数据管理 # API # 开发工具 # HIVE # 数据安全/隐私保护 # Spark

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

大数据&AI产品月刊【2023年3月】

大数据&AI产品技术月刊（2023年3月），涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据&AI方面最新动态。

# 云原生大数据计算服务 MaxCompute # 实时数仓 Hologres # 数据湖构建 # 人工智能平台 PAI # 开源大数据平台 E-MapReduce # 机器学习/深度学习 # 存储 # SQL # 人工智能 # JSON # 弹性计算 # 运维 # 算法 # 大数据 # 数据格式

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

官宣！阿里云重磅发布云原生数据湖体系

介绍如何基于阿里云 OSS 、JindoFS 和数据湖构建（Data Lake Formation，DLF）等基础服务，同时结合阿里云上丰富的计算引擎，打造一个全新云原生数据湖体系。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # 大数据 # Hadoop # 数据挖掘 # 对象存储 # Spark # 数据安全/隐私保护

扬流

|

博文

|

来自：大数据与机器学习

关于 Data Lake 的概念、架构与应用场景介绍

本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。

# 开源大数据平台 E-MapReduce # 数据管理 # 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 大数据开发治理平台 DataWorks # 云原生数据仓库AnalyticDB MySQL版 # 存储 # 数据采集 # 运维 # 分布式计算 # 大数据 # 数据管理 # MaxCompute # 对象存储 # 流计算 # 数据格式

云起实验室小助手

|

博文

数据湖构建DLF数据探索快速入门-淘宝用户行为分析

本教程通过使⽤数据湖构建（DLF）产品对于淘宝⽤户⾏为样例数据的分析，介绍DLF产品的数据发现和数据探索功能。教程内容包括：1. 服务开通：开通阿⾥云账号及DLF/OSS相关服务2. 样例数据集下载和导⼊：下载样例数据（csv⽂件），并上传⾄OSS3. DLF数据发现：使⽤DLF⾃动识别⽂件Schema并创建元数据表4. DLF数据探索：使⽤DLF数据探索，对⽤户⾏为进⾏分析，包括⽤户活跃度、漏⽃模型等

# 数据湖构建 # 对象存储 # SQL # 数据采集 # 数据挖掘 # 数据库 # 对象存储 # 存储 # 分布式计算 # 关系型数据库 # Spark # 数据格式

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据湖构建