数据集成 Data Integration的搜索结果_热门

掘数工

|

博文

|

本文主要介绍基于阿里云大数据组件服务，对企业进行大数据平台建设的架构实践。

# 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 数据管理 # 云原生大数据计算服务 MaxCompute # 对象存储 # 实时计算 Flink版 # 日志服务 # 存储 # 数据可视化 # 数据管理 # 大数据 # BI

游客e4ooen74o6ems

|

博文

|

来自：大数据与机器学习

阿里云开源利器：DataX3.0——高效稳定的离线数据同步解决方案

对于需要集成多个数据源进行大数据分析的场景，DataX3.0同样提供了有力的支持。企业可以使用DataX将多个数据源的数据集成到一个统一的数据存储系统中，以便进行后续的数据分析和挖掘工作。这种集成能力有助于提升数据分析的效率和准确性，为企业决策提供有力支持。

# 云原生大数据计算服务 MaxCompute # 数据集成 Data Integration # 监控 # 数据挖掘 # 大数据 # 关系型数据库 # DataX

何雨晨

|

博文

|

来自：大数据与机器学习

Apache Kafka + 向量数据库 + LLM = 实时 GenAI

生成式AI（GenAI）革新了企业架构，催生新数据集成模式与最佳实践。借助Apache Kafka与Apache Flink，企业能高效处理大规模实时数据，连接各类数据库与分析平台。Kafka作为核心组件，支持GenAI应用如服务台自动化、聊天机器人及内容审核。结合大型语言模型（LLM）、检索增强生成（RAG）与向量数据库，Kafka与Flink共同打造强大数据流处理能力，克服GenAI挑战，如昂贵训练成本、数据时效性与准确性。通过语义搜索与RAG设计模式，确保LLM生成内容可靠无误。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 云消息队列 Kafka 版 # 数据集成 Data Integration # 人工智能平台 PAI # 实时计算 Flink版 # 云数据库 MongoDB 版 # 消息中间件 # 人工智能 # Kafka # Apache # 数据库

灵杰开发者

|

博文

|

来自：大数据与机器学习

用实时计算释放当下企业大数据潜能

本文整理自阿里云高级产品解决方案架构师王启华（敖北）老师在 Flink Forward Asia 2023 中闭门会的分享。

# 云消息队列 Kafka 版 # 数据集成 Data Integration # 大数据开发治理平台 DataWorks # 云原生数据仓库 AnalyticDB PostgreSQL版 # 实时数仓 Hologres # 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 日志服务 # 云原生数据仓库AnalyticDB MySQL版 # 存储 # SQL # 大数据 # OLAP # 流计算

东方睿赢

|

博文

DataWorks不是Excel，它是一个数据集成和数据管理平台

【10月更文挑战第10天】随着大数据技术的发展，企业对数据处理的需求日益增长。阿里云推出的DataWorks是一款强大的数据集成和管理平台，提供从数据采集、清洗、加工到应用的一站式解决方案。本文通过电商平台案例，详细介绍了DataWorks的核心功能和优势，展示了如何高效处理大规模数据，帮助企业挖掘数据价值。

# 数据集成 Data Integration # 大数据开发治理平台 DataWorks # 数据管理 # 数据采集 # DataWorks # 数据管理 # 大数据 # 数据处理

技术小达人

|

9月前

|

博文

Flink CDC YAML：面向数据集成的 API 设计

# 数据集成 Data Integration # 实时计算 Flink版 # SQL # 人工智能 # 关系型数据库 # API # 流计算

实时数仓Hologres团队

|

9月前

|

博文

|

来自：大数据与机器学习

DataWorks数据集成同步至Hologres能力介绍

本文由DataWorks PD王喆分享，介绍DataWorks数据集成同步至Hologres的能力。DataWorks提供低成本、高效率的全场景数据同步方案，支持离线与实时同步。通过Serverless资源组，实现灵活付费与动态扩缩容，提升隔离性和安全性。文章还详细演示了MySQL和ClickHouse整库同步至Hologres的过程。

# 数据集成 Data Integration # 大数据开发治理平台 DataWorks # 实时数仓 Hologres # DataWorks # 关系型数据库 # Serverless # 调度 # 数据库

游客kufrkwrbkmpsa

|

9月前

|

博文

【YashanDB知识库】DataX迁移Hive到崖山分布式

本文来自YashanDB官网，介绍通过DataX将Hive数据迁移到YashanDB的实现方法。源环境为Hive 3.1.3，目标为YashanDB 23.2.3.100。文章提供了Hive与YashanDB的建表脚本、数据类型映射及DataX配置示例，包含reader和writer插件参数设置，并通过`datax.py`执行同步任务。内容详尽展示了数据迁移的全流程。

# 数据集成 Data Integration # SQL # DataX # HIVE # Python

刘大猫.

|

5月前

|

博文

|

来自：大数据与机器学习

springboot项目集成dolphinscheduler调度器实现datax数据同步任务

# 数据集成 Data Integration # Java # 关系型数据库 # MySQL # 调度 # DataX

云学习小组

|

博文

【直播回顾】21天搭建推荐系统：实现“千人千面”个性化推荐（含视频）

在4月27日2016云栖大会南京峰会上，阿里云算法专家、阿里云推荐引擎技术负责人郑重（卢梭）为大家分享了“21天搭建推荐系统”，这次分享得到了大家的积极反馈。因此，云栖社区邀请卢梭做客云栖社区，在6月16日晚8点在线再次分享《21天搭建推荐系统》。

# 云监控 # 云原生大数据计算服务 MaxCompute # 日志服务 # 数据集成 Data Integration # 分布式计算 # 监控 # 算法 # 搜索推荐 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据集成 Data Integration