大数据与机器学习-最热-阿里云开发者社区

灵杰开发者

|

11月前

|

人工智能算法搜索推荐

|

视频

三步搭建专属智能问答机器人

本视频介绍了怎么使用OpenSearch智能问答版搭建专属智能问答机器人。

39771 8 10

来自：智能搜索推荐版块

DataWorks@佳里

|

24天前

|

数据可视化架构师数据管理

|

视频

DataWorks Data Studio 数据开发

Data Studio是阿里巴巴基于15年大数据经验打造的智能湖仓一体数据开发平台，兼容阿里云多项计算服务，提供智能化ETL、数据目录管理及跨引擎工作流编排的产品能力。通过个人开发环境实例支持Python开发、Notebook分析与Git集成，Data Studio还支持丰富多样的插件生态，实现了实时离线一体化、湖仓一体化、大数据AI一体化，助力“Data+AI”全生命周期的数据管理。

3831 0 0

来自：大数据开发治理DataWorks 版块

DataWorks@佳里

|

1月前

|

SQL 分布式计算 DataWorks

|

博文

DataWorks智能交互式数据开发与分析之旅

本次实验将带您进行DataWorks Notebook的快速入门，包含：Notebook新建、多引擎SQL开发与分析、Python开发、交互式分析等，同时，使用DataWorks Copilot体验智能数据开发，体验智能交互式数据探索之旅。

2489 10 10

来自：大数据开发治理DataWorks 版块

guoweish

|

7月前

|

SQL 数据可视化 BI

|

视频

用DataV Atlas探索杭州美食

试用DataV Atlas可视化工具，打造出属于你的美食地图！DataV可视分析地图是阿里云面向地理空间数据的专业分析工具，能够帮助用户快速构建自己的地理分析地图，挖掘时空数据的价值，并支持商业决策和科学研究等领域的应用。本教程基于一份杭州的美食分布空间数据，引导用户一步一步熟悉产品的功能界面、SQL分析、可视化设置、作品分享等基础功能。

15777 3 4

来自：数据可视化DataV 版块

实时数仓Hologres团队

|

7月前

|

存储 SQL 消息中间件

|

博文

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

77823 27 43

来自：实时数仓 Hologres 版块

提个问题

|

9天前

|

搜索推荐算法机器学习/深度学习

|

问答

在海量用户中，将如何快速定位到目标人群进行个性化营销？

487 43 0

来自：人工智能平台PAI 版块

编程小石头

|

6月前

|

SQL XML JavaScript

|

博文

【若依Java】15分钟玩转若依二次开发，新手小白半小时实现前后端分离项目，springboot+vue3+Element Plus+vite实现Java项目和管理后台网站功能

摘要：本文档详细介绍了如何使用若依框架快速搭建一个基于SpringBoot和Vue3的前后端分离的Java管理后台。教程涵盖了技术点、准备工作、启动项目、自动生成代码、数据库配置、菜单管理、代码下载和导入、自定义主题样式、代码生成、启动Vue3项目、修改代码、以及对代码进行自定义和扩展，例如单表和主子表的代码生成、树形表的实现、商品列表和分类列表的改造等。整个过程详细地指导了如何从下载项目到配置数据库，再到生成Java和Vue3代码，最后实现前后端的运行和功能定制。此外，还提供了关于软件安装、环境变量配置和代码自动生成的注意事项。

5349 5 6

AI小怪兽

|

3月前

|

机器学习/深度学习人工智能文字识别

|

博文

ultralytics YOLO11 全新发布！（原理介绍+代码详见+结构框图）

本文详细介绍YOLO11，包括其全新特性、代码实现及结构框图，并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进，如C3k2、C2PSA模块和更轻量级的分类检测头，显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别，并展示了训练过程和结果的可视化

3472 0 0

实时数仓Hologres团队

|

3月前

|

存储 SQL 人工智能

|

博文

【云栖实录】Hologres3.0全新升级：一体化实时湖仓平台

2024年云栖大会，Hologres 3.0全新升级为一体化实时湖仓平台，通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+AI 一体，发布 Dynamic Table、External Database、分时弹性、Query Queue、NL2SQL 等众多新的产品能力，实现一份数据、一份计算、一份服务，极大提高数据开发及应用效率。同时，Hologres 的预付费实例年付折扣再降15%，仅需7折，不断帮助企业降低数据管理成本，赋能业务增长。

1477 2 2

来自：实时数仓 Hologres 版块

灵杰开发者

|

1月前

|

Cloud Native Apache 流计算

|

博文

资料合集｜Flink Forward Asia 2024 上海站

Apache Flink 年度技术盛会聚焦“回顾过去，展望未来”，涵盖流式湖仓、流批一体、Data+AI 等八大核心议题，近百家厂商参与，深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ，可在线阅读和下载。

5930 18 24

来自：实时计算 Flink 版块

Lwcah

|

8月前

|

算法

|

博文

【MATLAB】史上最全的11种数字信号滤波去噪算法全家桶

3417 0 0

灵杰开发者

|

3天前

|

SQL 监控关系型数据库

|

博文

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享，介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长，公司面临数据库性能瓶颈及实时数据处理需求，通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题，并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。

229 22 22

来自：实时计算 Flink 版块

nakansweath

|

8月前

|

存储缓存网络协议

|

博文

CDNJS/UNPKG/JSDelivr 太慢用不了，换成这些国内高速镜像

npm cdn, cdnjs, unpkg, jsdelivr, zstatic, zstatic.net, s4.zstatic.net

5302 4 4

3月前

|

视频

Flink Forward Asia 2024 上海站｜Apache Flink 的过去、现在及未来

作为 Apache Flink 社区备受期待的年度盛会之一，本届大会将于 11 月 29 至 30 日在上海隆重举行。Flink Forward Asia（以下简称FFA）是由 Apache 官方授权的 Apache Flink 社区官方技术大会，旨在汇聚领先的行业实践与技术动态。在众多合作伙伴的支持与技术开发者的协助下，FFA 已成功举办了六届。适逢 Apache Flink 诞生 10 周年，今年的 FFA 主论坛将与广大开发者分享 Flink 过去十年在技术和生态方面的演进历程及关键成果。同时，基于当前 AI 时代的新场景，展望未来十年 Flink 的发展方向和规划。大会还将为您提供全面了解 Flink 2.0 版本的机会，并与业界领袖共同探讨 Apache Flink 的过去、现在及未来，以及其在实际应用中的潜力。快来预约主论坛直播，享受大数据技术盛宴～讲师/嘉宾简介

23374 0 1

来自：实时计算 Flink 版块

kng32f3vbngrm

|

8月前

|

Ubuntu Linux

|

博文

Ubuntu 报错：System has not been booted with systemd as init system (PID 1). Can‘t operate.

系统未使用 `systemd` 初始化导致错误。解决方法是通过 `apt` 安装。首先备份并更换`sources.list`，添加阿里云镜像源，然后更新源并以管理员权限运行 `apt-get install systemd -y` 和 `apt-get install systemctl -y` 安装所需组件。

3621 3 3

Java开发者

|

3月前

|

IDE Java 编译器

|

博文

Java“找不到符号” 错误怎么查找解决

“找不到符号”是Java编程中常见的编译错误，通常表明代码试图访问未声明或不可见的符号（如类、方法或变量）。解决此问题需检查拼写、导入包是否正确及作用域是否合适。确保使用正确的类路径和库，可有效避免此类错误。若问题依旧，查阅官方文档或使用调试工具定位错误亦为良策。

2974 10 10

灵杰开发者

|

12天前

|

SQL 存储 Apache

|

博文

基于 Flink 进行增量批计算的探索与实践

本文整理自阿里云高级技术专家、Apache Flink PMC朱翥老师在Flink Forward Asia 2024的分享，内容分为三部分：背景介绍、工作介绍和总结展望。首先介绍了增量计算的定义及其与批计算、流计算的区别，阐述了增量计算的优势及典型需求场景，并解释了为何选择Flink进行增量计算。其次，详细描述了当前的工作进展，包括增量计算流程、执行计划生成、控制消费数据量级及执行进度记录恢复等关键技术点。最后，展示了增量计算的简单示例、性能测评结果，并对未来工作进行了规划。

418 5 6

来自：实时计算 Flink 版块

灵杰开发者

|

1月前

|

存储消息中间件 Kafka

|

博文

Fluss：面向实时分析设计的下一代流存储

本文整理自阿里云智能 Flink SQL和数据通道负责人、Apache Flink PMC 伍翀（花名：云邪）老师，在 Flink Forward Asia 2024 主会场的分享。主要分享了一种专为流分析设计的新一代存储解决方案——Fluss，并由阿里巴巴开源委员会副主席王峰先生，在 FFA 2024 现场进行了 Fluss 项目的开源。

502 7 7

来自：实时计算 Flink 版块

羊羊好运连连

|

1月前

|

问答

阿里云大学生300优惠券可以用于哪些产品

359 1 1

daniel_2000

|

3月前

|

并行计算 PyTorch 编译器

|

博文

pytorch 安装 + 搭配PyCharm

pytorch + pycharm

927 1 1

jianz123

|

5月前

|

应用服务中间件 Shell 网络安全

|

博文

nginx安装提示 libssl.so.3: cannot open shared object file: No

【8月更文挑战第1天】### 原因未将安装的ssl中的`libssl.so.3`链接到`/usr/lib`导致缺失。 ### 解决方案 1. 检查openssl是否已安装，若为低版本则需重装。 ```sh whereis openssl

2649 6 6

灵杰开发者

|

5天前

|

消息中间件关系型数据库 MySQL

|

博文

Flink CDC 在阿里云实时计算Flink版的云上实践

本文整理自阿里云高级开发工程师阮航在Flink Forward Asia 2024的分享，重点介绍了Flink CDC与实时计算Flink的集成、CDC YAML的核心功能及应用场景。主要内容包括：Flink CDC的发展及其在流批数据处理中的作用；CDC YAML支持的同步链路、Transform和Route功能、丰富的监控指标；典型应用场景如整库同步、Binlog原始数据同步、分库分表同步等；并通过两个Demo展示了MySQL整库同步到Paimon和Binlog同步到Kafka的过程。最后，介绍了未来规划，如脏数据处理、数据限流及扩展数据源支持。

110 0 0

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

12天前

|

人工智能分布式计算 DataWorks

|

博文

大数据& AI 产品月刊【2024年12月】

大数据& AI 产品技术月刊【2024年12月】，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

169 15 15

AI小怪兽

|

3月前

|

机器学习/深度学习数据可视化自动驾驶

|

博文

YOLO11-seg分割如何训练自己的数据集（道路缺陷）

本文介绍了如何使用自己的道路缺陷数据集训练YOLOv11-seg模型，涵盖数据集准备、模型配置、训练过程及结果可视化。数据集包含4029张图像，分为训练、验证和测试集。训练后，模型在Mask mAP50指标上达到0.673，展示了良好的分割性能。

1535 4 4

灵杰开发者

|

9天前

|

消息中间件存储 Kafka

|

博文

Fluss: First Impression

本文由Flink PMC Member徐榜江翻译自Yaroslav Tkachenko的文章《Fluss: First Impression》，介绍了阿里巴巴开源的新一代流存储系统Fluss。文章分为七个部分，涵盖Fluss简介、Table作为核心概念、PrimaryKey Table、一体化集成、Flink SQL的Delta Join、Fluss实现细节及总结。Fluss通过表结构组织数据流，支持主键表和高效的点查，深度集成LakeHouse，并计划与Flink深度集成，提供实时数据分析能力。

230 13 13

来自：实时计算 Flink 版块

blackswan_xdu-25928

|

7月前

|

自然语言处理监控并行计算

|

博文

Qwen2大模型微调入门实战（完整代码）

该教程介绍了如何使用Qwen2，一个由阿里云通义实验室研发的开源大语言模型，进行指令微调以实现文本分类。微调是通过在（指令，输出）数据集上训练来改善LLMs理解人类指令的能力。教程中，使用Qwen2-1.5B-Instruct模型在zh_cls_fudan_news数据集上进行微调，并借助SwanLab进行监控和可视化。环境要求Python 3.8+和英伟达显卡。步骤包括安装所需库、准备数据、加载模型、配置训练可视化工具及运行完整代码。训练完成后，展示了一些示例以验证模型性能。相关资源链接也一并提供。

6810 5 16

ly~

|

3月前

|

消息中间件存储数据库连接

|

博文

RocketMQ 消息的重试机制是怎样的？

RocketMQ的消息重试机制确保消息消费失败时能自动重试，直至成功。默认重试16次，时间间隔逐次翻倍，从10秒至数分钟不等。重试在同组内不同消费者间进行，由异常抛出或特定状态返回触发。支持自定义重试次数与时间间隔，建议合理配置避免无限重试，保障系统稳定性和性能。

1539 2 2

星河造梦坊丨程序开发

|

5月前

|

缓存 Shell 开发工具

|

博文

Git Bash⭐一、安装软件，与Git Bash基础命令

278 4 4

灵杰开发者

|

2月前

|

存储分布式计算流计算

|

博文

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括：Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎，通过向量化技术和 C++ 实现，大幅提升了性能和成本效益。

1544 73 74

来自：实时计算 Flink 版块

郑小健

|

5月前

|

机器学习/深度学习并行计算 PyTorch

|

博文

ONNX 优化技巧：加速模型推理

【8月更文第27天】ONNX (Open Neural Network Exchange) 是一个开放格式，用于表示机器学习模型，使模型能够在多种框架之间进行转换。ONNX Runtime (ORT) 是一个高效的推理引擎，旨在加速模型的部署。本文将介绍如何使用 ONNX Runtime 和相关工具来优化模型的推理速度和资源消耗。

2419 4 6

阿里云大数据Al技术

|

2月前

|

人工智能边缘计算自然语言处理

|

博文

DistilQwen2：通义千问大模型的知识蒸馏实践

DistilQwen2 是基于 Qwen2大模型，通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。本文将介绍DistilQwen2 的技术原理、效果评测，以及DistilQwen2 在阿里云人工智能平台 PAI 上的使用方法，和在各开源社区的下载使用教程。

865 6 6

来自：人工智能平台PAI 版块

Deephub

|

4月前

|

存储人工智能搜索推荐

|

博文

RAG系统的7个检索指标：信息检索任务准确性评估指南

大型语言模型（LLMs）在生成式AI领域备受关注，但其知识局限性和幻觉问题仍具挑战。检索增强生成（RAG）通过引入外部知识和上下文，有效解决了这些问题，并成为2024年最具影响力的AI技术之一。RAG评估需超越简单的实现方式，建立有效的性能度量标准。本文重点讨论了七个核心检索指标，包括准确率、精确率、召回率、F1分数、平均倒数排名（MRR）、平均精确率均值（MAP）和归一化折损累积增益（nDCG），为评估和优化RAG系统提供了重要依据。这些指标不仅在RAG中发挥作用，还广泛应用于搜索引擎、电子商务、推荐系统等领域。

1229 1 2

想飞的雪糕

|

2月前

|

机器学习/深度学习自然语言处理前端开发

|

博文

前端神经网络入门：Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速

本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络，包括前馈神经网络（FFNN）、深度神经网络（DNN）和循环神经网络（RNN）。通过简单的示例和代码，帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景，并简要介绍了卷积神经网络（CNN）的替代方案。

323 1 1

郑小健

|

5月前

|

存储 Ubuntu 搜索推荐

|

博文

构建多用户的 Jupyter 服务器 —— 利用 JupyterHub

【8月更文第29天】**摘要** JupyterHub 是一个易于使用的、可伸缩的、多用户的 Jupyter Notebook 服务器。它允许您在一个集中式服务器上托管多个独立的 Jupyter Notebook 会话，非常适合团队协作和教学环境。本文将详细介绍如何安装和配置 JupyterHub，以及如何利用它来构建一个多用户 Jupyter 服务器环境。

1665 0 0

金熙盛

|

12月前

|

问答

幻兽帕鲁服务器搭建

3455 4 8

已解决

阿里云大数据Al技术

|

26天前

|

存储人工智能数据库

|

博文

面向医疗场景的大模型 RAG 检索增强解决方案

本方案为您介绍，如何使用人工智能平台 PAI 构建面向医疗场景的大模型 RAG 检索增强解决方案。

318 19 20

来自：人工智能平台PAI 版块

五维空间s

|

24天前

|

应用服务中间件 Linux 网络安全

|

博文

nginx安装部署ssl证书，同时支持http与https方式访问

为了使HTTP服务支持HTTPS访问，需生成并安装SSL证书，并确保Nginx支持SSL模块。首先，在`/usr/local/nginx`目录下生成RSA密钥、证书申请文件及自签名证书。接着，确认Nginx已安装SSL模块，若未安装则重新编译Nginx加入该模块。最后，编辑`nginx.conf`配置文件，启用并配置HTTPS服务器部分，指定证书路径和监听端口（如20000），保存后重启Nginx完成部署。

299 7 9

嘟嘟嘟嘟嘟嘟

|

7月前

|

存储缓存 DataWorks

|

博文

DataWorks操作报错合集之配置项目连通oss数据源 , 报The request signature we calculated does not match the signature you provided.如何解决

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

1169 3 3

来自：大数据开发治理DataWorks 版块

DataWorks@佳里

|

2月前

|

SQL 人工智能 DataWorks

|

博文

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展，包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率，助力企业实现数据价值最大化和智能化转型。

674 5 5

来自：大数据开发治理DataWorks 版块

阿里云大数据Al技术

|

8月前

|

JSON 自然语言处理对象存储

|

博文

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

63097 7 9

来自：人工智能平台PAI 版块

91HTTP代理

|

10天前

|

缓存监控负载均衡

|

博文

HTTP代理配置中的常见错误及其解决方案

随着互联网发展，使用HTTP动态代理IP的需求日益增加。配置HTTP代理时常见问题及解决方法包括：1) 代理服务器无法连接：检查网络、防火墙和代理服务状态；2) 认证失败：确认凭据和配置；3) 请求超时：增加超时时间、检查后端服务和网络延迟；4) 缓存问题：清理缓存、设置缓存控制或禁用缓存；5) SSL/TLS问题：正确配置证书并确保客户端信任；6) 访问控制问题：检查ACL和日志；7) 性能问题：监控资源、负载均衡和优化配置；8) 日志记录与分析问题：启用详细日志、设置轮换策略和使用分析工具。通过解决这些问题，可以更有效地管理HTTP代理。

115 13 13

来自：大数据计算 MaxCompute 版块

hannahc001

|

5月前

|

人工智能数据可视化数据处理

|

博文

Flink CDC 3.0 正式发布，详细解读新一代实时数据集成框架

Flink CDC 于 2023 年 12 月 7 日重磅推出了其全新的 3.0 版本 ~

106051 8 10

来自：实时计算 Flink 版块

一只笨鼠

|

24天前

|

存储监控数据可视化

|

博文

常见的分布式定时任务调度框架

分布式定时任务调度框架用于在分布式系统中管理和调度定时任务，确保任务按预定时间和频率执行。其核心概念包括Job（任务）、Trigger（触发器）、Executor（执行器）和Scheduler（调度器）。这类框架应具备任务管理、任务监控、良好的可扩展性和高可用性等功能。常用的Java生态中的分布式任务调度框架有Quartz Scheduler、ElasticJob和XXL-JOB。

328 66 66

想飞的雪糕

|

3月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

前端大模型入门（三）：编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

本文介绍了大规模语言模型（LLM）中的两个核心概念：Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID，而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法，帮助读者理解其基本原理和应用场景。

803 1 1

kng32f3vbngrm

|

8月前

|

存储数据挖掘大数据

|

博文

大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】

数据仓库建模是组织和设计数据以支持数据分析的过程，包括ER模型和维度建模。ER模型通过实体和关系描述数据结构，遵循三范式减少冗余。维度建模，特别是Kimball方法，用于数据仓库设计，便于分析和报告。事实表存储业务度量，如销售数据，分为累积、快照、事务和周期性快照类型。维度表提供描述性信息，如时间、产品、地点和客户详情。数仓通常分层为ODS(源数据)、DWD(明细数据)、DIM(公共维度)、DWS(数据汇总)和ADS(应用数据)，以优化数据管理、质量、查询性能和适应性。

2166 3 3

游客yoh4w6jvuxebs

|

3月前

|

iOS开发 MacOS Windows

|

博文

Axure下载及汉化激活

Axure RP 9 的下载、汉化及激活方法。首先从官网下载并安装最新版 Axure RP 9，然后下载并解压语言包，将「lang」文件夹复制到 Axure 安装目录中。Windows 系统路径为 `c://Program Files/Axure/Axure RP 9.0/` 或 `c://Program Files (x86)/Axure/Axure RP 9.0/`，macOS 系统需通过“显示包内容”操作进行粘贴。最后使用提供的激活码完成激活。

590 0 0

ly~

|

3月前

|

供应链监控搜索推荐

|

博文

大数据的应用场景

大数据在众多行业中的应用场景广泛，涵盖金融、零售、医疗保健、交通物流、制造、能源、政府公共服务及教育等领域。在金融行业，大数据用于风险评估、精准营销、反欺诈以及决策支持；零售业则应用于商品推荐、供应链管理和门店运营优化等；医疗保健领域利用大数据进行疾病预测、辅助诊断和医疗质量评估；交通物流业通过大数据优化物流配送、交通管理和运输安全；制造业则在生产过程优化、设备维护和供应链协同方面受益；能源行业运用大数据提升智能电网管理和能源勘探效率；政府和公共服务部门借助大数据改善城市管理、政务服务及公共安全；教育行业通过大数据实现个性化学习和资源优化配置；体育娱乐业则利用大数据提升赛事分析和娱乐制作水平。

977 2 2

1442573646622176

|

3月前

|

数据采集存储数据处理

|

博文

数据治理：如何制定数据标准与规范

在当今这个数据驱动的时代，数据已成为企业最宝贵的资产之一。然而，随着数据量的爆炸性增长和数据来源的多样化，如何有效地管理和利用这些数据成为了企业面临的重大挑战。数据治理作为确保数据质量、安全性、合规性和可访问性的关键过程，其核心在于制定并执行一套科学、合理的数据标准与规范。本文将探讨如何制定数据标准与规范，以推动企业的数据治理实践。

926 3 3

Echo_Wish

|

26天前

|

机器学习/深度学习监控算法

|

博文

机器学习在图像识别中的应用：解锁视觉世界的钥匙

323 95 96

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

三步搭建专属智能问答机器人

DataWorks Data Studio 数据开发

DataWorks智能交互式数据开发与分析之旅

用DataV Atlas探索杭州美食

Hologres+Flink企业级实时数仓核心能力介绍

在海量用户中，将如何快速定位到目标人群进行个性化营销？

【若依Java】15分钟玩转若依二次开发，新手小白半小时实现前后端分离项目，springboot+vue3+Element Plus+vite实现Java项目和管理后台网站功能

ultralytics YOLO11 全新发布！（原理介绍+代码详见+结构框图）

【云栖实录】Hologres3.0全新升级：一体化实时湖仓平台

资料合集｜Flink Forward Asia 2024 上海站

【MATLAB】史上最全的11种数字信号滤波去噪算法全家桶

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

CDNJS/UNPKG/JSDelivr 太慢用不了，换成这些国内高速镜像

Flink Forward Asia 2024 上海站｜Apache Flink 的过去、现在及未来

Ubuntu 报错：System has not been booted with systemd as init system (PID 1). Can‘t operate.

Java“找不到符号” 错误怎么查找解决

基于 Flink 进行增量批计算的探索与实践

Fluss：面向实时分析设计的下一代流存储

阿里云大学生300优惠券可以用于哪些产品

pytorch 安装 + 搭配PyCharm

nginx安装提示 libssl.so.3: cannot open shared object file: No

Flink CDC 在阿里云实时计算Flink版的云上实践

大数据& AI 产品月刊【2024年12月】

YOLO11-seg分割如何训练自己的数据集（道路缺陷）

Fluss: First Impression

Qwen2大模型微调入门实战（完整代码）

RocketMQ 消息的重试机制是怎样的？

Git Bash⭐一、安装软件，与Git Bash基础命令

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

ONNX 优化技巧：加速模型推理

DistilQwen2：通义千问大模型的知识蒸馏实践

RAG系统的7个检索指标：信息检索任务准确性评估指南

前端神经网络入门：Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速

构建多用户的 Jupyter 服务器 —— 利用 JupyterHub

幻兽帕鲁服务器搭建

面向医疗场景的大模型 RAG 检索增强解决方案

nginx安装部署ssl证书，同时支持http与https方式访问

DataWorks操作报错合集之配置项目连通oss数据源 , 报The request signature we calculated does not match the signature you provided.如何解决

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

通义千问开源模型在PAI灵骏的最佳实践

HTTP代理配置中的常见错误及其解决方案

推荐2款免费开源的标注工具，支持大模型对话标注

Flink CDC 3.0 正式发布，详细解读新一代实时数据集成框架

常见的分布式定时任务调度框架

前端大模型入门（三）：编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】

Axure下载及汉化激活

大数据的应用场景

数据治理：如何制定数据标准与规范

机器学习在图像识别中的应用：解锁视觉世界的钥匙

大数据与机器学习

活跃用户

相关产品