开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks现在设置标准代码没有生成质量规则监控,那我想监控 sex 字段是否正常?

DataWorks现在设置标准代码没有生成质量规则监控,那我想监控 sex 字段是否正常,是不是只能如图操作了?image.png

展开
收起
夹心789 2024-06-11 22:24:12 41 0
8 条回答
写回答
取消 提交回答
  • 在DataWorks中,你可以设置数据质量规则来监控特定字段。例如,如果你想检查"sex"字段是否只包含特定的值(如"男"或"女"),你可以创建一个数据质量规则来实现这个目标。以下是如何创建这样一个规则的步骤:

    登录到DataWorks控制台。
    选择你的项目,然后点击左侧导航栏中的“数据质量”。
    在数据质量页面上,点击“新建规则”按钮。
    在新建规则对话框中,填写以下信息: 规则名称:例如,“性别字段校验”。 规则描述:例如,“确保性别字段只包含'男'或'女'”。 规则类型:选择“字段规则”。 表名:输入你要监控的表名。 字段名:输入你想要监控的字段名,即“sex”。 规则表达式:输入一个表达式来定义允许的值。例如,sex IN ('男', '女')。
    点击“确定”按钮以保存并启用新规则。
    现在,每当有新的数据写入该表时,DataWorks将自动检查"sex"字段是否符合你定义的规则。如果发现不符合规则的数据,你可以在DataWorks的数据质量报告中查看详细信息。

    2024-08-19 13:19:18
    赞同 展开评论 打赏
  • 深耕大数据和人工智能

    在DataWorks中,您可以使用数据质量规则来监控数据的完整性和准确性。要监控sex字段是否正常,您可以创建一个数据质量规则,检查该字段的值是否为预期的性别值(例如,“男”或“女”)。

    以下是如何在DataWorks中创建数据质量规则的步骤:

    登录到DataWorks控制台。
    在左侧导航栏中,选择数据开发 > 数据质量。
    点击新建规则按钮,进入规则配置页面。
    在规则配置页面中,填写以下信息:
    规则名称:例如,“检查性别字段”。
    规则描述:简要说明规则的目的,例如,“确保性别字段只包含'男'或'女'”。
    规则类型:选择“数据质量”。
    规则分类:选择一个合适的分类,例如,“数据完整性”。
    规则级别:选择适当的级别,例如,“严重”。
    在规则配置页面的SQL编辑器中,编写一个SQL查询来检查sex字段的值。例如:

    sql
    复制代码运行
    SELECT * FROM your_table_name
    WHERE sex NOT IN ('男', '女');

    点击保存按钮,完成规则创建。
    返回到数据质量页面,您可以看到新创建的规则。点击执行按钮,DataWorks将运行该规则并显示结果。如果有不符合预期的数据,您可以根据结果进行进一步的处理和修复。
    请注意,您需要根据实际情况替换上述示例中的表名和字段名。

    2024-08-19 09:06:37
    赞同 展开评论 打赏
  • 对,目前看只能手动弄了
    先看看需要定义什么样的数据被认为是“正常”的。例如,对于sex字段,您可能希望它只包含特定的值,如男和女。然后在DataWorks的数据质量管理模块中,创建一个新的数据质量规则。选择或创建适合您需求的规则模板,根据您对sex字段的定义,配置规则参数。例如,您可以设置规则以检查sex字段是否只包含允许的值
    然后点击应用规则就可以了

    2024-08-14 17:17:42
    赞同 展开评论 打赏
  • 技术浪潮涌向前,学习脚步永绵绵。

    如果你想在 DataWorks 中对特定字段(如 sex 字段)的数据质量进行监控,你可以采取以下几个步骤来实现这个目标:

    1. 定义质量规则

      • 在 DataWorks 中创建或选择一个数据开发项目。
      • 进入“数据管理”或“数据治理”模块。
      • 找到“数据质量”或类似的选项,并创建一个新的质量规则。
    2. 配置质量规则

      • sex 字段定义合适的质量规则。例如,你可以定义规则检查 sex 字段是否只包含预定义的值(如 'M'、'F' 或 'U' 表示未知)。
      • 设置阈值,比如规定至少95%的数据记录中的 sex 字段需要符合预期的值。
    3. 执行规则

      • 在 DataWorks 中调度规则执行。你可以选择一次性执行或者定期执行(比如每天执行一次)。
    4. 查看报告

      • 规则执行后,查看生成的质量报告。这将显示哪些数据不符合预期的规则。
    5. 设置告警

      • 如果发现质量问题,可以设置告警通知。这样一旦 sex 字段的数据质量低于设定的标准,系统就会发送邮件或短信通知相关人员。
        1111.png

    具体操作步骤可能因 DataWorks 的版本而异,但通常的流程是这样的:

    1. 进入数据质量管理界面

      • 登录 DataWorks 控制台。
      • 导航到数据质量管理部分。
    2. 创建质量规则

      • 点击创建新规则。
      • 选择要监控的表和字段。
      • sex 字段定义规则类型,例如“值检查”。
      • 设置期望的值范围,例如只允许 'M', 'F', 'U'。
      • 定义规则的阈值,比如 95% 的数据记录需要符合规则。
    3. 设置规则执行计划

      • 为规则设置执行计划,可以选择一次性执行或周期性执行。
      • 配置执行时间和频率。
    4. 配置告警

      • 为规则配置告警机制。
      • 设定告警触发条件,比如数据质量不达标时发送通知。
    5. 执行规则并查看结果

      • 启动规则执行。
      • 查看质量报告和告警通知。
    2024-08-14 16:59:48
    赞同 展开评论 打赏
  • 定义质量规则:首先,你需要定义什么样的数据被认为是"正常"的。对于 sex 字段,通常的规则可能包括:
    只包含预定义的值,例如 '男'、'女' 或 '未知'。
    字段不为空。
    字段值的格式符合预期(例如,如果是字符类型,长度应该一致)。
    编写脚本:在 DataWorks 中,你可以使用 SQL 脚本来检查数据质量。例如,你可以编写一个 SQL 脚本来检查 sex 字段是否只包含预定义的值:

    SELECT COUNT(*) AS error_count
    FROM your_table
    WHERE sex NOT IN ('男', '女', '未知');
    
    2024-08-14 15:52:08
    赞同 展开评论 打赏
  • 阿里云大降价~

    可以通过写sql的方式
    可以这样写:SELECT COUNT(*) FROM table_name WHERE sex NOT IN ('M', 'F') AND $[partitionExpression];
    这里,table_name需要替换为您的实际表名,$[partitionExpression]是可选的分区表达式,根据实际情况决定是否需要添加。

    其他方式就是API的添加了

    2024-08-14 13:56:08
    赞同 展开评论 打赏
  • 可以使用API调用CreateQualityRule
    接口,其中Property设置为sex。

    image.png

    ——参考链接

    2024-08-14 08:00:38
    赞同 1 展开评论 打赏
  • 测试没问题就可以用了。
    8a3d424029ff77a8d7e4b2d9e2404f0a_p807269.png
    单击测试运行,进入测试运行对话框。

    在测试运行对话框中,选择调度时间,单击测试运行。

    测试运行完成后,可根据界面指引,单击查看详情,查看测试结果。

    参考文档https://help.aliyun.com/zh/maxcompute/getting-started/configure-rules-to-monitor-data-quality?spm=a2c4g.11186623.0.i6

    2024-08-10 15:56:26
    赞同 展开评论 打赏
滑动查看更多

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多