开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks ODPS SQL任务中使用调度参数是什么?

DataWorks ODPS SQL任务中使用调度参数是什么?

展开
收起
真的很搞笑 2023-07-16 14:08:36 333 0
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在DataWorks中,ODPS SQL任务中使用调度参数是一种在任务调度过程中,动态传递参数并控制任务执行的方式。通过使用调度参数,可以在同一个任务中,根据不同的调度场景和需求,传递不同的参数值,以实现任务的灵活控制和定制化执行。

    调度参数可以在DataWorks任务的调度配置页面中进行设置,具体步骤如下:

    进入任务调度配置页面:在DataWorks控制台中,选择需要设置调度参数的ODPS SQL任务,在任务卡片右侧点击“进入”,进入任务的调度配置页面。

    设置调度参数:在任务调度配置页面中,可以看到任务的调度周期、调度时间和调度参数等信息。在“调度参数”栏中,可以设置任务需要传递的参数和对应的值。例如,设置参数名为“date”,参数值为“20220721”。

    在任务中使用调度参数:在ODPS SQL任务中,可以使用${param_name}的方式,引用调度参数的值。例如,在SQL语句中使用${date}引用调度参数“date”的值。在任务执行时,调度参数的值会被自动替换成指定的值。

    2023-07-21 20:07:38
    赞同 展开评论 打赏
  • 在DataWorks的ODPS SQL任务中,调度参数是一种用于在任务运行时传递参数值的机制。它允许你在调度任务时动态地设置特定的参数值,以满足不同场景下的需求。

    通过使用调度参数,可以实现以下目标:

    1. 灵活性:通过将参数值作为输入,可以根据需要在任务运行时动态调整行为或配置。这样就可以避免硬编码和修改任务代码,提高任务的灵活性和可维护性。

    2. 复用性:通过定义通用的任务模板并使用调度参数,可以在不同场景中多次重用相同的任务。只需在每次调度时设置不同的参数值,即可适应不同的环境和需求。

    3. 安全性:使用调度参数可以避免在任务代码中硬编码敏感信息,如密码、密钥等。而是通过参数进行传递,提供了更安全的方式来处理敏感数据。

    在DataWorks的ODPS SQL任务中,可以通过${param_name}的方式引用调度参数。具体步骤如下:

    1. 在SQL脚本中,将需要设置为调度参数的值替换为${param_name}。例如:
    SELECT *
    FROM your_table
    WHERE date = '${dt}';
    

    在以上示例中,'${dt}' 是一个调度参数,用于在运行任务时传递日期值。

    1. 在DataWorks中创建一个ODPS SQL任务,并在任务配置的右侧找到“调度参数”选项。点击“添加参数”按钮,输入参数名称(如dt)和初始值。

    2. 在调度任务时,可以为每次运行设置不同的参数值。在任务调度页面上,找到“调度参数”部分,并为每个参数指定对应的值。

    2023-07-18 14:25:20
    赞同 展开评论 打赏
  • 【调度参数分类】 根据调度参数能否在代码中直接使用可以分为:系统内置变量,自定义参数。 image.png

    • 系统内置变量可以在代码中直接使用,包括 unknown和unknown - 自定义参数需要在调度参数赋值处,给该变量赋值自定义参数后,在代码中调用变量名。(更多自定义参数取值方式请参考文档 调度参数自定义参数部分。)image.png
      --- 【调度参数unknown $[..]测试示例】 业务时间选择 2018-01-31 区分调度参数$[yyyymmdd] 与unknown 在调度时候的替换值 image.png
      --- 【测试调度参数赋值】image.png
      --- 【查看参数替换】image.png
      --- 【调度参数使用注意事项】 image.png
      --- 【注意】 - ”定时时间(中括号)”才可以取到具体的时间点(小时/分钟) - 界面直接点击"运行"需要手动给代码变量赋值。 - 若配置调度参数需要检验调度替换的值是否会符合预期,请选择数界面的开发环境冒烟测试。 - 修改过调度参数后请重新保存-提交-开发环境冒烟测试。 - 任务只有在生产环境才会被调度,所以调度参数只有生产环境调度运行后才会被替换 - 开发环境冒烟测试会生成实例!属于调度收费范畴。 --- 【高级运行/运行/开发环境冒烟测试逻辑说明】 - 运行:第一次运行后,您需要手动为该变量赋值常量,第一次赋值会被记录。如果对代码进行修改,该变量依旧使用第一次运行时的赋值。 - 高级运行:高级运行时,您需要手动为当前代码中的变量进行赋值常量,如果修改了代码中的变量,请使用高级运行给变量重新赋值常量。 - 开发环境执行冒烟测试:通过手动选择业务日期模拟节点自动调度的场景,获取当前业务日期下调度参数的替换值。 如果要修改参数赋值,请使用高级运行。 --- 【三种运行按钮关于变量赋值区别】 image.png
      --- 【PyODPS 2节点可以使用系统定义的调度参数和自定义参数:】 如果PyODPS 2使用系统定义的调度参数,可以直接在页面赋值。 image.png
      自定义参数需要使用args['参数名']的形式调用,例如print (args['ds']) -image.png
      -- 【调度参数配置案例】 >Q1:跨年跨月跨天跨小时跨分钟调度参数配置

      A1:调度参数配置:year=$[yyyy-15/24/60] month=$[yyyymm-15/24/60] day=$[yyyymmdd-15/24/60] hour=$[hh24-15/24/60] mi=$[mi-15/24/60]
      实现效果:
      定时时间为20210727000500的取到的调度参数如下
      SKYNET_PARAVALUE=year=2021 month=202107 day=20210726 hour=23 mi=50:
      定时时间为20210727003000取到的调度参数如下
      SKYNET_PARAVALUE=year=2021 month=202107 day=20210727 hour=00 mi=15:
      Q2:如何结合调度参数取上个月的最后一天 > >A2:相关语料“结合调度参数取上个月最后一天” > --- 【相关文档:】 - 调度参数配置 - DataWorks:通过业务时间维度来看自定义参数“[ ]”与“{ }”的区别

    【常用调度参数列表】假设定时时间是2022-10-01 00:10:59

    取昨天的年月日:arg=$[yyyymmdd-1] 或arg=$[yyyy-mm-dd-1]或arg=$[yyyy/mm/dd-1]等 调用unknown
    取昨天的年月日时分秒:返回值2022-09-31 00:10:59 需配置两个参数arg1=$[yyyymmdd-1] arg2=$[hh24:mi:ss] 调用'unknown unknown'
    取今天的年月日: arg=$[yyyymmdd]等
    取今天的年月日时分秒:返回值2022-10-01 00:10:59 配置两个参数arg1=$[yyyymmdd] arg2=$[hh24:mi:ss] 调用'unknown unknown'
    取15分钟前的年、月、日、小时、分钟:year=$[yyyy-15/24/60] month=$[yyyymm-15/24/60] day=$[yyyymmdd-15/24/60] hour=$[hh24-15/24/60] mi=$[mi-15/24/60]
    取1小时前的日、小时:day=$[yyyymmdd-1/24] hour=$[hh24-1/24]
    取昨天时间区间:beginDateTime=$[yyyymmdd-1]000000 endDateTime=$[yyyymmdd]000000
    取上一小时时间区间:beginDateTime=$[yyyymmddhh24-1/24]0000 endDateTime=$[yyyymmddhh24]0000
    ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-16 14:12:48
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载