开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks PyODPS execute_sql DataFrame?

DataWorks PyODPS execute_sql DataFrame?

展开
收起
真的很搞笑 2023-08-17 07:45:28 138 0
1 条回答
写回答
取消 提交回答
  • 在 DataWorks 中,PyODPS 的 execute_sql 方法可以用于执行 SQL 语句并返回 DataFrame 对象。以下是使用 execute_sql 方法执行 SQL 语句并返回 DataFrame 对象的示例:

    import dataworks_pyodps as odps

    创建一个 DataFrame 对象

    df = odps.DataFrame([['col1', 'col2'], ['a', 'b']])

    执行 SQL 语句并返回 DataFrame 对象

    result = odps.execute_sql(
    'SELECT * FROM {}'.format(df.name)
    )
    执行上述代码后,会返回一个 DataFrame 对象,包含以下内容:

    col1 col2
    a b
    PyODPS 的 execute_sql 方法可以接受多个参数。除了 SQL 语句之外,还可以指定以下参数:

    job_id: 指定任务的 ID。如果未指定,则会创建一个新的任务。
    output_path: 指定输出数据的路径。如果未指定,则会将输出数据保存到当前工作目录。
    parameters: 指定额外的参数。
    更多关于 execute_sql 方法的使用方法,请参考 官方文档.

    2023-09-28 10:39:35
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载