开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

大数据计算MaxCompute odps sql 怎么实现递归查询?

大数据计算MaxCompute odps sql 怎么实现递归查询?

展开
收起
真的很搞笑 2023-10-29 19:21:39 341 0
4 条回答
写回答
取消 提交回答
  • 在MaxCompute中,可以使用递归查询来处理复杂的数据关系。递归查询是一种将一个查询结果作为另一个查询的输入的方法,直到满足某个终止条件为止。

    以下是使用递归查询的基本步骤:

    1. 定义递归查询的基础情况(base case):这是递归查询结束的条件,当满足这个条件时,递归查询将停止执行。

    2. 定义递归查询的递归情况(recursive case):这是递归查询的主体部分,它将根据基础情况的结果进行计算。

    3. 编写SQL语句并使用WITH RECURSIVE子句来实现递归查询。

    以下是一个示例,假设我们有一个员工表(employee),每个员工都有一个上级(manager_id)。我们想要找出所有员工的上级,以及他们的上级,以此类推,直到没有上级为止。

    WITH RECURSIVE employee_hierarchy AS (
        SELECT id, manager_id
        FROM employee
        WHERE manager_id IS NULL -- 基础情况:没有上级的员工
        UNION ALL
        SELECT e.id, e.manager_id
        FROM employee e
        INNER JOIN employee_hierarchy eh ON e.manager_id = eh.id -- 递归情况:查找每个员工的上级
    )
    SELECT * FROM employee_hierarchy;
    

    在这个示例中,我们首先定义了基础情况,即没有上级的员工。然后,我们定义了递归情况,即查找每个员工的上级。最后,我们将这两个部分组合在一起,得到了整个员工层次结构。

    2023-10-31 15:44:39
    赞同 展开评论 打赏
  • 在MaxCompute ODPS SQL中,不支持直接的递归查询。但是,你可以通过使用CTE(Common Table Expression)或者WITH RECURSIVE语句来实现类似的效果。

    以下是一个使用CTE的示例:

    WITH RECURSIVE tree(id, parent_id) AS (
        SELECT id, parent_id
        FROM table_name
        UNION ALL
        SELECT child.id, child.parent_id
        FROM tree
        JOIN table_name child ON child.parent_id = tree.id
    )
    SELECT * FROM tree;
    

    在这个示例中,我们首先定义了一个名为treeCTE,它包含了idparent_id两个字段。然后,我们在CTE的定义中使用了UNION ALL语句来联合所有满足条件的记录,以及它们的子记录的记录。最后,我们从CTE中选择所有的记录。

    2023-10-30 14:46:22
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在大数据计算MaxCompute (原名 ODPS) 中,可以通过递归查询 (Recursive Query) 来实现 SQL 中的多层递归。以下是使用递归查询的基本语法:

    WITH RECURSIVE [recursive_table_name] AS (
        -- 基础查询,返回初始行集
        SELECT ...
        UNION ALL
        -- 迭代查询,通过关联基础查询的结果产生新的行集,并与基础查询进行合并
        SELECT ...
    )
    SELECT * FROM [recursive_table_name];
    

    在这个语法中,首先定义了一个名为 recursive_table_name 的临时表,其中包含了两个部分:基础查询和迭代查询。
    基础查询返回了初始行集,这是递归查询的第一步。然后,迭代查询通过关联基础查询的结果产生新的行集,并将其与基础查询进行合并,从而产生了更多的行。
    最后,我们从 recursive_table_name 表中选择所有的行并输出结果。
    下面是一个具体的例子,假设我们有一个员工表 employees,其中包含了每个员工的名字以及他们的直接上级的名字:

    +----+-------+
    | id | name  |
    +----+-------+
    | 1  | John  |
    | 2  | Mike  |
    | 3  | Lucy  |
    | 4  | Lily  |
    +----+-------+
    
    +----+---------+
    | id | manager |
    +----+---------+
    | 1  | NULL    |
    | 2  | 1       |
    | 3  | 1       |
    | 4  | 3       |
    +----+---------+
    

    如果我们想要找出所有员工的所有上级,则可以使用如下的递归查询:

    WITH RECURSIVE employee_hierarchy AS (
        SELECT e.id, e.name, m.manager, 'level 1' as level
        FROM employees e LEFT JOIN employees m ON e.manager = m.id
        WHERE e.manager IS NOT NULL
        UNION ALL
        SELECT h.id, h.name, m.manager, CONCAT('level ', CAST(l.level + 1 AS STRING)) as level
        FROM employee_hierarchy h LEFT JOIN employees m ON h.manager = m.id
        WHERE m.manager IS NOT NULL
    )
    SELECT * FROM employee_hierarchy;
    

    在这个查询中,我们首先选择了所有的员工及其直接上级,并标记为第一级。然后,我们在迭代查询中选择了所有已经找到的员工的上级,并将它们标记为更高一级。这个过程一直持续到没有更多的上级为止。最终,我们从 employee_hierarchy 表中选择所有的行并输出结果:

    +----+------+---------+--------+
    | id | name | manager | level  |
    +----+------+---------+--------+
    | 2  | Mike | 1       | level 1|
    | 3  | Lucy | 1       | level 1|
    | 4  | Lily | 3       | level 1|
    | 1  | John | NULL    | level 2|
    +----+------+---------+--------+
    

    注意,在实际的应用场景中,可能需要根据具体的需求调整基础查询和迭代查询的具体内容,以便生成正确的结果。

    2023-10-30 10:35:45
    赞同 展开评论 打赏
  • cte,用pyodps调用递归函数吧 ,此回答整理自钉群“MaxCompute开发者社区2群”

    2023-10-29 23:53:04
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    SQL Server 2017 立即下载
    GeoMesa on Spark SQL 立即下载
    原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载