备案控制台

开发者社区> 问答> 正文

使用 UDJ 自定义SQL的Join操作是什么？

使用 UDJ 自定义SQL的Join操作是什么？

展开

收起

芯在这 2021-12-12 23:31:00 488 0

1 条回答

写回答

取消提交回答

真的很搞笑

广义上我们通常用UDF（User Defined Function）来描述用户代码框架。现有的UDF/UDTF/UDAF接口主要是针对在单个数据表上的操作而设计。但是一旦涉及多表的用户自定义操作，用户经常需要依赖于内置join + 各种UDF/UDTF, 并且配合比较复杂的SQL语句来完成。甚至在一些多表操作的场景上，用户不得不放弃SQL而转向传统的完全自定义MR，才能完成所需的计算。

这两种方式对于用户的门槛都比较高。而且对于计算平台而言，多个复杂的join和散布在SQL语言各处的用户代码揉合在一起，带来的是多处的“逻辑黑盒”，并不利于产生最优的执行计划。而使用MR，不仅更大程度上剥夺了系统进行执行优化的可能性，而且由于MR绝大部分代码由Java完成，在执行效率上会远低于MaxCompute基于LLVM 代码生成器产生的深度优化native运行时。

MaxCompute 2.0的全面上线，为计算平台框架的发展提供了更大的灵活度，在这个基础上，我们提出了建设NewSQL生态的目标。NewSQL通过一个扩展的SQL框架，让用户能使用描述性的语言表达其主体逻辑流程，而仅在与分布系统执行流程无关的地方，才引入用户代码。这样的设计，能让用户对计算逻辑从“HOW”（怎样具体完成一个分布式计算流程），转变成“WHAT”（用户从逻辑上描述其想完成的事情和数据操作）。这样的转变，能让用户把更多的精力集中在“WHAT”上面，优化自己的商业处理逻辑上，而把“HOW”交给计算平台，让计算平台进行复杂的系统优化，产生最优的执行计划来完成具体流程。

在这个大背景下，我们在UDF框架中引入了UDJ这种全新的，针对多表数据操作的扩展机制。希望借由这种新的机制，减少用户之前不得不通过MR等方式对分布式系统底层细节的操作，从而达到用户可用性以及系统优化的双赢。

2021-12-12 23:31:25

赞同展开评论打赏

问答分类：

SQL

问答标签：

自定义SQL SQL JOIN SQL自定义 SQL操作自定义SQL join

问答地址：

开发者社区 > 数据库 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

既然自定义SQL能实现多表关联，为什么还单独提供一个模块支持手工关联操作？

22

0

0

MaxCompute SQL中使用left join和使用inner join的结果相同

26

1

0

使用自定义SQL写Where过滤条件进行DTS同步链路的数据过滤时是否支持多表Join的SQL

31

1

0

自定义SQL的时候，只能对一张表进行操作，还是可以对多张表进行操作关联？

13

0

0

如何配置和使用自定义的 Maven 插件 mybatis-sql-scan 来扫描 SQL？

23

1

0

如何使用dataworks完成自定义SQL在mc中提取数据写入到holo内？

56

12

0

MaxCompute SQL报错Hash Join Cursor HashJoin1#0 sm...

50

1

0

DataWorks数据集成模块，MySQL的数据同步可以按照脚本模式自定义sql来进行数据继承吗？

55

1

0

DataWorks数据质量的自定义sql如何传分区参数进去？

38

1

0

DataWorks数据质量自定义sql，这里的采样值一直为0，想问下什么原因？

36

0

0

问答排行榜

最热

最新

1 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818758

2 据说在家办公的程序员是这样写代码的？ 1792775

3 阿里云开放端口权限 690123

4 如何升级配置 536198

5 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522667

6 【精品问答】python技术1000问(1) 514070

7 Flink Forward Asia 2021 有奖问答 512865

8 OceanBase 使用动画（持续更新） 359333

9 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329774

10 OSS存储服务-客户端工具 321478

11 为体验实验室取一个新名字。 307410

12 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 304003

13 Win Server 2003-2016 加密勒索事件必打补丁合集 295276

14 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 284061

15 安全组详解，新手必看教程 277311

16 写code还是做管理，开发者如何进行职业规划？ 268887

17 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255861

18 阿里云手机和阿云浏览器连接问题专帖 235670

19 请问阿里云邮箱如何开启SMTP服务啊！ 225775

20 一个备案号，如何备案多个域名？ 223605

1 我在云栖做动手，一起参与吗？ 460

2 99元云服务器，你最pick哪种新玩法？ 2743

3 全天候24小时无所不知AI助手是如何炼成的？ 1403

4 阿里云百炼的data = json.loads(json_string)是什么意思呀？ 333

5 modelscope-funasr的FunClip怎么安装的？ 328

6 在钉钉中自定义机器人发送消息返回，这个限流是企业级别的还是机器人的？ 375

7 部署了Nacos2.4.0，开启鉴权，用管理员账号，修密码，就报401错误，啥原因呀？ 340

8 使用无影云电脑玩黑神话悟空，Mac笔记本可以吗？ 456

9 Nacos 配置鉴权后，用户就变成这个了，unknown user!为什么？ 292

10 快速开始nacos时遇到的，这是什么原因？ 436

11 k8s集群nacos2.2.3升级到nacos2.4.1方法？ 404

12 nacos2.4.1版本，客户端可以正常连接，但是服务列表没有服务。这是为什么？ 519

13 nacos开启鉴权后是只影响管理台操作的鉴权吗？客户端获取配置时候是否也需要鉴权？ 242

14 加载nacos配置时，偶尔会返回 user not found! 这个错误是什么引起的？ 289

15 nacos从2.3.1升级到2.4.1后，服务列表菜单不显示注册服务，接口报错503为什么？ 296

16 Nacos Jraft 任意文件读写漏洞怎么解决？ 641

17 nacos升级到2.4.1 maven依赖服务注册服务发现改为什么版本？ 471

18 nacos2.4.1与他俩的版本兼容吗？ 409

19 在Nacos中，本地缓存怎么关闭？ 198

20 nacos2.4.1应使用哪个版本的maven搭配jdk哪个版本打包？ 350

相关课程

更多

如何在 PolarDB-X 中优化慢 SQL

128

2

去学习

SQL完全自学手册

3847

61

去学习

SQL Server on Linux入门教程

4388

14

去学习

SQL入门与实践

11245

6

去学习

数据库及SQL/MySQL基础

6843

22

去学习

SQL进阶及查询

2558

25

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

SQL Server在电子商务中的应用与实践 立即下载

GeoMesa on Spark SQL 立即下载

原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载

相关实验场景

更多