阿里云 MaxCompute 2020-2 月刊

简介: MaxCompute2020年2月刊为您带来Python UDF 支持Python 3 ,MaxCompute存储格式全面升级AliORC等九项最新发布功能。欢迎阅读。

亲爱的开发者, MaxCompute 2020.2月刊已为您准备妥当。本次内容将为您带来2020年2月 MaxCompute 9项重要的功能发布,欢迎详细阅读并结合业务进行实践,任何问题可以加入“MaxCompute开发者社区”进行咨询,社区钉钉群二维码请见文末。

1.【新功能】MaxCompute存储格式全面升级AliORC

MaxCompute推出了自研的大数据列存储格式AliOrc,无论是读写性能,还是数据压缩存储空间,都有明显的提升。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute存储格式升级到AliOrc,客户无需干预,自动升级并提高读写性能。


2.【新功能】 Python UDF 支持Python 3 查看文档 >>>

Python 2 官方即将停止维护,越来越多的三方库也开始只支持 Python 3,MaxCompute也开启Python3的支持。

适用客户
MaxCompute公共云客户

发布功能
Python UDF 支持Python 3的编译和运行环境。


3.【新功能】Tunnel upload sdk 支持 overwrite的 ddl 语义 查看文档 >>>

Tunnel SDK的 UploadSession支持overwirte设置。

适用客户
MaxCompute公共云客户

发布功能
Tunnel SDK的 UploadSession类的createUploadSession方法中增加了overwrite设置,支持客户指定tunnel写入数据时覆盖表/分区中的现有数据。


4.【新功能】SQL中列名书写错误的智能纠错提示

更加丰富智能的语法检查,提高了SQL开发的调试效率。

适用客户
MaxCompute公共云客户

发布功能
SQL运行中,当字段名错误时,MaxCompute将猜测并提示正确的字段名。


5.【新功能】外表支持 MSCK REPAIR TABLE语法 查看文档 >>>

外表支持 MSCK REPAIR TABLE语法,可自动补齐分区,简化了外表DDL操作。

适用客户
MaxCompute公共云客户

发布功能
将数据导入oss后,oss文件路径符合如下格式 oss://xxx/table-location/ptname1=ptvalue1/ptname2=ptvalue2/xxx。创建外表并执行 msck repair table external_table_name [add partitions],sql就会自动的解析oss的目录结构,自动识别分区,并为外表添加分区信息。

6.【新功能】外表访问OSS支持https

查询外部表时,支持底层通过htts获取数据,加强了数据传输的安全性。

适用客户
MaxCompute公共云客户

发布功能
查询外部表时,若需要底层通过htts获取数据,可以在sql前添加flag:set odps.sql.unstructured.data.oss.use.https=true;一起提交执行来实现。


7.【新功能】GROUPING SETS支持复杂CUBE & ROLLUP嵌套 查看文档 >>>

MaxCompute支持GROUPING SETS与CUBE & ROLLUP嵌套使用,简化了SQL书写,提高开发效率。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute扩充了GROUPING的表达方式,支持CUBE, ROLLUP,GROUPING SETS的嵌套使用,比如groupingsets((os,device,city),(os,device),(os),(),(os,city)),可写成:groupingsets(ROLLUP(os,device,city),(os,city))。


8.【新功能】新增Clone Table命令,支持表的复制 查看文档 >>>

MaxCompute 提供了Clone Table 功能,将表数据复制到另一个表中,让数据移动和复制更便捷。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute 提供了Clone Table 功能,将表数据复制到另一个表中,让数据移动和复制更便捷。


9.【新功能】支持表级别的disable lifecycle 查看文档 >>>

新增SQL命令,支持表级别禁止/恢复生命周期。

适用客户
MaxCompute公共云客户

发布功能
适用TABLE DISABLE LIFECYCLE命令,可以取消掉已经给表设置的生命周期

产品官网 >>>
产品文档 >>>


欢迎扫码加入 MaxCompute开发者社区钉钉群,或 点击链接 申请加入。

image

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
9月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据存储计算服务:MaxCompute
阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。
427 0
|
9月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
1228 0
|
7月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
522 2
|
7月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
595 1
|
存储 机器学习/深度学习 人工智能
阿里云ODPS:在AI浪潮之巅,铸就下一代智能数据根基
在智能爆炸时代,ODPS正从传统数据平台进化为“AI操作系统”。面对千亿参数模型与实时决策挑战,ODPS通过流批一体架构、多模态处理、智能资源调度等技术创新,大幅提升效率与智能化水平。从自动驾驶到医疗联合建模,从数字孪生到低代码AI开发,ODPS正重塑企业数据生产力,助力全球客户在算力洪流中抢占先机。
364 0
|
7月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
481 14
|
9月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
314 4
|
8月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
588 0

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute