MaxCompute的搜索结果_热门_第6页-阿里云开发者社区

隐林

|

博文

|

转载自dachuan源代码是最好的文档随着双十一数据量的暴增，之前用distinct去重可以简单处理的场景，现在消耗的时间成倍增长。如果用了multiple distinct，那就更要警惕，因为多重去重本身会带来数据量的成倍增长，很可能10分钟的任务，在双十一期间会跑上几个小时都没有结果。这

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # MaxCompute

云栖号资讯小哥

|

博文

【云栖号在线课堂】重磅推荐：湖畔大学执行教育长陈龙讲述疫情下的全球经济

受疫情影响，如何轻松实现在家办公和学习？不用慌，云栖号在线课堂，每天都有产品技术专家分享，带你快速入门云计算！下面就给大家推荐关于CIO学院攻“疫”技术培训及2020大数据技术公开课第二季的精品课程！

# 自然语言处理 # 云原生大数据计算服务 MaxCompute # 机器学习/深度学习 # 人工智能 # 分布式计算 # 达摩院 # 安全 # 算法 # 大数据 # 定位技术 # 量子技术 # MaxCompute

jlbookworm

|

博文

MaxCompute平台非标准日期和气象数据处理方法--以电力AI赛为例

MaxCompute平台支持的日期格式通常是对齐的日期格式诸如20170725或2017/07/25这种，而本次电力AI赛提供的日期格式却是未对齐的非标准的日期格式2016/1/1这种，使得无法直接使用ODPS SQL中的日期函数来进行处理。

# 云原生大数据计算服务 MaxCompute # 人工智能平台 PAI # SQL # 人工智能 # 分布式计算 # 大数据 # MaxCompute

场景研读

|

博文

|

来自：大数据与机器学习

佰腾科技的专利大数据的云上裂变之路

在票选最美云上大数据暨大数据技术峰会上，来自江苏佰腾科技有限公司的许鹏通过介绍佰腾专利大数据平台的演化、上云前后的平台结构和任务处理流程，为大家分享了专利大数据的云上裂变之路，解释了非专业人士也能进行专利信息的检索与统计，即专利信息的大众化。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # 数据库 # MaxCompute # 索引 # 数据处理 # 数据挖掘 # 搜索推荐 # 存储 # 关系型数据库

dataworks@李珍珍

|

博文

天任务依赖分钟任务

本文主要是描述天任务依赖分钟任务的一个业务流程，数据同步每天5分钟跑一次，下游依赖一个天任务来计算今天所有同步任务的数据。

# 大数据开发治理平台 DataWorks # 云原生大数据计算服务 MaxCompute # 分布式计算 # DataWorks # 大数据 # 调度 # MaxCompute

李杉杉

|

博文

|

来自：大数据与机器学习

专家教你使用MaxCompute玩转大数据分析！

摘要传统的数据分析经常使用的工具是Hadoop或Spark在使用之前环境是需要用户自己去搭建的。随着业务逐渐向云迁移如何在云上进行大数据分析是需要解决的问题。为此阿里云提供了一项很重要的服务——大数据计算服务MaxCompute。

# 云原生大数据计算服务 MaxCompute # 数据集成 Data Integration # SQL # 分布式计算 # 大数据 # 测试技术 # MaxCompute

datahub_support

|

博文

新老DataHub迁移手册

原Odps版内测DataHub，于2016年11月21日起已经处于维护状态，新版DataHub届时已经开启公测，公测至今已有一年时间，我们决定开始逐步下线老DataHub服务，老版部分用户需要迁移至新版DataHub。

# 数据总线 DataHub # 云原生大数据计算服务 MaxCompute # 域名与网站 # 分布式计算 # MaxCompute # 开发工具 # Java # Apache # 索引 # 对象存储

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute UDF系列之身份证校验及15位身份证号码转换成18位

为了验证一些老证件上的身份证号码到底是不是本人，今天为大家提供一个15位身份证号码转换成18位的MaxCompute的UDF，下载地址见附件。效果如下： MaxCompute UDF代码如下： /*** * 身份证号码构成：6位地址编码+8位生日+3位顺序码

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Java # 大数据 # MaxCompute # 人工智能 # SQL # Android开发

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute大数据实践，电商数据仓库的星型模型和传统星型的区别

作者：王永伟在Kimball所著的《数据仓库工具箱》一书中，对于维度模型设计采用的4步设计方法：1.选择业务过程 2.声明粒度 3.确定维度 4.确定事实。在当前的互联网大数据环境下，面对复杂的业务场景，为了更有效准确地进行维度模型建设，基于Kimball的4步维度建模方法，我们进行了更进一步的改进。

# 云原生大数据计算服务 MaxCompute # 新零售 # 分布式计算 # 大数据 # MaxCompute

idst田野

|

博文

语音识别pipeline建设

和其他机器学习一样，语音识别是一个science和engineer美妙结合的任务。Science推动语音识别基本技术的升级，engineer扩充语音识别的场景和语言。本节主要讨论在机器学习的engineering方面我们做了什么。

# 智能语音交互 # GPU云服务器 # 云原生大数据计算服务 MaxCompute # 智能语音交互 # 机器学习/深度学习 # 分布式计算 # 语音技术 # MaxCompute # 异构计算 # 数据库 # 数据处理 # 测试技术 # iOS开发 # 对象存储

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MaxCompute