|
资源调度 供应链 监控
|

探索企业资源规划(ERP)系统的基本概念

探索企业资源规划(ERP)系统的基本概念

539 0
|
机器学习/深度学习 自然语言处理 PyTorch
|

使用Transformer 模型进行时间序列预测的Pytorch代码示例

时间序列预测是一个经久不衰的主题,受自然语言处理领域的成功启发,transformer模型也在时间序列预测有了很大的发展。本文可以作为学习使用Transformer 模型的时间序列预测的一个起点。

1190 2
|
数据采集 人工智能 文字识别
|

【AAAI 2024】MuLTI:高效视频与语言理解

多模态理解模型具有广泛的应用,比如多标签分类、视频问答(videoQA)和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展,然而,他们仍然面临两个巨大的挑战:无法充分的利用现有的特征;训练时巨大的GPU内存消耗。我们提出了MuLTI,这是一种高度准确高效的视频和语言理解模型,可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

78301 64
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 存储 人工智能
|

另一种替代Transformer架构将得到有意义的采用

【1月更文挑战第15天】另一种替代Transformer架构将得到有意义的采用

976 2
|
自然语言处理 算法 搜索推荐
|

自然语言对话:重塑人机交互的新时代

【1月更文挑战第14天】自然语言对话:重塑人机交互的新时代

648 3
|
Java
|

IDEA常用插件之代码规范检查

IDEA常用插件之代码规范检查

992 0

IDEA常用插件之注解插件

IDEA常用插件之注解插件

1025 0
|
机器学习/深度学习 数据采集 算法
|

【MATLAB】史上最全的25种信号分解算法全家桶

【MATLAB】史上最全的25种信号分解算法全家桶

1016 0
|
机器学习/深度学习 算法 数据挖掘
|

【MATLAB 】RBF径向基神经网络回归预测

【MATLAB 】RBF径向基神经网络回归预测

600 0
|
SQL 人工智能 自然语言处理
|

【2023云栖】田奇铣:大模型驱动DataWorks数据开发治理平台智能化升级

随着大模型掀起AI技术革新浪潮,大数据也进入了与AI深度结合的创新时期。2023年云栖大会上,阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品能力,让DataWorks这款已经发展了14年的大数据开发治理平台产品,从一站式向智能化不断升级演进。

60007 8
|
存储 机器学习/深度学习 算法
|

6个常用的聚类评价指标

评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。

868 1
|
数据可视化 机器人
|

使用RPA轻松实现淘宝评价自动回复

八爪鱼RPA是一款经验丰富的自动化流程处理软件,它可以模拟人在电脑上的操作,按照预设的规则自动执行任务。对于淘宝评价自动回复的场景,可以帮助卖家自动获取评价信息,并根据预设的关键词进行智能化回复。

642 0
|
机器学习/深度学习 自动驾驶 定位技术
|

【论文解读】SMOKE 单目相机 3D目标检测(CVPR2020)

 SMOKE是一种用于自动驾驶的实时单目 3D 物体检测器。为什么会注意这边文章呢?是因为这两天发布的百度Apollo 7.0 的摄像头障碍物感知,也是基于这个模型改进的;于是令我产生了一些兴趣。

992 0
|
Windows
|

文档翻译——免费版(word格式、pdf格式)

有时需要看英文论文,奈何英语水平不太好,看完10几页的文档很吃力;于是到网上找了一大堆方法,一个一个尝试,还好有几个勉强能用的;这里分享一下。 PS:虽然有网页翻译,但是我不太喜欢一段一段复制。本文分享的方法,目前测试过都是免费的。

633 1
|
机器学习/深度学习 API 算法框架/工具
|

深度卷积生成对抗网络DCGAN——生成手写数字图片

本文使用深度卷积生成对抗网络(DCGAN)生成手写数字图片,代码使用Keras API与tf.GradientTape 编写的,其中tf.GradientTrape是训练模型时用到的。

445 0
|
数据可视化 Python Windows
|

Graphviz安装及使用-决策树可视化

Graphviz安装及使用-决策树可视化

639 0
|
机器学习/深度学习 人工智能 数据可视化
|

阿里云机器学习 PAI 平台基础

阿里云机器学习 PAI 平台基础

1151 1
|
机器学习/深度学习 传感器 人工智能
|

人工智能产业结构

人工智能产业结构

765 0
|
SQL 弹性计算 分布式计算
|

使用EMR+DLF+OSS-HDFS进行数据湖分析

本实验通过使用EMR,搭建EMR集群,对OSS-HDFS进行数据湖分析

1179 0
|
图形学 UED
|

GLTF在线编辑器

GLTF在线编辑器提供了一系列功能,支持对GLTF模型的在线查看、材质修改、模型大小修改、模型网格属性修改、重置原点、模型合批等功能

866 0
|
机器学习/深度学习 自然语言处理 机器人
|

更轻松、高效、经济的LLaMA训练——开源大模型训练框架Megatron-LLaMA

9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的代码版本,Megatron-LLaMA能够取得176%的加速;在大规模的训练上,Megatron-LLaMA相比较32卡拥有几乎线性的扩展性,且对网络不稳定表现出高容忍度。目前Megatron-LLaMA已在开源社区上线。开源地址:https://github.com/alibaba/Megatron-LLaMA

1556 3
|
数据采集 监控 数据管理
|

数据质量最佳实践(5):利用质量分和排行榜提升企业数据质量【Dataphin V3.12】

在数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理这篇文章中,我们详细的介绍了如何通过治理工作台,对系统出现的一个一个具体质量问题进行治理。 但是对于企业整体的数据质量情况,我们该如何评估呢?以及如何寻找当前企业的数据质量短板,并有针对性的进行改进和提升呢? 在Dataphin V3.12版本中,质量新增了质量分的能力,可以给数据表和质量规则配置打分权重和打分方式,从而获得全局、数据源、项目、负责人、数据表等维度的质量打分评估,帮助CDO判断企业整体的数据质量情况和数据质量问题的分布,从而有针对性的提升企业整体的数据质量水平。

1217 1
|
数据可视化 算法 数据挖掘
|

聚类分析 | MATLAB实现基于DBSCAD密度聚类算法可视化

聚类分析 | MATLAB实现基于DBSCAD密度聚类算法可视化

533 0
|
数据采集 Web App开发 资源调度
|

如何使用Puppeteer在Node JS服务器上实现动态网页抓取

Puppeteer的核心功能是提供了一个Browser类,它可以启动一个Chrome或Chromium浏览器实例,并返回一个Browser对象。Browser对象可以创建多个Page对象,每个Page对象对应一个浏览器标签页,可以用来加载和操作网页。Page对象提供了一系列的方法,可以模拟用户的各种行为,如输入、点击、滚动、截图、PDF等。Page对象还可以监听网页上的事件,如请求、响应、错误、加载等。通过这些方法和事件,可以实现对动态网页的抓取。

749 0
|
监控 安全 物联网
|

5G技术的革命性进步及其对社会的影响

5G技术作为移动通信领域的革命性进步,正深刻地影响着我们的生活和社会。它不仅提供了更快的数据传输速率和更低的延迟,还将引领着各个领域的创新和发展。从移动通信、工业、医疗到智能城市,5G技术正在改变着我们的世界,为未来带来更多可能性。然而,我们也需要解决一些挑战,确保5G技术的安全和可持续发展。随着技术的不断进步,5G技术的前景依然充满希望,将为我们的社会带来更多的创新和变革。

1481 1
|
人工智能 自然语言处理 算法
|

AI 大语言模型的提示词工程 Prompt ,以及我们如何使用 Prompt 改善 AI 的思考能力

AI 大语言模型的提示词工程 Prompt ,以及我们如何使用 Prompt 改善 AI 的思考能力

1158 0
|
机器学习/深度学习 JSON 人工智能
|

LLM 系列 | 04:ChatGPT Prompt编写指南

今天这篇小作文从Prompt的构建原则开始,简要介绍构建Prompt的2大原则,并以具体的纯中文使用示例进一步演示说明。

1842 0
|
机器学习/深度学习 存储 人工智能
|

《Apache Flink 案例集(2022版)》——3.机器学习——众安保险-Flink 在 众安保险金融业务的应用(4)

《Apache Flink 案例集(2022版)》——3.机器学习——众安保险-Flink 在 众安保险金融业务的应用(4)

405 0
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 弹性计算
|

机器学习平台PAI支持抢占型实例,模型服务最高降本90%

助力模型推理服务降本增效,适用于推理成本敏感场景,如:AIGC内容生成异步推理、批量图像处理、批量音视频处理等。

959 0
来自: 人工智能平台PAI  版块
|
SQL 存储 人工智能
|

Hologres新手如何基于ChatGPT优化Hologres慢SQL

Hologres新手如何基于ChatGPT优化Hologres慢SQL。

2120 56
来自: 实时数仓 Hologres  版块

xfs_repair命令xfs文件系统修复工具

xfs_repair命令xfs文件系统修复工具

4530 0
来自: 人工智能平台PAI  版块
|
存储 机器学习/深度学习 并行计算
|

vivo 推荐业务 x DeepRec:全链路优化实践

DeepRec提供大量的解决方案帮助vivo用户快速实施GPU推理,便于业务快速构建推荐服务及算法策略高效迭代。

1558 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 编解码
|

PAI-Diffusion 模型来了!阿里云机器学习团队带您徜徉中文艺术海洋

PAI-Diffusion系列模型,包括一系列通用场景和特定场景的文图生成模型,本⽂简要介绍PAI-Diffusion模型及其体验方式。

1884 0
|
数据采集 运维 安全
|

构建数据中台的组织架构

著名管理大师钱德勒总结过一个黄金定律:战略决定组织,而组织决定成败。

7274 10
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 存储 数据采集
|

使用 Databricks 进行营销效果归因分析的应用实践【Databricks 数据洞察公开课】

本文介绍如何使用Databricks进行广告效果归因分析,完成一站式的部署机器学习,包括数据ETL、数据校验、模型训练/评测/应用等全流程。

1257 0
|
SQL 数据采集 分布式计算
|

【转载】大数据在线离线一体化解决方案最佳实践

本文重点介绍大数据产品集通用解决方案,即大数据在线计算+离线计算一体化解决方案,并通过真实案例模拟来说明此通用解决方案在具体项目中是如何落地的。

16949 0
来自: 大数据计算 MaxCompute  版块
|
SQL 存储 缓存
|

使用实践:OOM排查指南

本文将会介绍如何针对Hologres中出现的OOM问题进行排查并处理。

2833 0
来自: 实时数仓 Hologres  版块
|
存储 消息中间件 SQL
|

新东方基于Hologres实时离线一体化数仓建设实践

新东方基于Hologres实时离线一体化数仓建设实践

2845 2
来自: 实时数仓 Hologres  版块
|
分布式计算 DataWorks Cloud Native
|

阿里云云原生一体化数仓正式发布  助力企业数据驱动业务创新

云原生一体化数仓是集阿里云大数据产品MaxCompute、DataWorks、Hologres三种产品能力于一体的一站式大数据处理平台。核心是3个一体化和全链路数据治理能力,包括离线实时一体、湖仓一体、分析服务一体、全链路数据治理。

2844 6
来自: 大数据计算 MaxCompute  版块
|
API 索引
|

【Elastic Engineering】Elasticsearch:Split index API - 把一个大的索引分拆成更多分片

Elasticsearch:Split index API - 把一个大的索引分拆成更多分片

660 0
|
存储 SQL 分布式计算
|

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析,云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍,希望给想了解和实践数据湖架构的企业和朋友一个参考。

4422 2
|
消息中间件 分布式计算 前端开发
|

Apache Hudi 在 B 站构建实时数据湖的实践

B 站选择 Flink + Hudi 的数据湖技术方案,以及针对其做出的优化。

3166 0
来自: 实时计算 Flink  版块
|
存储 SQL 分布式计算
|

MaxCompute执行引擎核心技术DAG揭秘

作为业界少有的EB级数据分布式平台,MaxCompute每天支撑上千万个分布式作业的运行。这些作业特点各异,既有包含数十万计算节点的超大型作业,也有中小规模的分布式作业。不同用户对于不同规模/特点的作业,在运行时间,资源使用效率,数据吞吐率等方面,也有着不同的期待。DAG作为MaxCompute执行引擎的核心技术之一,在提供了底层统一的动态执行框架的同时,实现了一个在离线混合的执行模式(Bubble Execution),达到了平衡极致性能以及高效的资源利用率的目的。

3192 0
来自: 大数据计算 MaxCompute  版块
|
数据采集 SQL 存储
|

DataWorks数据质量介绍及实践 | 《一站式大数据开发治理DataWorks使用宝典》

数据质量问题虽然从数据工程师的角度来看是个简单问题,但是从业务的角度来看是个很严重的问题。所以数据质量是数据开发和治理全生命周期中,非常重要的一个环节。在DataWorks产品版图里,数据质量也是非常重要的模块之一。

4888 0
|
存储 SQL 缓存
|

Flink + Iceberg + 对象存储,构建数据湖方案

上海站 Flink Meetup 分享内容,如何基于Flink、对象存储、Iceberg 来构建数据湖生态。

4542 0
来自: 实时计算 Flink  版块
|
存储 消息中间件 机器学习/深度学习
|

基于实时深度学习的推荐系统架构设计和技术演进

整理自 5 月 29 日 阿里云开发者大会,秦江杰和刘童璇的分享,内容包括实时推荐系统的原理以及什么是实时推荐系统、整体系统的架构及如何在阿里云上面实现,以及关于深度学习的细节介绍

5184 0
来自: 实时计算 Flink  版块
|
存储 传感器 消息中间件
|

【实践案例】Databricks 数据洞察在美的暖通与楼宇的应用实践

获取更详细的 Databricks 数据洞察相关信息,可至产品详情页查看:https://www.aliyun.com/product/bigdata/spark

2222 0
|
运维 监控 安全
|

实时数仓入门训练营:实时计算Flink版总体介绍

实时计算Flink版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。

8806 0
来自: 实时计算 Flink  版块
|
缓存 资源调度 Kubernetes
|

详解 Flink 容器化环境下的 OOM Killed

本文将解析 JVM 和 Flink 的内存模型,并总结在工作中遇到和在社区交流中了解到的造成 Flink 内存使用超出容器限制的常见原因。由于 Flink 内存使用与用户代码、部署环境、各种依赖版本等因素都有紧密关系,本文主要讨论 on YARN 部署、Oracle JDK/OpenJDK 8、Flink 1.10+ 的情况。

4965 0
来自: 实时计算 Flink  版块
|
机器学习/深度学习 自然语言处理 算法
|

Flink + 强化学习搭建实时推荐系统

如何根据用户反馈作出快速及时的实时推荐?

10705 0
来自: 实时计算 Flink  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67686
内容
128
活动
439494
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务