ly~
|
消息中间件 存储 数据库连接
|

RocketMQ 消息的重试机制是怎样的?

RocketMQ的消息重试机制确保消息消费失败时能自动重试,直至成功。默认重试16次,时间间隔逐次翻倍,从10秒至数分钟不等。重试在同组内不同消费者间进行,由异常抛出或特定状态返回触发。支持自定义重试次数与时间间隔,建议合理配置避免无限重试,保障系统稳定性和性能。

3924 2
|
SQL 存储 消息中间件
|

Flink + Iceberg 全场景实时数仓的建设实践

Apache Flink 是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以 Iceberg、Hudi、Delta 为代表的解决方案应运而生,Iceberg 目前支持 Flink 通过 DataStream API /Table API 将数据写入 Iceberg 的表,并提供对 Apache Flink 1.11.x 的集成支持。

6494 0
来自: 实时计算 Flink  版块
|
3天前
|
消息中间件 自然语言处理 供应链
|

Pandabuy复制指南:淘宝1688代购系统搭建

Pandabuy以“反向海淘”模式为核心,助力海外用户代购中国商品,主打欧美市场。通过物流收费、佣金、汇率差等多元盈利,两年营收达40亿元。依托网红营销、低价策略与社区运营,实现高速增长。系统搭建推荐微服务架构,对接淘宝1688 API,强化合规与供应链管理,结合SEO、社媒营销及风控体系,打造高效安全的国际代购平台。

54 1
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
|

做了15年认知心理学研究,聊聊我是怎么被文献淹没、又怎么爬出来的

一位认知心理学研究者分享15年科研中如何摆脱文献困扰:从每周耗12小时筛选论文,到借助AI工具将时间减至4小时。通过智能检索、批量分析、跨语言翻译等功能,高效追踪前沿、提升综述质量,并推动团队协作升级。工具助力,让科研回归思考本质。

54 1
|
Cloud Native Apache 流计算
|

资料合集|Flink Forward Asia 2024 上海站

Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。

9093 18
来自: 实时计算 Flink  版块
|
数据采集 人工智能 监控
|

赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源

Label-LLM 是一款专为大模型训练设计的多模态文本对话标注工具,支持团队协作,让标注工作变得简单高效。它不仅涵盖丰富的任务类型,如回答采集、偏好收集和内容评估等,还支持多模态数据标注,包括图像、视频和音频。Label-LLM具备预标注载入功能,能大幅提升工作效率,并提供全方位的任务管理与可视化分析,确保标注质量。快来体验这款强大的标注平台吧![部署文档](https://github.com/opendatalab/LabelLLM)

2906 0
|
XML 存储 API
|

RAG效果优化:高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

16664 15
来自: 智能搜索推荐  版块
|
Ubuntu 网络安全 数据安全/隐私保护
|

使用WinSCP工具,将windows文件传输到虚拟机Ubuntu系统

使用WinSCP工具,将windows文件传输到虚拟机Ubuntu系统

2697 4
|
机器学习/深度学习 编解码 PyTorch
|

CVPR 2023 | 主干网络FasterNet 核心解读 代码分析

本文分享来自CVPR 2023的论文,提出了一种快速的主干网络,名为FasterNet。核心算子是PConv,partial convolution,部分卷积,通过减少冗余计算和内存访问来更有效地提取空间特征。

10341 58

如何在cmd中打开指定文件夹路径

如何在cmd中打开指定文件夹路径

2122 0
|
SQL 存储 大数据
|

10亿+/秒!看阿里如何搞定实时数仓高吞吐实时写入与更新

10亿+/秒!看阿里如何搞定实时数仓高吞吐实时写入与更新

6852 2
来自: 实时数仓 Hologres  版块
|
25天前
|
存储 搜索推荐 安全
|

电脑必备软件:PortableApps便携式软件管理工具安装使用教程:U盘装软件随身带

PortableApps是一款免费开源的便携式软件管理平台,支持将软件安装至U盘,即插即用,拔出不留痕迹。内置近500款实用软件,无需安装,跨平台使用便捷,支持个性化主题设置,让软件随身携带,工作学习更高效。

235 1
|
7月前
|
机器学习/深度学习 PyTorch API
|

PyTorch量化感知训练技术:模型压缩与高精度边缘部署实践

本文深入探讨神经网络模型量化技术,重点讲解训练后量化(PTQ)与量化感知训练(QAT)两种主流方法。PTQ通过校准数据集确定量化参数,快速实现模型压缩,但精度损失较大;QAT在训练中引入伪量化操作,使模型适应低精度环境,显著提升量化后性能。文章结合PyTorch实现细节,介绍Eager模式、FX图模式及PyTorch 2导出量化等工具,并分享大语言模型Int4/Int8混合精度实践。最后总结量化最佳策略,包括逐通道量化、混合精度设置及目标硬件适配,助力高效部署深度学习模型。

1171 21
|
9月前
|
人工智能 运维 安全
|

AI大模型运维开发探索第四篇:智能体分阶段演进路线

本文探讨了智能体工程的演进历程,从最初的思维链(智能体1.0)到实例化智能体(智能体2.0),再到结构化智能体(智能体3.0),最终展望了自演进智能体(智能体4.0)。文章详细分析了各阶段遇到的问题及解决策略,如工具调用可靠性、推理能力提升等,并引入了大模型中间件的概念以优化业务平台与工具间的协调。此外,文中还提到了RunnableHub开源项目,为读者提供了实际落地的参考方案。通过不断迭代,智能体逐渐具备更强的适应性和解决问题的能力,展现了未来AI发展的潜力。

1050 3
来自: 大数据运维SREWorks  版块
|
10月前
|
SQL 存储 HIVE
|

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

本文整理自鹰角网络大数据开发工程师朱正军在Flink Forward Asia 2024上的分享,主要涵盖四个方面:鹰角数据平台架构、数据湖选型、湖仓一体建设及未来展望。文章详细介绍了鹰角如何构建基于Paimon的数据湖,解决了Hudi入湖的痛点,并通过Trino引擎和Ranger权限管理实现高效的数据查询与管控。此外,还探讨了湖仓一体平台的落地效果及未来技术发展方向,包括Trino与Paimon的集成增强、StarRocks的应用以及Paimon全面替换Hive的计划。

1245 1
来自: 实时计算 Flink  版块
|
机器学习/深度学习 数据可视化 测试技术
|

YOLO11实战:新颖的多尺度卷积注意力(MSCA)加在网络不同位置的涨点情况 | 创新点如何在自己数据集上高效涨点,解决不涨点掉点等问题

本文探讨了创新点在自定义数据集上表现不稳定的问题,分析了不同数据集和网络位置对创新效果的影响。通过在YOLO11的不同位置引入MSCAAttention模块,展示了三种不同的改进方案及其效果。实验结果显示,改进方案在mAP50指标上分别提升了至0.788、0.792和0.775。建议多尝试不同配置,找到最适合特定数据集的解决方案。

3258 0
|
机器学习/深度学习 人工智能 分布式计算
|

使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人

本次教程介绍了如何使用 PAI ×LLaMA Factory 框架,基于全参方法微调 Qwen2-VL 模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。

3200 1
来自: 人工智能平台PAI  版块
|
算法 数据挖掘 开发工具
|

以阿里云OpenSearch为例谈向量检索技术选型

本文从向量检索应用场景、常见的向量检索方法、向量检索性能优化、功能性能对比介绍了向量检索的业务应用场景和技术选型方式。

4407 3
来自: 智能搜索推荐  版块
|
机器学习/深度学习 存储 开发框架
|

解密淘宝推荐实战,打造 “比你还懂你” 的个性化APP

如今,推荐系统已经成为各大电商平台的重要流量入口,谁才能够做到比用户更懂用户,谁占据了新零售时代的主动权。手机淘宝的推荐更是淘宝最大的流量入口和最大的成交渠道之一,其背后是最为复杂的业务形态和最复杂的场景技术,那么究竟如何打造手淘背后的推荐系统呢?本次首席技术官大数据专享会上,阿里巴巴搜索推荐事业部资深算法专家欧文武(三桐)为大家解密了淘宝的推荐实战。

12596 1
来自: 大数据计算 MaxCompute  版块
|
6天前
|
运维 负载均衡 自动驾驶
|

自动化运维卷到最后,都卷成了“智能决策”?——从脚本到AIOps的进化史

自动化运维卷到最后,都卷成了“智能决策”?——从脚本到AIOps的进化史

64 7
|
2月前
|
存储 数据采集 搜索推荐
|

Python+淘宝API:3步爬取10万条商品评论(附反爬破解技巧)

本文介绍淘宝商品评论爬取技术,涵盖环境配置、接口分析、反爬破解及数据存储。使用Python模拟请求,动态代理与签名绕过风控,结合Flask中转降低封禁风险,实现高效合规的数据采集,适用于竞品分析与用户画像构建。(238字)

400 1
|
3月前
|
人工智能 自然语言处理 搜索推荐
|

AI搜索的黑科技?DeepSearch 究竟“深”藏着什么秘密?

本文介绍 OpenSearch 凭借领先的AI搜索技术,应用DeepSearch 的设计框架能更有效解决复杂和多跳问题,优化用户体验。

676 0
来自: 智能搜索推荐  版块
|
监控 安全 API
|

使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南

本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型,实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性,为机器学习工程师和研究人员提供了系统化的技术方案。

1087 77
|
数据采集 API 开发者
|

拼多多API接口怎么申请

拼多多API接口申请步骤简述:首先访问拼多多开放平台并注册账号,选择开发者类型并填写资料,审核通过后创建应用并申请API接口权限,等待审核结果,获取API密钥等信息。完成后,即可使用拼多多API接口进行开发,注意遵守相关规定。

3218 0
|
机器学习/深度学习 JSON 数据可视化
|

YOLO11-pose关键点检测:训练实战篇 | 自己数据集从labelme标注到生成yolo格式的关键点数据以及训练教程

本文介绍了如何将个人数据集转换为YOLO11-pose所需的数据格式,并详细讲解了手部关键点检测的训练过程。内容涵盖数据集标注、格式转换、配置文件修改及训练参数设置,最终展示了训练结果和预测效果。适用于需要进行关键点检测的研究人员和开发者。

2578 0
|
域名解析 缓存 安全
|

cdn服务器连接异常怎么办

当遇到CDN服务器连接异常时,可采取以下步骤排查:检查CDN配置,包括域名解析和防火墙设置;清空CDN缓存;测试网络连接;确认源服务器状态;更换CDN服务器;等待恢复;联系服务商;检查本地电脑安全;检查程序代码;保持更新和维护。具体解决步骤需根据实际情况调整。

2736 0
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里通义千问大语言模型在人工智能教育领域的应用探索

阿里通义千问,阿里集团的大型预训练语言模型,应用于AI教育,实现个性化教学、自适应学习系统和智能答疑。通过AIGC,它生成个性化内容,适应不同学生需求,优化教育资源配置,推动教育创新。在教育场景中,模型提供实时反馈,定制学习路径,促进教学质量提升。随着技术进步,AI在教育领域的应用将更加深入,但也需关注伦理与安全。

3618 1
|
存储 机器学习/深度学习 人工智能
|

基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践

随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。

86720 9
来自: 人工智能平台PAI  版块
|
存储 分布式计算 运维
|

钱大妈数据中台建设最佳实践

钱大妈数据中台建设最佳实践

9407 2
来自: 实时数仓 Hologres  版块
|
1天前
|
机器学习/深度学习 人工智能 监控
|

构建AI智能体:六十五、模型智能训练控制:早停机制在深度学习中的应用解析

文章摘要:早停机制是深度学习中防止过拟合的关键技术,通过在验证集性能停止改善时终止训练,自动平衡模型复杂度和泛化能力。其核心价值包括自动防过拟合、提升训练效率(节省30-80%计算资源)、简化调参过程。关键参数设置涉及patience(容忍轮次)、min_delta(最小改善阈值)和restore_best_weights(恢复最佳权重)。实现流程包括训练轮次监控、验证集评估和性能改善判断,通过U型曲线分析可直观理解其工作原理。

51 13
|
24天前
|
机器学习/深度学习 人工智能 API
|

从外贸数据孤岛到智能引擎:信风AI多Agent架构深度解析

传统外贸获客面临数据孤岛、决策固化、工具割裂三大困境。信风TradeWind AI通过多Agent协同架构,构建“数据-决策-执行”闭环,实现从单点工具到智能协同系统的跃迁,打造可扩展、可定制、可进化的AI获客引擎。

166 9
|
SQL 机器学习/深度学习 自然语言处理
|

Text-to-SQL技术演进 - 阿里云OpenSearch-SQL在BIRD榜单夺冠方法剖析

本文介绍了Text-to-SQL的技术演进,并对OpenSearch-SQL方法进行剖析。

1949 8
来自: 智能搜索推荐  版块
|
Java 应用服务中间件 Maven
|

解决“Unable to start embedded Tomcat“错误的完整指南

通过逐步检查以上问题,你应该能够解决 "Unable to start embedded Tomcat" 错误,并使Tomcat成功启动。

4528 1
|
机器学习/深度学习 数据采集 数据处理
|

掌握时间序列特征工程:常用特征总结与 Feature-engine 的应用

本文介绍了时间序列特征工程,包括滚动统计量、滞后特征、差分和变换等技术,用于提升机器学习模型性能。文章还推荐了Python库`feature-engine`,用于简化特征提取,如处理缺失值、编码分类变量和进行时间序列转换。示例代码展示了如何使用`feature-engine`提取时间戳信息、创建滞后特征和窗口特征。通过创建管道,可以高效地完成整个特征工程流程,优化数据预处理并提高模型效果。

1747 15
|
存储 传感器 数据可视化
|

3D目标检测数据集 KITTI(标签格式解析、3D框可视化、点云转图像、BEV鸟瞰图)

本文介绍在3D目标检测中,理解和使用KITTI 数据集,包括KITTI 的基本情况、下载数据集、标签格式解析、3D框可视化、点云转图像、画BEV鸟瞰图等,并配有实现代码。

4154 1
|
机器学习/深度学习 开发工具 git
|

开发专题 | 1 :下载 huggingface 上模型的正确姿势

本文主要介绍如何以正确的方式下载 huggingface 上的模型

14530 4
|
机器学习/深度学习 API Python
|

阿里云DSW实例wandb使用示例

wandb是一个免费的,用于记录实验数据的工具。wandb相比于tensorboard之类的工具,有更加丰富的用户管理,团队管理功能,更加方便团队协作。本文主要演示如何在阿里云DSW实例中使用wandb。

1832 1
来自: 人工智能平台PAI  版块
|
存储 数据采集 人工智能
|

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

从2016年诞生起,“中台”概念就一路火热至今,对互联网与金融行业数字化转型产生了极为深远的影响。 作为“中台”概念的提出者和先行者,阿里巴巴用12年的实践探索了中台能力建设和数据应用。在不断升级和重构的过程中,阿里巴巴的中台建设经历了从分散的数据分析到数据中台化能力整合,再到全局数据智能化的时代。

11408 8
|
SQL 存储 关系型数据库
|

【最佳实践】使用 Elasticsearch SQL 实现数据查询

如何使用 Elasticsearch SQL 来对我们的数据进行查询。

6386 0
|
4天前
|
机器学习/深度学习 数据采集 运维
|

宕机不是突然的,是你没提前看见 —— 聊聊 IT 事件预测,机器学习如何把事故掐死在摇篮里

宕机不是突然的,是你没提前看见 —— 聊聊 IT 事件预测,机器学习如何把事故掐死在摇篮里

50 3
|
11天前
|
数据采集 人工智能 监控
|

GEO优化核心:高权重新闻信源筛选与AI收录实战指南

在 GEO(搜索引擎地理优化)实操中,新闻信源的质量直接影响内容的 AI 收录率、关键词排名及转化效果。多数开发者面临两大核心问题:1. 低价值信源浪费成本:部分新闻平台价格低廉(30-50 元 / 篇),但发布后未被 AI 抓取,无法为 GEO 排名提供权重支撑;2. 广告属性触发审核拒绝:含联系方式(电话、微信号)的软文易被平台判定为广告,导致审核驳回,影响发布效率。

135 7
|
3月前
|
人工智能 运维 Java
|

Flink Agents:基于Apache Flink的事件驱动AI智能体框架

本文基于Apache Flink PMC成员宋辛童在Community Over Code Asia 2025的演讲,深入解析Flink Agents项目的技术背景、架构设计与应用场景。该项目聚焦事件驱动型AI智能体,结合Flink的实时处理能力,推动AI在工业场景中的工程化落地,涵盖智能运维、直播分析等典型应用,展现其在AI发展第四层次——智能体AI中的重要意义。

1309 27
来自: 实时计算 Flink  版块
|
5月前
|
数据采集 人工智能 大数据
|

10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案

阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。

628 0
|
9月前
|
机器学习/深度学习 人工智能 算法
|

强化学习:Gym的库的实践——小车上山(包含强化学习基础概念,环境配置国内镜像加速)——手把手教你入门强化学习(一)

本文开启“手把手教你入门强化学习”专栏,介绍强化学习基础概念及实践。强化学习通过智能体与环境交互,学习最优策略以最大化累积奖励,适用于复杂动态决策问题。文章讲解智能体、环境等核心概念,并使用Gym库进行案例实操,如CartPole和MountainCar环境的代码实现。最后预告下期将深入马尔科夫决策过程(MDP)。适合初学者系统了解强化学习并动手实践。创作不易,欢迎关注、点赞与收藏!

1217 4
来自: 人工智能平台PAI  版块
|
9月前
|
存储 分布式计算 负载均衡
|

数据分布式存储:在海量数据面前,我们如何站稳脚跟?

数据分布式存储:在海量数据面前,我们如何站稳脚跟?

1338 1
|
10月前
|
存储 数据采集 数据库
|

Python爬虫实战:股票分时数据抓取与存储

Python爬虫实战:股票分时数据抓取与存储

1242 5
|
存储 分布式计算 流计算
|

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。

3759 73
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 安全
|

「随笔」开源大模型与闭源大模型,你更看好哪一方?

开源与闭源AI模型各有利弊。开源促进创新、透明度和学习,但可能有安全风险和质量不一;闭源则保护IP、提供定制服务,但可能限制创新和透明度。混合策略,如基础开源加高级服务闭源,成为平衡点。选择取决于创新、产权、透明度和商业目标。

1033 0
|
编解码 自然语言处理 并行计算
|

【经典论文解读】YOLACT 实例分割(YOLOv5、YOLOv8实例分割的基础)

 YOLACT是经典的单阶段、实时、实例分割方法,在YOLOv5和YOLOv8中的实例分割,也是基于 YOLACT实现的,有必要理解一下它的模型结构和设计思路。

4074 0
|
7天前
|
SQL 人工智能 分布式计算
|

阿里云大数据AI产品月刊-2025年11月

大数据& AI 产品技术月刊【2025年 11 月】,涵盖 11 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

70 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

21
今日
67707
内容
128
活动
439498
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务