大数据与机器学习-最热-第33页-阿里云开发者社区

游客fjfnvw6coc64q

|

5月前

|

人工智能 NoSQL 前端开发

|

博文

面试真题

多套AI与Java技术面试题，涵盖RAG、智能体、大模型部署、分布式系统、JVM调优、数据库设计等核心内容，深入考察项目经验、架构能力与技术深度，适用于中高级工程师岗位选拔。

183 0 0

游客fjfnvw6coc64q

|

5月前

|

存储数据库

|

博文

数据库设计三范式

第一范式要求字段原子性，不可再分；第二范式要求消除部分依赖，一张表只描述一件事；第三范式要求消除传递依赖。三者旨在减少数据冗余、提升维护效率，但实际设计应结合业务需求灵活应用，不必拘泥范式。

120 0 0

游客fjfnvw6coc64q

|

5月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring Cloud Gateway，采用Spring WebFlux与Netty实现非阻塞高性能转发。请求由Netty Server接收，匹配路由后经过滤器处理，通过Netty Client转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层基于HTTP，也曾使用Dubbo。JVM方面掌握模型、GC机制、类加载及调优。

146 0 0

游客fjfnvw6coc64q

|

5月前

|

消息中间件弹性计算决策智能

|

博文

实战演练：三步构建高可靠多智能体应用

本方案基于阿里云ECS与RocketMQ，构建多智能体系统，实现天气查询与行程规划协同。通过一键部署资源、创建Topic/Group，发布天气与行程助手Agent，用户可输入需求触发自动化任务执行，并通过消息轨迹追踪交互过程，快速体验多Agent协同应用场景。

230 0 0

游客6aafr7mks52p4

|

5月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring WebFlux与Netty实现非阻塞高性能转发，启动时创建Netty Server接收请求，按路由规则匹配并经过滤器处理后转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层为HTTP，也曾使用Dubbo。JVM专项涵盖模型、GC、类加载及调优。

145 0 0

游客6aafr7mks52p4

|

5月前

|

消息中间件存储人工智能

|

博文

基于 RocketMQ LiteTopic 打造企业级 Session 管理

AI场景下，Session需满足低延迟、时序性、隔离性与上下文压缩四大要求。基于RocketMQ LiteTopic，实现会话持久化、断点恢复、多会话隔离与流量削峰，保障会话不丢失、可追溯、高并发稳定，助力企业级多智能体系统构建。

160 0 0

游客6aafr7mks52p4

|

5月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与生成质量。本文系统解析五种主流分块方法：固定大小、语义、递归、基于结构和基于LLM的分块，对比其优缺点及适用场景，助力构建高效、可信的RAG系统，尤其适用于金融、医疗等高精度领域。（239字）

204 0 0

游客fjfnvw6coc64q

|

5月前

|

消息中间件人工智能决策智能

|

博文

AgentScope x RocketMQ：构建多智能体应用组合

AgentScope是阿里巴巴推出的开发者友好型多智能体框架，支持模块化、可定制的智能体应用开发。通过集成RocketMQ，实现高效、可靠的Agent间通信，助力构建如“智能旅行助手”等复杂协作场景，推动多智能体生态发展。（238字）

283 0 0

游客7km4snizezcsg

|

5月前

|

负载均衡中间件 Java

|

博文

微服务并非绝对优于单体，需结合业务场景。简单应用用单体更轻量，避免分布式复杂性；复杂业务适合微服务，降低耦合，利于扩展。常用中间件如Nacos（注册/配置中心）、OpenFeign（远程调用）、Gateway（网关）。Nacos通过心跳机制维护实例状态，支持临时（心跳剔除）与非临时（主动检测）实例，相比Eureka，兼具AP/CP模式，服务发现更及时。负载均衡常用轮询、加权轮询等，项目中多用轮询策略。

172 0 0

游客7km4snizezcsg

|

5月前

|

机器学习/深度学习存储自然语言处理

|

博文

大模型基础概念术语解释

大语言模型（LLM）基于Transformer架构，通过海量文本训练，具备强大语言理解与生成能力。其核心组件包括注意力机制、位置编码与嵌入层，支持文本分割为Token进行处理。参数量达十亿乃至万亿级，展现涌现与泛化能力，能完成多任务推理。混合专家模型（MoE）提升效率与扩展性，推动大模型持续发展。（237字）

630 0 0

游客hua3a7ejc2opu

|

5月前

|

自然语言处理监控

|

博文

大模型评估与调试术语解释3

困惑度衡量语言模型预测能力，越低越好；过拟合指模型记背训练数据而泛化差；泛化能力体现模型应对新任务的适应性；人工评估是生成质量“金标准”；BLEU、ROUGE分别基于n-gram和召回率评估生成文本相似度；混淆矩阵用于分类任务的细粒度错误分析。各项指标需结合使用以全面评估大模型性能。（238字）

197 0 0

游客aucdvipmftp5m

|

5月前

|

消息中间件 Java 数据安全/隐私保护

|

博文

RabbitMQ集群部署

本文介绍RabbitMQ集群部署，包括普通模式与高可用方案。首先通过Docker搭建三节点集群，配置Erlang Cookie和rabbitmq.conf实现节点通信；接着演示队列创建、数据共享及宕机测试，发现普通模式无高可用能力；进而引入镜像模式，通过策略设置实现队列多副本，支持主从切换；最后重点介绍3.8版本后推荐的仲裁队列，其具备自动选举、强一致性等优势，配置更简便，是实现高可用的首选方案。

285 0 0

游客p4omngj4p6cwq

|

5月前

|

SQL Nacos 数据库

|

博文

工程介绍

本课程围绕微服务架构展开，涵盖Nacos配置中心、Feign远程调用及Gateway网关实践。通过doctor-station项目实战，完成配置热更新、开单限流、维护时间控制，实现服务解耦与请求路由，提升系统可维护性与安全性。（238字）

122 0 0

游客p4omngj4p6cwq

|

5月前

|

SQL 安全网络协议

|

博文

常见的网络攻击

恶意软件指具有险恶意图的程序，如病毒、勒索软件、间谍软件等，常通过钓鱼邮件或漏洞入侵系统，窃取数据、破坏功能或加密文件勒索。网络钓鱼伪装成可信来源骗取敏感信息。中间人攻击通过窃听通信窃取数据。DDoS攻击利用大量流量瘫痪系统，近年呈高频、大容量趋势，常见于僵尸网络与L7层攻击。SQL注入通过输入恶意代码获取非法数据访问权限。零日攻击利用未修复漏洞快速发起攻击。DNS隧道则借合法协议隐藏恶意数据传输，用于数据泄露与远程控制。

126 0 0

Holly007

|

5月前

|

人工智能 JSON 自然语言处理

|

博文

面向多模态AI平台的品牌内容曝光：从“被动收录”到“主动引用”的GEO工程化实践

作为资深数字营销工程师与AI开发者，我近期深耕生成式引擎优化（GEO）领域，推动品牌从“流量竞争”转向“认知竞争”。依托结构化数据、多平台适配与双引擎协同（GEO特工队AI+内容特工队AI），构建AI友好型内容生态，实现品牌在豆包、千问等主流平台的高效曝光与权威引用，打造可持续的GEO长跑战略。

838 0 0

来自：智能搜索推荐版块

Echo_Wish

|

5月前

|

运维监控数据挖掘

|

博文

运维数据分析：别再只会翻日志了，真正的价值在“洞察”

240 16 16

Echo_Wish

|

5月前

|

数据采集分布式计算监控

|

博文

Airflow 做 ETL，真不是“排个 DAG 就完事儿”：那些年我踩过的坑与悟出的道

416 4 4

xxrjl

|

5月前

|

SQL 人工智能分布式计算

|

博文

【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

785 4 5

Echo_Wish

|

5月前

|

存储 SQL BI

|

博文

235 0 0

刘大猫.

|

7月前

|

JSON Java 数据格式

|

博文

本文介绍了多种开发技术，包括Python集成开发环境PyCharm、自然语言处理工具SnowNLP、关系型数据库MySQL、Python语言特性、Django Web框架以及协同过滤算法。内容涵盖各技术的基本功能、特点及其在实际开发中的应用，适用于初学者和开发者了解相关工具与框架的使用与优势。

332 2 2

Deephub

|

8月前

|

机器学习/深度学习算法

|

博文

Proximal SFT：用PPO强化学习机制优化SFT，让大模型训练更稳定

本文介绍了一种改进的监督微调方法——Proximal Supervised Fine-Tuning (PSFT)，旨在解决传统SFT易过拟合、泛化能力差及导致“熵坍塌”的问题。受PPO强化学习算法启发，PSFT通过引入参数更新的稳定性机制，防止模型在训练中变得过于确定，从而提升探索能力与后续强化学习阶段的表现。实验表明，PSFT在数学推理、模型对齐及泛化能力方面均优于传统SFT。

829 3 3

FISSPACE

|

8月前

|

人工智能 JSON 算法

|

博文

向量嵌入的天花板与AI检索的模式更迭

本文提出突破传统“单向量嵌入+ANN”检索范式，构建多结构协同的下一代AI检索框架。通过多通道嵌入、组合键兜底、知识图推理、程序化计划与生成-校验闭环，实现高可信、可解释、可验证的智能检索，应对复杂任务中的信息漏检与推理难题，推动RAG迈向结构化、可编程的认知系统。

324 12 12

winx_19970108018

|

8月前

|

数据采集监控 Shell

|

博文

无需Python：Shell脚本如何成为你的自动化爬虫引擎？

Shell脚本利用curl/wget发起请求，结合文本处理工具构建轻量级爬虫，支持并行加速、定时任务、增量抓取及分布式部署。通过随机UA、异常重试等优化提升稳定性，适用于日志监控、价格追踪等场景。相比Python，具备启动快、资源占用低的优势，适合嵌入式或老旧服务器环境，复杂任务可结合Python实现混合编程。

351 0 0

xxrjl

|

8月前

|

人工智能分布式计算 DataWorks

|

博文

阿里云大数据AI产品月刊-2025年8月

阿里云大数据& AI 产品技术月刊【2025年 8 月】，涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

632 2 2

遗忘的我们平平-28588

|

8月前

|

机器学习/深度学习搜索推荐算法

|

博文

基于深度学习的音乐推荐系统

本文探讨了信息过载背景下推荐系统的发展与应用，重点研究基于卷积神经网络的音乐推荐系统设计与实现。内容涵盖推荐系统的发展历程、技术架构及在音乐领域的应用，介绍了系统开发中使用的Python、MySQL与B/S结构等关键技术，并提出了通过输入文字实现音乐推荐的解决方案，旨在提升用户个性化音乐获取效率。

422 1 1

Deephub

|

8月前

|

机器学习/深度学习人工智能 JSON

|

博文

微软rStar2-Agent：新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

Microsoft Research最新推出的rStar2-Agent在AIME24数学基准测试中以80.6%的准确率超越超大规模模型DeepSeek-R1，展现“思考更聪明”而非“更长”的AI推理新方向。

324 8 8

winx_19970108018

|

9月前

|

JSON API 数据格式

|

博文

小红书商品详情API数据解析（附代码）

本内容介绍了小红书商品详情API的使用方法，涵盖接口功能、数据结构及Python请求示例。适用于电商分析、市场研究，助力商家优化运营策略。

299 0 0

Deephub

|

9月前

|

机器学习/深度学习计算机视觉

|

博文

让模型不再忽视少数类：MixUp、CutMix、Focal Loss三种技术解决数据不平衡问题

在机器学习应用中，数据集规模有限且类别分布不均（如医学影像中正类仅占5%）常导致模型偏向多数类，虽准确率高，但少数类识别效果差。本文探讨MixUp、CutMix和Focal Loss三种技术，分别从数据增强与损失函数角度提升小规模不平衡数据集上的模型表现。

617 27 27

Echo_Wish

|

9月前

|

人工智能搜索推荐算法

|

博文

流行趋势到底能不能预测？用数据分析告诉你真相！

476 9 9

青云交（Java大数据AI云原生Python）

|

9月前

|

算法 Java 大数据

|

博文

Java 大视界 --Java 大数据在智能医疗远程手术机器人控制与数据传输中的技术支持（215）

本文深入探讨 Java 大数据在智能医疗远程手术机器人控制与数据传输中的关键技术应用，涵盖数据采集、分布式计算、延迟补偿算法、数据压缩与加密传输等内容，并结合多个跨国手术案例，展示 Java 大数据如何赋能远程医疗，实现高精度、低延迟、安全可靠的手术支持，为医疗行业的数字化转型提供坚实技术支撑。

276 0 0

青云交（Java大数据AI云原生Python）

|

9月前

|

机器学习/深度学习存储分布式计算

|

博文

Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证（211）

本文探讨了Java大数据与机器学习模型在金融风险压力测试中的创新应用。通过多源数据采集、模型构建与优化，结合随机森林、LSTM等算法，实现信用风险动态评估、市场极端场景模拟与操作风险预警。案例分析展示了花旗银行与蚂蚁集团的智能风控实践，验证了技术在提升风险识别效率与降低金融风险损失方面的显著成效。

572 0 0

Deephub

|

9月前

|

PyTorch 编译器算法框架/工具

|

博文

TorchDynamo源码解析：从字节码拦截到性能优化的设计与实践

本文深入解析PyTorch中TorchDynamo的核心架构与实现机制，结合源码分析，为开发者提供基于Dynamo扩展开发的技术指导。内容涵盖帧拦截、字节码分析、FX图构建、守卫机制、控制流处理等关键技术，揭示其动态编译优化原理与挑战。

550 0 0

奔跑的数据

|

9月前

|

数据采集 Java 数据挖掘

|

博文

采集像列车：任务如何不脱轨、数据如何不漏采

每天自动抓取中文新闻站点的实战经验分享，涵盖代理配置、并发处理与热点提取，实现稳定高效的信息采集与推送。

235 0 0

魔羯座liaotianfeile

|

9月前

|

数据采集存储监控

|

博文

淘宝店铺商品全量接口实战：从协议解析到数据治理的端到端解决方案

本文分享了电商数据采集中淘宝店铺全量商品信息获取的完整技术方案，涵盖接口协议分析、参数加密破解及分布式采集架构设计，突出系统性与抗封锁能力，适用于大规模数据采集需求。

439 0 0

啦啦啦191

|

9月前

|

算法 IDE Java

|

博文

Java 项目实战之实际代码实现与测试调试全过程详解

本文详细讲解了Java项目的实战开发流程，涵盖项目创建、代码实现（如计算器与汉诺塔问题）、单元测试（使用JUnit）及调试技巧（如断点调试与异常排查），帮助开发者掌握从编码到测试调试的完整技能，提升Java开发实战能力。

852 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

面试真题

数据库设计三范式

每日必会2

实战演练：三步构建高可靠多智能体应用

每日必会2

基于 RocketMQ LiteTopic 打造企业级 Session 管理

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

AgentScope x RocketMQ：构建多智能体应用组合

每日必会1

大模型基础概念术语解释

大模型评估与调试术语解释3

RabbitMQ集群部署

工程介绍

常见的网络攻击

面向多模态AI平台的品牌内容曝光：从“被动收录”到“主动引用”的GEO工程化实践

运维数据分析：别再只会翻日志了，真正的价值在“洞察”

Airflow 做 ETL，真不是“排个 DAG 就完事儿”：那些年我踩过的坑与悟出的道

【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

数据也要“打标签”：为什么数据版本控制这么重要？

增值税发票查验接口状态码说明-发票识别验真API

GEO 技术落地教育与创业：周有贵博士与张弛教授共探校企协同技术赋能新路径

基于python的外卖配送及数据分析系统

云计算的下半场：资源是底座，智能才是灵魂

京东商品详情价格监控API教程

2026版基于python大数据的电影分析可视化系统

使用 PHP-FPM “冷热池” 分离提升高并发性能

京东图片识别搜索API，搜索相似商品用于多模态数据训练

RAG检索质量差？这5种分块策略帮你解决70%的问题

canal从mysql同步数据到es进行增量同步失效

java调用服务报错415 Content type ‘application/octet-stream‘ not supported

淘宝天猫商品详情API秘籍！轻松获取SKU属性数据

TensorFlow与PyTorch深度对比分析：从基础原理到实战选择的完整指南

基于springboot的大学生心理咨询管理系统

‌1688图片搜索API技术内幕：从特征提取到向量匹配的完整实现路径

基于python评论分析的商品推荐系统设计

Proximal SFT：用PPO强化学习机制优化SFT，让大模型训练更稳定

向量嵌入的天花板与AI检索的模式更迭

无需Python：Shell脚本如何成为你的自动化爬虫引擎？

阿里云大数据AI产品月刊-2025年8月

基于深度学习的音乐推荐系统

微软rStar2-Agent：新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

小红书商品详情API数据解析（附代码）

让模型不再忽视少数类：MixUp、CutMix、Focal Loss三种技术解决数据不平衡问题

流行趋势到底能不能预测？用数据分析告诉你真相！

Java 大视界 --Java 大数据在智能医疗远程手术机器人控制与数据传输中的技术支持（215）

Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证（211）

TorchDynamo源码解析：从字节码拦截到性能优化的设计与实践

采集像列车：任务如何不脱轨、数据如何不漏采

淘宝店铺商品全量接口实战：从协议解析到数据治理的端到端解决方案

Java 项目实战之实际代码实现与测试调试全过程详解

大数据与机器学习

活跃用户

相关产品