大数据与机器学习-最热-第44页-阿里云开发者社区

游客vv4u4wyick5ti

|

5月前

|

存储 SQL 运维

|

博文

存量数仓宽表治理：基于 NoETL 语义编织实现指标统一管理

在企业已有的 DWD 明细数据层之上，构建一个统一的语义层，将业务逻辑的定义与物理存储和计算执行彻底解耦。

264 2 3

代理IP不迷路

|

5月前

|

监控安全网络安全

|

博文

8080 和 3128 端口的核心区别及使用场景

HTTP代理常用端口8080与3128各有侧重：8080多用于管理监控（如Web配置界面），易记但可能被防火墙拦截；3128为标准端口，稳定性高，主供客户端正常请求转发。端口可自定义，需据安全与性能需求合理选用。

514 9 9

Echo_Wish

|

5月前

|

算法程序员量子技术

|

博文

从论文到工程：中国量子科技的崛起路径，远比你想的更“硬核”

148 2 2

游客vv4u4wyick5ti

|

5月前

|

SQL 存储 Oracle

|

博文

破解监管溯源难题：从表级血缘到算子级血缘的数据治理升级

算子级血缘则精确记录 SQL 内部的每一个操作步骤（如过滤、连接、聚合），如同清楚货物在流水线上的具体加工过程，对于需要精确口径追溯的监管场景至关重要。

206 0 0

你的橙来啦

|

6月前

|

人工智能调度

|

博文

当西南传统产业遇上智能体来了时代：一场效率与韧性的深度变革

智能体以“感知-决策-执行”闭环能力，正驱动西南传统产业系统性升级：从川渝汽车制造到云南普洱茶、贵州白酒、重庆火锅等场景，实现动态感知、自主优化与闭环执行，突破经验依赖与规则局限，推动单点优化迈向生态重构。

200 3 3

游客vv4u4wyick5ti

|

6月前

|

存储 SQL 人工智能

|

博文

数据工程实践：智能制造企业如何通过NoETL指标平台为数据资产“瘦身”，实现TCO最优？

将开放性的“写代码”问题，收敛为在已治理的指标库中“做选择”的问题，从根本上根治幻觉。

167 0 0

大模型玩家七七

|

6月前

|

机器学习/深度学习安全算法

|

博文

为什么很多团队从 PPO 转向 DPO，却又离不开 PPO

PPO与DPO并非新旧替代关系，而是分属对齐不同阶段的工具：PPO用于行为“塑形”（强干预、纠偏乱序），DPO用于偏好“定型”（稳定微调、精细排序）。选型关键看模型是否已基本可控——乱则用PPO，稳则用DPO。

286 1 1

你的橙来啦

|

6月前

|

人工智能搜索推荐 API

|

博文

智能体来了从 0 到 1：数据、工具与规则的协同范式

随着AI深入产业，单一模型已难支撑复杂流程。智能体作为以大模型为核心、融合数据（知识/记忆）、工具（执行接口）与规则（行为约束）的协同系统，实现感知—推理—执行闭环。其价值在于三者可复用、可治理的工程化协同，而非模型本身。

279 6 6

奔跑的数据

|

6月前

|

数据采集人工智能监控

|

博文

解析规则交给 AI，是效率提升还是系统隐患？

本文通过严谨的A/B实验，对比人工编写与大模型生成HTML解析规则在真实爬虫场景中的表现。结果显示：大模型虽初筛成功率尚可（92%），但面对页面改版、多地区代理等常见变化时稳定性骤降（失败率升至35%），且易引入静默错误。结论明确：大模型宜作规则“候选生成器”，而非生产环境“唯一决策者”。

241 1 1

大模型玩家七七

|

6月前

|

安全物联网

|

博文

为什么你调的不是参数，而是风险

大模型微调不是调参，而是风险管理：学习率决定偏离幅度，batch size影响偏差放大，epoch迫使模型“选边”，LoRA rank拓展失控空间。参数非“强度 knob”，实为“风险杠杆”——每次调整都在重分配行为分布。成熟微调，重在理解并可控承担风险。

290 1 1

智能体来了小锅

|

6月前

|

人工智能算法机器人

|

博文

智能体来了，智创未来，科技的下一个奇点在哪？

自1956年达特茅斯会议以来，AI历经起伏。如今，具备自主规划、长期记忆与工具调用能力的智能体（Agent）正推动我们逼近科技奇点：从模仿人类转向自我演进、群体涌现与自动科学发现。开发者使命亦升维——成为目标对齐者与数字伦理构建者。奇点，始于每个智能体的理性进化。（239字）

209 1 1

大模型玩家七七

|

6月前

|

安全算法机器人

|

博文

客服大模型 ≠ 问答机器人

客服大模型常因被误当作问答系统而失败。其核心并非“答对”，而是“判断”：识别风险、控制成本、把握边界。单纯依赖RAG与知识库无法解决策略问题，需通过微调与偏好对齐（如PPO/DPO）训练模型“何时不答”“如何回应”。成功关键在于理解客服是决策系统，而非技术堆砌。

242 1 1

ysyyyyy

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

智能体领航员：解码幕后大脑”的技术架构与运行逻辑

智能体领航员是融合多模态感知、大模型推理与工具调用的AI系统，具备感知、理解、规划与学习能力。它通过“感知-决策-执行”闭环，化身工作助手、家庭管家与健康顾问，实现主动服务。其核心技术涵盖NLP、CV、RAG、多智能体协作与强化学习，正迈向更自主、更智能的未来生活导航。

230 0 0

智能体来了小锅

|

6月前

|

人工智能 Rust 算法

|

博文

趁智能体之势，融入智创未来，书写精彩人生

开发者如何抓住AI Agent红利？告别焦虑，从“码农”进阶“指挥官”。智能体不是替代你，而是放大你的创造力。未来属于善用Agent、构建数字员工团队的超级个体。融入浪潮，用智慧解决真问题，书写属于技术人的精彩人生。

142 0 0

实时数仓Hologres团队

|

6月前

|

存储搜索推荐

|

博文

漫画说：为什么你的“增量计算”越跑越慢？ ——90%的实时数仓团队都踩过的坑，藏在这几格漫画里

面对海量数据，传统全量计算导致实时更新效率低下。阿里云 Hologres 通过有状态增量计算，仅处理变更数据并持久化中间状态，实现秒级刷新、降本增效，真正让“增量”摆脱重复扫描历史的困局。

316 1 1

来自：实时数仓 Hologres 版块

大模型玩家七七

|

6月前

|

数据采集存储监控

|

博文

显存不够？16G显卡驾驭13B模型的计算与优化全指南

显存不够也能玩转大模型！本文详解如何用16G显卡成功微调13B参数模型，从显存精准计算、INT8量化、LoRA低秩适配到激活检查点优化，手把手教你规避OOM风险。结合实战代码与监控技巧，显存占用压至14.5GB内，效果显著优于7B模型。低成本实现高效大模型微调，个人开发者和小团队必备指南！

1141 0 0

Echo_Wish

|

6月前

|

消息中间件分布式计算监控

|

博文

数据一边跑，隐私不能裸奔：聊聊流处理里的差分隐私怎么玩

343 6 6

Lwcah

|

6月前

|

机器学习/深度学习传感器算法

|

博文

Python | Stacking回归和SHAP可解释性分析回归预测及可视化算法

本教程基于Python实现Stacking回归与SHAP可解释性分析，涵盖地球科学、医学、工程等多领域回归预测应用。结合CatBoost、LightGBM、XGBoost等模型，采用贝叶斯、随机与网格搜索优化参数，并通过SHAP值可视化特征贡献，提升模型性能与可解释性，适用于科研与实际项目。

877 2 2

Echo_Wish

|

6月前

|

自动驾驶数据挖掘新能源

|

博文

别光看销量：聊聊电动车市场背后的数据分析逻辑

201 13 13

Echo_Wish

|

6月前

|

供应链 API 区块链

|

博文

区块链不是银弹，但在供应链溯源这件事上，它真的“对路”了

203 6 6

Echo_Wish

|

6月前

|

消息中间件关系型数据库 MySQL

|

博文

别再被 Exactly-Once 忽悠了：端到端一致性到底是怎么落地的？

296 8 8

Eli智数派

|

6月前

|

博文

当系统开始“记账”，企业到底在被记什么？

在系统主导流量的时代，增长不再依赖短期投放，而是源于长期行为积累的“信用账本”。系统默默记录企业的五大维度：一致性、耐性、真实互动、错误修复与可预测性，构建其“主体画像”。当企业仍紧盯ROI时，系统已在评估信任。真正的增长，是值得被长期推荐的结果。

346 7 7

来自：智能搜索推荐版块

游客vv4u4wyick5ti

|

6月前

|

SQL 存储运维

|

博文

企业落地 ChatBI，如何构建可信可靠的数据底座？

传统宽表架构在数据口径一致性、维护成本和灵活性上已难以支撑企业级 ChatBI 的规模化应用，而基于 NoETL 明细语义层的方案正成为新一代数据底座的主流选择。

270 7 7

Echo_Wish

|

6月前

|

消息中间件存储分布式计算

|

博文

流处理跑得再快，也怕“失忆” ——聊聊 RocksDB、快照与恢复这点事儿

326 10 10

Lwcah

|

6月前

|

机器学习/深度学习传感器算法

|

博文

Python | K折交叉验证的参数优化的KNN（k近邻）预测及可视化算法

本教程介绍基于Python的KNN回归预测及四种参数优化方法（网格/随机/贝叶斯搜索、K折交叉验证），涵盖地球科学、医学、工程等多领域应用，附完整代码与数据可视化，助你快速掌握机器学习建模流程。

293 0 0

奔跑的数据

|

6月前

|

数据采集人工智能前端开发

|

博文

爬虫真的能“自愈”吗？说点不那么好听的实话

AI难以让爬虫完全自适应页面变化。真正可靠的系统不追求“永不崩溃”，而是“快速定位、低成本修复”。规则解析应为主流，AI仅作兜底；其价值不在替代人工，而在辅助处理模糊场景，降低维护成本。

193 3 3

AI未闻花名

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

构建AI智能体：八十四、大模型涌现能力的解构分析：从量变到质变的神秘跃迁

大模型涌现能力的出现标志着人工智能发展的一个重要转折点。这些能力不是通过专门编程获得的，而是模型规模达到临界点时自然产生的质变。这种现象不仅证明了规模在人工智能发展中的关键作用，也为我们理解智能的本质提供了新的视角。涌现能力的出现预示着人工智能正从专门化工具向通用智能系统转变。随着模型规模的继续扩大和架构的不断优化，我们可能会看到更多令人惊讶的能力涌现。

599 7 7

Eli智数派

|

6月前

|

弹性计算监控 Cloud Native

|

博文

云原生时代，“信任”才是开发者的核心基础设施：4个技术维度筑牢增长底盘

在云原生时代，信任已成为技术发展的基础设施。本文深入剖析为何“信任”决定开源项目、API与云产品的成败，并从行为一致、承诺可验证、错误修复、输出稳定四大技术维度，揭示构建长期信任的实操路径，助力开发者实现可持续增长。

338 1 1

来自：智能搜索推荐版块

Eli智数派

|

6月前

|

算法搜索推荐

|

博文

当流量失效之后，企业真正的增长变量是什么？

“系统信任增长范式”提出：当流量红利消退，增长逻辑正从“获取用户”转向“积累可复用的信任资产”。信任不再是话语表达，而是跨时间、跨场景的行为一致性与可验证修复能力。企业需被系统判定为“值得持续推荐”，方能获得长期增长动力。这是一场规则层面的迁移，而非策略优化。

449 4 4

来自：智能搜索推荐版块

Echo_Wish

|

6月前

|

安全算法分布式数据库

|

博文

链上太堵了怎么办？聊聊区块链可扩展性的三种主流解法

309 5 5

AI未闻花名

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

构建AI智能体：八十、SVD知识整理与降维：从数据混沌到语义秩序的智能转换

本文探讨了SVD（奇异值分解）在知识整理与降维中的应用。针对文本数据的高维稀疏性问题，SVD通过矩阵分解自动识别潜在主题和语义关系，实现从词袋到语义理解的转变。核心优势包括：1）自动发现无标签数据中的主题结构；2）挖掘词语间的深层语义关联；3）过滤噪声并构建知识层次。通过示例展示，SVD将文档从高维词空间投影到低维主题空间，显著提升了存储效率（压缩率达94%）和计算性能，同时支持可视化和语义解释。这种技术实现了从数据到智慧的转化，为信息检索、推荐系统等应用提供了智能化的知识发现能力。

269 9 9

Q一个好的名字容易让人记住你2483558220

|

6月前

|

机器学习/深度学习算法数据可视化

|

博文

基于YOLOv8+pyqt5的pcb缺陷检测系统

针对电子制造中PCB缺陷检测难题，本研究提出基于YOLOv8与PyQt5的智能检测系统。融合深度学习高精度识别与图形界面友好交互，实现短路、断路等微小缺陷的高效、自动化检测，提升检测精度与效率，降低企业成本，推动电子制造向智能化、低成本化发展。

273 6 6

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习人工智能算法

|

博文

基于深度学习的摔倒检测系统

针对人口老龄化背景下老年人摔倒问题突出，传统检测方法存在佩戴不便、隐私泄露等局限，本研究基于深度学习技术，利用YOLOv8模型与Python开发非接触式摔倒检测系统。通过高效算法与高质量数据集实现精准识别，具备实时性高、适应性强等优势，可广泛应用于家庭、社区及医疗机构，有效提升老年人安全监护水平，减轻照护负担，推动人工智能在智慧医疗领域的融合应用。

336 4 4

游客j5dxgbpxlsi6c

|

7月前

|

存储 Java 编译器

|

博文

Java泛型类型擦除以及类型擦除带来的问题

本文详解Java泛型的类型擦除机制及其带来的问题。介绍泛型擦除后保留的原始类型、编译时类型检查原理、自动类型转换、与多态的冲突、静态成员限制等核心问题，并结合代码示例说明其底层实现和解决方案，帮助深入理解Java泛型的本质与局限性。（238字）

220 0 0

游客j5dxgbpxlsi6c

|

7月前

|

数据可视化项目管理开发者

|

博文

业务架构图

业务架构图是将复杂业务拆解为层级、模块与功能的可视化工具，旨在清晰表达业务关系与逻辑。它分组织、能力、应用等层，助力客户理解与开发者协作，提升系统设计与迭代效率。

137 0 0

游客pgsmpobfp2oac

|

7月前

|

存储 JSON NoSQL

|

博文

MongoDB常用命令

本节介绍MongoDB常用命令，涵盖数据库的创建与删除（use、show dbs、dropDatabase）、集合操作（显式/隐式创建、drop）及文档的CRUD。以articledb数据库和comment集合为例，演示数据插入语法及注意事项，如NumberInt使用、_id自动生成等，帮助快速掌握MongoDB基础操作。（239字）

144 1 1

游客pgsmpobfp2oac

|

7月前

|

运维 Devops 开发工具

|

博文

生产环境缺陷管理

为解决大型团队多分支开发中bug管理混乱、人为疏漏导致生产事故的问题，我们基于go-git开发了分布式工具git-poison。它实现bug的追溯、查询与发布卡点，自动化同步“投毒-解毒”信息，阻塞带未修复bug的版本发布，降低协同成本，避免“重复翻车”。已集成至发布与运维平台，提升缺陷管理效率与系统稳定性。

380 0 0

f5bjkfn5ojoyg

|

7月前

|

存储 C++

|

博文

C++变量类型

C++变量类型包括基本类型如bool、char、int、float、double等，支持整数、浮点数、字符和布尔值的存储。还包含指针、数组、结构体、类、共用体等复合类型。变量命名由字母、数字、下划线组成，首字符须为字母或下划线。支持变量声明与定义分离，局部变量需显式初始化，静态变量自动初始化为0。

282 1 1

f5bjkfn5ojoyg

|

7月前

|

编译器 C++

|

博文

C++基本语法

C++程序由对象组成，对象是类的实例，具有状态和行为。类是对象的模板，方法定义行为，成员变量描述状态。首个程序输出“Hello World”，包含头文件、主函数、命名空间和注释。分号结束语句，支持单行//和多行/*...*/注释，关键字不可作标识符。三字符组较少使用。

180 0 0

f5bjkfn5ojoyg

|

7月前

|

人工智能算法图形学

|

博文

C++基本介绍

C++是一种静态类型、编译式通用编程语言，支持过程化、面向对象和泛型编程。作为C的超集，它兼具高效性能与硬件控制能力，广泛应用于游戏开发、嵌入式系统、金融交易、图形处理及科学计算等领域，具有封装、继承、多态和抽象等特性，提升代码复用性与可维护性。（238字）

270 0 0

游客dvcta5xqvznk2

|

7月前

|

关系型数据库应用服务中间件 Nacos

|

博文

Nacos配置中心

本章深入讲解Nacos配置中心实战，涵盖配置管理、热更新、共享配置及优先级规则，并通过搭建Nacos集群实现高可用部署，结合Bootstrap加载机制与@RefreshScope实现动态配置，助力微服务高效治理。

218 0 0

游客dvcta5xqvznk2

|

7月前

|

负载均衡 Java 应用服务中间件

|

博文

微服务网关与配置中心

本文介绍了微服务架构下的网关路由与鉴权机制，重点讲解使用Spring Cloud Gateway实现请求路由、负载均衡及JWT身份校验。通过Nacos实现服务发现，网关统一处理前端请求，解决多入口问题，并在全局过滤器中实现用户鉴权，保障系统安全。

268 0 0

游客dvcta5xqvznk2

|

7月前

|

Java Maven Nacos

|

博文

Eureka服务注册与发现

本文详细介绍Eureka工程的搭建与部署，包括服务注册中心的创建、user-service和order-service接入流程，并实现多实例部署。通过配置说明与常见问题解决方案，帮助开发者快速掌握SpringCloud服务注册与发现机制，为后续微服务架构演进奠定基础。（239字）

117 0 0

游客dvcta5xqvznk2

|

7月前

|

消息中间件 Java 数据安全/隐私保护

|

博文

异步消息组件MQ基础

本文介绍了MQ（消息队列）的基本概念，重点对比了同步调用与异步调用的区别，通过生活实例帮助理解。异步调用通过消息中间件实现解耦、异步处理和流量削峰，提升系统性能。常见的MQ如RabbitMQ、Kafka等适用于高并发场景。RabbitMQ基于AMQP协议，支持多语言，结合SpringAMQP可轻松实现消息收发。文章还演示了RabbitMQ的安装、配置、数据隔离及工作队列模型，强调“能者多劳”机制以优化消费效率。

180 0 0

游客dqai5324pqw4o

|

7月前

|

测试技术

|

博文

发布模式

蓝绿部署通过两套系统（运行的“绿色”与待发布的“蓝色”）实现零停机发布与快速回滚。金丝雀发布则逐步替换旧版本，适合大规模集群。A/B测试用于比较不同版本效果，三者各有适用场景，非万能方案。

125 0 0

游客dqai5324pqw4o

|

7月前

|

存储缓存 NoSQL

|

博文

Redis：内存陡增100%深度复盘

事故因大KEY调用量随流量增长，导致带宽占满，Redis内存使用率迅速达100%。虽有淘汰机制，但缓冲区激增（尤其Pub/Sub输出缓冲）占用大量内存，超出实例容量，致使SET/GET超时崩溃。根本原因为客户端缓冲区失控，非数据本身膨胀，最终Redis无法服务。

205 0 0

游客dqai5324pqw4o

|

7月前

|

缓存安全 Java

|

博文

第五章 Spring框架

Spring的IOC（控制反转）指将对象创建交给容器管理，DI（依赖注入）则实现对象间的依赖关系自动注入。Bean默认单例非线程安全，作用域可设singleton、prototype等，通过注解如@Component、@Autowired等简化配置，AOP实现日志、事务等横切关注点。

127 0 0

星辰归鱼

|

7月前

|

SQL 关系型数据库 MySQL

|

博文

MySQL 高效学习指南：从入门到优化的科学路径

本文提供MySQL高效学习三阶段路径：入门（1周）掌握基础操作与数据思维；核心深化（2周）突破多表关联、事务等复杂场景；优化进阶（2周）理解索引、执行计划与性能调优。结合实操案例与资源推荐，助力从新手到精通，真正掌握解决实际问题的数据库能力。

260 0 0

游客2hehlpp5ckvw4

|

7月前

|

存储 SQL 关系型数据库

|

博文

3-MySQL篇

本文系统梳理MySQL核心知识点，涵盖查询语句的书写与执行顺序、多表连接方式、索引类型及底层结构（B+树）、聚簇与非聚簇索引区别、回表查询与覆盖索引优化、最左前缀原则、索引失效场景、SQL性能分析（EXPLAIN）及慢查询定位等，助力高效数据库开发与调优。

152 1 1

游客dvcta5xqvznk2

|

7月前

|

XML JSON Java

|

博文

什么是RESTful

RESTful是一种基于资源的API设计规范，强调URI代表资源、使用HTTP动词进行操作，实现统一标准、结构清晰、易于维护的接口风格，解决传统接口行为不规范问题。

151 1 1

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

存量数仓宽表治理：基于 NoETL 语义编织实现指标统一管理

8080 和 3128 端口的核心区别及使用场景

从论文到工程：中国量子科技的崛起路径，远比你想的更“硬核”

破解监管溯源难题：从表级血缘到算子级血缘的数据治理升级

当西南传统产业遇上智能体来了时代：一场效率与韧性的深度变革

数据工程实践：智能制造企业如何通过NoETL指标平台为数据资产“瘦身”，实现TCO最优？

为什么很多团队从 PPO 转向 DPO，却又离不开 PPO

智能体来了从 0 到 1：数据、工具与规则的协同范式

解析规则交给 AI，是效率提升还是系统隐患？

为什么你调的不是参数，而是风险

智能体来了，智创未来，科技的下一个奇点在哪？

客服大模型 ≠ 问答机器人

智能体领航员：解码幕后大脑”的技术架构与运行逻辑

趁智能体之势，融入智创未来，书写精彩人生

漫画说：为什么你的“增量计算”越跑越慢？ ——90%的实时数仓团队都踩过的坑，藏在这几格漫画里

显存不够？16G显卡驾驭13B模型的计算与优化全指南

数据一边跑，隐私不能裸奔：聊聊流处理里的差分隐私怎么玩

Python | Stacking回归和SHAP可解释性分析回归预测及可视化算法

别光看销量：聊聊电动车市场背后的数据分析逻辑

区块链不是银弹，但在供应链溯源这件事上，它真的“对路”了

别再被 Exactly-Once 忽悠了：端到端一致性到底是怎么落地的？

当系统开始“记账”，企业到底在被记什么？

企业落地 ChatBI，如何构建可信可靠的数据底座？

流处理跑得再快，也怕“失忆” ——聊聊 RocksDB、快照与恢复这点事儿

Python | K折交叉验证的参数优化的KNN（k近邻）预测及可视化算法

爬虫真的能“自愈”吗？说点不那么好听的实话

构建AI智能体：八十四、大模型涌现能力的解构分析：从量变到质变的神秘跃迁

云原生时代，“信任”才是开发者的核心基础设施：4个技术维度筑牢增长底盘

当流量失效之后，企业真正的增长变量是什么？

链上太堵了怎么办？聊聊区块链可扩展性的三种主流解法

构建AI智能体：八十、SVD知识整理与降维：从数据混沌到语义秩序的智能转换

基于YOLOv8+pyqt5的pcb缺陷检测系统

基于深度学习的摔倒检测系统

Java泛型类型擦除以及类型擦除带来的问题

业务架构图

MongoDB常用命令

生产环境缺陷管理

C++变量类型

C++基本语法

C++基本介绍

Nacos配置中心

微服务网关与配置中心

Eureka服务注册与发现

异步消息组件MQ基础

发布模式

Redis：内存陡增100%深度复盘

第五章 Spring框架

MySQL 高效学习指南：从入门到优化的科学路径

3-MySQL篇

什么是RESTful

大数据与机器学习

活跃用户

相关产品