大数据与机器学习-最热-第28页-阿里云开发者社区

阿里云大数据Al技术

|

11月前

|

缓存人工智能负载均衡

|

博文

PAI 重磅发布模型权重服务，大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务，通过分布式缓存架构、RDMA高速传输、智能分片等技术，显著提升大语言模型部署效率，解决模型加载耗时过长的业界难题。实测显示，Qwen3-32B冷启动时间从953秒降至82秒（降幅91.4%），扩容时间缩短98.2%。

704 1 2

来自：人工智能平台PAI 版块

Skiner

|

11月前

|

机器学习/深度学习存储算法

|

博文

印刷字体识别系统

一个基于Python的印刷字体识别系统，遵循 GNU_GPL_v3 许可，具备字体倾斜校正、行与字符分割及字符识别功能。采用HOG算法训练SVM模型，使用Chars74K数据集。系统包含简单UI，支持动态加载和结果展示。核心算法包括自适应扩展+连通域辅助的行分割，以及垂直投影+连通域+极小值法细分粘连字符的字符分割。项目文件结构清晰，涵盖图像处理、模型训练与加载等功能模块。

355 6 6

djy3xngakhsl4

|

11月前

|

安全数据挖掘 API

|

博文

车辆车型大全API由探数平台提供，旨在解决企业班车、物流运输及汽车销售等行业对标准化车型数据的需求。传统人工维护车型库效率低且易出错，而该API覆盖主流品牌与车系，包含品牌、车系、销售车型及配置参数等详细信息，适用于车队管理、电商平台及汽车资讯平台。API提供四个子接口：获取品牌、车系、销售车型与配置详情信息，支持高效查询。通过HTTP POST请求即可调用，返回结构化数据，助力企业实现智能化运营与科学决策，在绿色智能交通时代发挥重要作用。

649 4 4

灵杰开发者

|

12月前

|

存储 Rust Go

|

博文

介绍一下这只小水獭 —— Fluss Logo 背后的故事

Fluss是一款开源流存储项目，致力于为Lakehouse架构提供高效的实时数据层。其全新Logo以一只踏浪前行的小水獭为核心形象，象征流动性、适应性和友好性。水獭灵感源于“Fluss”德语中“河流”的含义，传递灵活与亲和力。经过30多版设计迭代，最终呈现动态活力的视觉效果。Fluss计划捐赠给Apache软件基金会，目前已开启孵化提案。社区还推出了系列周边礼品，欢迎加入钉钉群109135004351参与交流！

1101 3 3

来自：实时计算 Flink 版块

winx_19970108018

|

12月前

|

JSON 算法 API

|

博文

淘宝天猫店铺商品API接口全方位接入指南

本攻略介绍淘宝天猫店铺商品API接口的使用方法，涵盖接口概述、请求方式、参数说明及响应数据等内容。核心接口如`tb.items.onsale.get`和`tb.items.inventory.get`，支持获取出售中或库存商品信息，采用HTTP POST请求，返回JSON格式数据。通用参数包括`app_key`、`timestamp`等，业务参数涉及`seller_nick`、分页设置等。响应数据包含商品ID、标题、价格、图片URL等关键信息，助力开发者高效整合与分析店铺商品数据，并提供Python请求示例方便实践。

483 3 3

游客vv4u4wyick5ti

|

15天前

|

SQL 人工智能自然语言处理

|

博文

BI 报表覆盖不到的 80% 长尾需求，如何通过 AI 对话解决？

BI 报表覆盖不到的 80% 长尾需求，不是低价值需求，而是企业真实经营中最动态、最具体、最需要即时判断的问题。

104 5 5

s4puj2y4jsam4

|

1月前

|

自然语言处理运维供应链

|

博文

反向海淘爆发下，多平台铺货效率决定规模｜taocarts 打通 Shopify/Coupang 自动化链路

反向海淘风口下，多渠道铺货已成为跨境创业者规模化运营的核心路径，但传统代购系统源码普遍存在多平台对接缺失、订单与采购割裂、人工操作效率低下等痛点。本文从技术适配与效率提升角度，解析taocarts跨境独立站系统如何通过一键铺货、订单同步、自动采购全链路闭环，打通Shopify、Coupang等海外主流电商平台，结合多语言多货币、运费估算、海外仓备货等能力，帮助反向海淘独立站从业者降本增效，快速抢占多渠道红利，同时规避技术对接与合规风险。

188 1 1

来自：大数据运维SREWorks 版块

奔跑的数据

|

1月前

|

数据采集 Linux API

|

博文

告别403和429：如何搭建24小时不间断的本地数据采集系统

本文分享本地知识库自动化采集的高可用架构实践，直击“假死”痛点：数据停滞、频繁403/429报错。提出三层分离设计（代理层、调度层、业务层），详解代理池精细化运营、指数退避重试及systemd/PM2守护方案，助你构建稳定、可维护的24小时采集系统。

130 2 2

游客yamz6kfvrbc54

|

1月前

|

人工智能自然语言处理机器人

|

博文

AI获客新突破！西外GEO研究中心周有贵博士：GEO技术如何重构跨境获客逻辑

在AI重构流量格局的当下，GEO（生成式引擎优化）正成为AI获客核心引擎。2026年4月12日，西安外国语大学开营仪式上，GEO研究中心负责人、巴黎学院人工智能博士周有贵面向欧洲青年系统解析GEO技术原理与跨境落地三步法——标签体系构建、跨语言语义适配、自动化转化闭环，助力企业实现“被推荐”式精准获客，契合阿里云社区“技术落地、实战赋能”理念。（239字）

147 0 0

游客odhujb3iura5w

|

1月前

|

测试技术芯片

|

博文

5V升压8.4V2A充电芯片在不同环境温度下的表现

这是一个PW4253、8.4V/2A的测试板，5V升压8.4V给两串锂电池充电，测试工具：万用表、电路板、电池模拟仪、直流电源供应器、红外温度仪、热电偶温度仪等。

127 0 0

奔跑的数据

|

2月前

|

数据采集网络协议 Java

|

博文

爬虫踩坑实录：OkHttp 接入爬虫代理报 Too many tunnel connections attempted 深度解析

本文深入解析 OkHttp 使用隧道代理抓取 HTTPS 网站时频发的 `ProtocolException: Too many tunnel connections attempted: 21` 错误，揭示其根源在于风控触发 302 重定向后 OkHttp 盲目重试隧道连接。通过关闭 `followRedirects(false)` 和 `followSslRedirects(false)`，两行配置即可优雅破局，精准捕获拦截响应，提升爬虫稳定性与调试效率。

229 2 2

刘大猫.

|

2月前

|

JSON Java fastjson

|

博文

java工具：《json对象转javabean》

165 2 2

游客nrsbfpn6qhcza

|

2月前

|

监控数据可视化数据处理

|

博文

本地自动化新思路：不用脚本也能让电脑软件自己动起来？1949ai带你探究

本文分享了一线开发者在落地办公自动化时的真实困境与思考：面对CRM、Excel、邮件客户端等多系统混用场景，单纯写代码（如Selenium+PyAutoGUI）易受界面变化、弹窗、环境差异困扰；而可视化流程工具凭借“条件触发+跨应用感知”更稳定易维护。作者主张“代码管数据、工具管交互”的混搭策略，并附实用文件监听代码示例。核心观点：自动化不是炫技，而是把人从机械劳动中解放出来。（239字）

320 5 5

Echo_Wish

|

2月前

|

运维分布式计算自动驾驶

|

博文

别再手写运维脚本了：Operator 才是数据平台的“自动驾驶系统”

199 3 3

奔跑的数据

|

2月前

|

数据采集负载均衡 NoSQL

|

博文

抛弃自建代理池？深度评测隧道代理自动换IP背后的负载均衡架构

本文深度对比自建代理池与隧道代理：前者维护成本高、延迟大、并发易瓶颈；后者通过云端负载均衡实现“一次配置、自动换IP”，显著提升稳定性与扩展性。附Python实战评测，直观展现隧道代理优势。

307 1 2

游客nrsbfpn6qhcza

|

2月前

|

人工智能安全 API

|

博文

1949AI 轻量化 AI 自动化本地自动化工具 + 浏览器自动化 + Agent 自动化工具小说连载生成技术实践

299 1 1

工程师高培

|

2月前

|

存储安全编译器

|

博文

嵌入式软件可靠性：从代码细节到系统化设计的工程实践

本文系统阐述高可靠嵌入式软件设计方法，涵盖编译器可信性、冗余容错、软硬协同、存储保护、人机安全交互、功能安全（ISO 26262/IEC 61508）、DFMEA分析及可维护性评价七大维度，强调可靠性源于全流程工程实践与习惯养成。（239字）

249 1 1

Echo_Wish

|

2月前

|

分布式计算运维 Kubernetes

|

博文

别再手搓集群了：用 Terraform + Helm 把数据平台“养成宠物”变“放养牛群”

239 5 5

Echo_Wish

|

2月前

|

分布式计算 Kubernetes Spark

|

博文

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

329 7 7

Echo_Wish

|

2月前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

从 0 到 1 写一个神经网络训练循环：别再只会 `model.fit()` 了

342 7 7

Echo_Wish

|

2月前

|

机器学习/深度学习数据采集搜索推荐

|

博文

227 7 8

游客vv4u4wyick5ti

|

3月前

|

SQL 存储关系型数据库

|

博文

数据治理决策指南：元数据平台自研与采购的真实成本账单

采购成熟产品，本质上是为“确定性”付费——确定性的高精度、确定性的高效率和确定性的风险规避能力。

152 0 1

大模型玩家七七

|

3月前

|

C++

|

博文

为什么显存总是不够：不是模型的问题

本文揭示显存紧张的真相：它 rarely 源于模型过大，而是系统设计失配的早期信号——用实验思维跑工程负载、并行堆能力替代分阶段判断、以显存兜底策略缺失。显存告警，实为提醒：该优化架构，而非压榨资源。

295 10 10

Echo_Wish

|

3月前

|

存储人工智能运维

|

博文

千亿级训练数据，真不是“存得下就完事了”

208 2 3

游客vv4u4wyick5ti

|

3月前

|

SQL 人工智能自然语言处理

|

博文

数据工程视角：指标平台选型深度对比（BI 指标中心 vs 传统 vs Headless vs 自动化平台）

自动化指标平台为追求业务敏捷性和面向 AI 未来布局的企业提供了关键支撑。

249 3 3

Echo_Wish

|

4月前

|

数据采集人工智能自然语言处理

|

博文

282 11 11

yxybox

|

4月前

|

存储人工智能缓存

|

博文

基于Electron39与Vue3接入DeepSeek-V3.2桌面AI流式聊天Exe程序

2026最新版实战electron39+vite7.2+vue3+deepseek桌面客户端流式输出ai模板。支持暗黑+浅色主题、深度思考、katex公式、mermaid图表解析、本地存储对话等功能。

197 0 0

Echo_Wish

|

4月前

|

运维安全区块链

|

博文

DAO 治理：代码，真的能取代制度吗？——一个老技术人对“代码即法律”的冷静思考

184 8 8

数据出海StockTv

|

4月前

|

API 数据格式 Windows

|

博文

通过 KlineCharts 获取和展示印度股票数据

本文介绍如何通过KlineCharts对接印度股票数据，涵盖获取股票PID、调用K线接口、数据格式转换及图表渲染全流程。支持日线、小时线等周期，并可扩展实时更新功能，助力快速实现K线图展示。

281 1 1

AI未闻花名

|

4月前

|

存储机器学习/深度学习人工智能

|

博文

构建AI智能体：八十一、SVD模型压缩的艺术：如何科学选择K值实现最佳性能

本文探讨了SVD（奇异值分解）在深度学习模型压缩中的应用。随着模型规模不断扩大，面临的存储、计算和能耗问题日益突出。SVD通过将大型矩阵分解为三个特殊矩阵（U、Σ、Vᵀ），并根据奇异值大小进行截断，实现模型的高效压缩。文章详细分析了SVD的数学原理、压缩机制和参数选择策略，重点讨论了如何通过能量保留、目标压缩率和拐点检测等方法确定最佳截断秩k。以一个500×300的用户-物品矩阵为例，实证显示k=32时能实现82.93%的压缩率，99.97%的能量保留和5.86倍计算加速，达到了精度损失与压缩收益的最佳平衡

411 5 5

游客uedbkjnks5gow

|

5月前

|

数据采集领域建模数据库

|

博文

领域模型图(数据架构/ER图)

本文介绍如何通过四色原型法进行领域建模，构建数据架构中的ER图。以风控系统为例，依次解析关键流程、识别时标性原型（MI）、参与方-地点-物品原型（PPT）、角色原型（Role）和描述原型（DESC），最终提炼出实体与关系，形成简洁的ER图，助力数据模型设计。

204 0 0

游客uedbkjnks5gow

|

5月前

|

监控 Java 测试技术

|

博文

微服务保护Sentinel

本课程深入讲解微服务中的雪崩问题及其解决方案，重点介绍阿里开源的流量治理组件Sentinel。内容涵盖Sentinel的部署与整合、限流模式（直接、关联、链路）、流控效果（快速失败、预热、排队等待）、熔断降级、线程隔离及规则持久化等核心知识点，结合Jmeter压测实战，帮助开发者构建高可用的分布式系统。

232 0 0

游客uedbkjnks5gow

|

5月前

|

自然语言处理监控搜索推荐

|

博文

分布式搜索引擎ElasticSearch

Elasticsearch是基于Lucene的开源分布式搜索引擎，支持全文检索、日志分析与实时监控，结合Logstash、Kibana等组成ELK技术栈，广泛应用于搜索、数据分析等领域。

217 0 0

游客uedbkjnks5gow

|

5月前

|

SQL 容灾数据库

|

博文

分布式事务Seata

本章节深入探讨分布式事务问题，涵盖CAP定理与BASE理论，重点讲解Seata框架的XA、AT、TCC及SAGA四种模式原理与实现，并指导搭建高可用TC服务集群，确保微服务架构下的数据一致性与系统可靠性。

302 0 0

游客dqai5324pqw4o

|

5月前

|

自然语言处理搜索推荐 Java

|

博文

ES分布式搜索引擎入门

本课程介绍Elasticsearch的核心概念与应用，涵盖倒排索引原理、IK分词器使用及Java Client操作，实现高效全文检索、增删改查、批量导入、查询优化等功能，提升搜索性能与体验。

172 0 0

游客uedbkjnks5gow

|

5月前

|

Kubernetes IDE 应用服务中间件

|

博文

2.部署篇（开发部署）

本文介绍如何将SpringCloud应用部署到Kubernetes云端，基于EDAS实现快速上云。涵盖集群导入、应用初始化及通过IDE插件高效部署，助力开发者提升发布效率。

181 1 1

游客yk75b7ese7oke

|

5月前

|

Web App开发安全 JavaScript

|

博文

5.跨域处理

本文介绍跨域问题及其解决方案。当协议、域名或端口不同时，浏览器会阻止跨域请求。通过CORS（跨域资源共享）机制，可使用@CrossOrigin注解、全局配置WebMvcConfigurer或自定义过滤器实现安全跨域访问。

225 0 0

be4z2royodrny

|

5月前

|

消息中间件人工智能 NoSQL

|

博文

RocketMQ：A2A协议实现多智能体优化

Apache RocketMQ推出专为AI场景设计的轻量级通信模型LiteTopic，助力多智能体高效协作。通过百万级队列支持、会话状态持久化、断点续传与动态订阅等能力，解决AI应用中长时交互、上下文管理难、资源浪费等问题。结合A2A协议与AgentScope框架，实现高可靠、低延迟的Agent-to-Agent通信，构建稳定可扩展的企业级AI系统架构。（238字）

219 0 0

be4z2royodrny

|

5月前

|

Arthas 监控 Java

|

博文

jvm相关

本文介绍了JVM诊断工具Arthas的核心命令，涵盖实时数据面板（dashboard）、线程堆栈（thread）、JVM信息（jvm）、系统属性与环境变量查看（sysprop/sysenv）、JVM参数调整（vmoption）、性能计数器（perfcounter）、日志级别管理（logger）及堆内存导出（heapdump）等功能，帮助开发者动态监控和调优Java应用。

105 0 0

游客fjfnvw6coc64q

|

5月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring Cloud Gateway，采用Spring WebFlux与Netty实现非阻塞高性能转发。请求由Netty Server接收，匹配路由后经过滤器处理，通过Netty Client转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层基于HTTP，也曾使用Dubbo。JVM方面掌握模型、GC机制、类加载及调优。

148 0 0

游客6aafr7mks52p4

|

5月前

|

监控 Java 调度

|

博文

XXLJob定时任务概述

定时任务是基于时间表达式调度执行的任务，适用于定时对账、超时取消等场景。单体架构可使用轮询、Timer、ScheduledExecutorService、Quartz或SpringTask；分布式环境下需解决重复执行、故障转移等问题，主流方案有XXL-JOB、Elastic-Job、Saturn和ScheduleX。

197 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

PAI 重磅发布模型权重服务，大幅降低模型推理冷启动与扩容时长

印刷字体识别系统

车辆车型大全 API 实战指南:推动交通行业智能化

介绍一下这只小水獭 —— Fluss Logo 背后的故事

淘宝天猫店铺商品API接口全方位接入指南

BI 报表覆盖不到的 80% 长尾需求，如何通过 AI 对话解决？

反向海淘爆发下，多平台铺货效率决定规模｜taocarts 打通 Shopify/Coupang 自动化链路

告别403和429：如何搭建24小时不间断的本地数据采集系统

AI获客新突破！西外GEO研究中心周有贵博士：GEO技术如何重构跨境获客逻辑

5V升压8.4V2A充电芯片在不同环境温度下的表现

爬虫踩坑实录：OkHttp 接入爬虫代理报 Too many tunnel connections attempted 深度解析

java工具：《json对象转javabean》

本地自动化新思路：不用脚本也能让电脑软件自己动起来？1949ai带你探究

别再手写运维脚本了：Operator 才是数据平台的“自动驾驶系统”

抛弃自建代理池？深度评测隧道代理自动换IP背后的负载均衡架构

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

嵌入式软件可靠性：从代码细节到系统化设计的工程实践

别再手搓集群了：用 Terraform + Helm 把数据平台“养成宠物”变“放养牛群”

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

从 0 到 1 写一个神经网络训练循环：别再只会 `model.fit()` 了

日志不是垃圾，是金矿：聊聊基于日志的大规模用户行为建模如何撑起推荐系统

十一年实战沉淀：京东商品详情api深度解析与落地技巧

2026数字助理时代真的要来临了——直接自然语言操作AI助理，马斯克预言真的来了

技术抉择：微调还是 RAG？——以春节祝福生成为例

微调是否会削弱 base model 的原始安全对齐

人机共生时代：AI 不是敌人，而是一起扛活的伙伴

数据治理决策指南：元数据平台自研与采购的真实成本账单

为什么显存总是不够：不是模型的问题

千亿级训练数据，真不是“存得下就完事了”

数据工程视角：指标平台选型深度对比（BI 指标中心 vs 传统 vs Headless vs 自动化平台）

“数据不干净，AI 再聪明也白搭”——聊聊生成式 AI 的数据质量评估与去重那些坑

PPO 实战：第一次跑通 PPO，到底难在哪

微调与安全隐私：为什么微调会放大风险

智能体应用场景拆解：它适合出现在系统的哪些位置？

新能源电池寿命预测模型

基于Electron39与Vue3接入DeepSeek-V3.2桌面AI流式聊天Exe程序

DAO 治理：代码，真的能取代制度吗？——一个老技术人对“代码即法律”的冷静思考

通过 KlineCharts 获取和展示印度股票数据

构建AI智能体：八十一、SVD模型压缩的艺术：如何科学选择K值实现最佳性能

领域模型图(数据架构/ER图)

微服务保护Sentinel

分布式搜索引擎ElasticSearch

分布式事务Seata

ES分布式搜索引擎入门

2.部署篇（开发部署）

5.跨域处理

RocketMQ：A2A协议实现多智能体优化

jvm相关

每日必会2

XXLJob定时任务概述

大数据与机器学习

活跃用户

相关产品

1949AI 轻量化 AI 自动化本地自动化工具 + 浏览器自动化 + Agent 自动化工具小说连载生成技术实践