大数据与机器学习-博文-第28页-阿里云开发者社区

子午s

|

机器学习/深度学习算法 TensorFlow

|

博文

交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面

交通标志识别系统。本系统使用Python作为主要编程语言，在交通标志图像识别功能实现中，基于TensorFlow搭建卷积神经网络算法模型，通过对收集到的58种常见的交通标志图像作为数据集，进行迭代训练最后得到一个识别精度较高的模型文件，然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面，实现用户上传一张交通标志图片，识别其名称。

899 7 7

郑小健

|

机器学习/深度学习边缘计算 PyTorch

|

博文

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

【8月更文第29天】随着物联网技术的发展，越来越多的数据处理任务开始在边缘设备上执行，以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架，它不仅支持高效的模型训练，还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上，并通过一个具体的示例来展示整个流程。

4112 1 1

hannahc001

|

数据采集人工智能监控

|

博文

赌你一定想要！OpenDataLab首款大模型多模态标注平台Label-LLM正式开源

Label-LLM 是一款专为大模型训练设计的多模态文本对话标注工具，支持团队协作，让标注工作变得简单高效。它不仅涵盖丰富的任务类型，如回答采集、偏好收集和内容评估等，还支持多模态数据标注，包括图像、视频和音频。Label-LLM具备预标注载入功能，能大幅提升工作效率，并提供全方位的任务管理与可视化分析，确保标注质量。快来体验这款强大的标注平台吧！[部署文档](https://github.com/opendatalab/LabelLLM)

3775 0 0

AIGC小王子

|

数据采集 XML JSON

|

博文

「Python入门」Python代码规范（风格）

**Python编码规范摘要** - 编码：使用UTF-8编码，文件开头可声明`# -- coding: utf-8 --`。 - 分号：避免在行尾使用，不用于分隔命令。 - 行长：不超过80字符，长表达式可使用括号换行。 - 缩进：使用4个空格，禁止混用tab。 - 注释：行注释始于`#`和空格，块注释和文档注释遵循特定格式。 - 空行：函数和类定义间用2空行，方法间1空行，内部适当空行。 - 空格：运算符两侧各空一格，逗号后空格，括号内不空格。 - 命名：模块小写，变量下划线分隔，类驼峰式，布尔变量前缀`is_`。 - 引号：保持一致性，可使用单引号或双引号。

2016 1 2

winx_19970108018

|

数据采集 API 开发者

|

博文

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

闲鱼的`goodfish.item_get`非官方API，其数据接口多为私有，适用于授权合作伙伴。获取商品详情数据可考虑官方合作、网络爬虫（需遵守反爬政策）、第三方API服务或直接联系闲鱼官方。合法合规使用数据至关重要。

1825 0 0

阿里云大数据Al技术

|

人工智能自然语言处理算法

|

博文

阿里云PAI大模型评测最佳实践

在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。

43241 15 19

来自：人工智能平台PAI 版块

李麒麟

|

Ubuntu 网络协议应用服务中间件

|

博文

免费泛域名申请以及无限续期

在Ubuntu 20.04上，使用certbot和snapd安装Let's Encrypt证书以实现免费泛域名（如`*.example.com`）的无限续期。首先安装snapd，然后卸载并安装certbot，创建certbot软连接。设置trust-plugin-with-root，安装certbot-dns-cloudflare插件，配置Cloudflare API token。通过certbot certonly命令获取证书，包括子域名，并设置自动续期。将证书导入nginx并验证。最后，创建post-renewal hook以在续期后自动重启nginx。

1604 0 0

Deephub

|

机器学习/深度学习自然语言处理索引

|

博文

Moirai：Salesforce的时间序列预测基础模型

过去几个月，时间序列基础模型发展迅速，包括TimeGPT、Lag-Llama、Google的TimesFM、Amazon的Chronos和Salesforce的Moirai。本文聚焦于Moirai，这是一个用于时间序列预测的通用模型，尤其强调零样本推理能力。Moirai处理各种数据频率、适应未知协变量并生成概率预测。文章介绍了Moirai的三个关键特性：多尺寸补丁投影层、任意变量注意力和混合分布。此外，还对比了Moirai与Chronos和TimeGPT，发现Moirai在性能上未超越Chronos，后者在数据效率上更优，但不支持多变量预测。

1379 2 2

winx_19970108018

|

API 开发者

|

博文

1688API接口推荐：1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret，通过POST或GET请求接口，输入淘口令代码和参数，返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款，确保合法使用API。

1089 0 0

来自：开源大数据平台 E-MapReduce 版块

Byyyi

|

SQL 分布式计算资源调度

|

博文

常用大数据组件的Web端口号总结

这是关于常用大数据组件Web端口号的总结。通过虚拟机名+端口号可访问各组件服务：Hadoop HDFS的9870，YARN的ResourceManager的8088和JobHistoryServer的19888，Zeppelin的8000，HBase的10610，Hive的10002。ZooKeeper的端口包括客户端连接的2181，服务器间通信的2888以及选举通信的3888。

924 2 2

楠竹11

|

人工智能搜索推荐算法

|

博文

以ChatGPT为代表的AIGC发展现状

【1月更文挑战第17天】以ChatGPT为代表的AIGC发展现状

594 1 1

机器智能社区

|

机器学习/深度学习人工智能 API

|

博文

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

OpenSPG 新版发布，支持大模型增强的图谱构建，仅需 3 个步骤快速搭建专属知识图谱。

1723 1 1

winx_19970108018

|

数据采集存储前端开发

|

博文

pdd 商品详情数据接口Python

2045 0 0

Deephub

|

机器学习/深度学习算法 PyTorch

|

博文

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模”

2913 2 2

Lwcah

|

机器学习/深度学习算法数据挖掘

|

博文

【MATLAB 】RBF径向基神经网络回归预测

934 0 0

tommy_tl

|

机器学习/深度学习存储分布式计算

|

博文

在阿里云上训练机器学习模型：逻辑回归和GBDT实践指南

机器学习在当今数据驱动的世界中扮演着关键角色，为业务决策提供了强大的支持。本文将详细介绍如何在阿里云上使用相关产品，训练逻辑回归（Logistic Regression）和梯度提升决策树（Gradient Boosted Decision Trees，GBDT）模型。我们将使用MaxCompute、PAI（机器学习平台）、DataWorks等阿里云产品，通过代码示例和详细说明，带你一步步完成整个流程。

933 0 0

theMilkyWay`

|

机器学习/深度学习移动开发自然语言处理

|

博文

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

1990 0 0

aliyun8832924060

|

分布式计算 Hadoop 大数据

|

博文

本文由阿里云计算平台事业部 MaxCompute 产品经理孟硕为大家带来《持续定义Saas模式云数据仓库+实时搜索》的相关分享。以下是视频内容精华整理，主要包括以下三个部分：1.Why：概述与价值；2.What：应用场景；3.How：最佳实践。

20922 0 0

来自：大数据计算 MaxCompute 版块

游客avsawnkvmmxp6

|

11天前

|

SQL 数据采集机器学习/深度学习

|

博文

不同行业的数字员工，效果为什么差那么多？

截至2026年5月，企业数字员工效果差异根源在于技术路线选择：预置SQL、Text2SQL宽表、预制指标三类方案维护成本随业务复杂度指数增长；而UINO本体语义层路线通过语义化建模，实现高准确率与强泛化能力兼得，维护成本线性增长，更适配金融、政务、制造等复杂组织的长期演进需求。

82 1 1

LuoRR

|

26天前

|

人工智能资源调度 API

|

博文

为什么我建议开发者建一个Discord社群？不只是拉人，更是技术协作的加速器

为AI开发者，观察到技术人技能越深、圈子越窄。通过加入Discord技术社群（CanopyWave），发现高效协作的关键在于“资源调度力”与“信息流转速度”，而这两者皆依赖优质社群。分享了频道分层运营、自然互邀机制、贡献导向规则及轻量建群建议，强调技术社群应以真实需求为起点，重价值、轻规模。

233 2 2

pai_rec_coder

|

1月前

|

存储搜索推荐 Python

|

博文

TorchRec大量使用Jagged Tensor

Jagged Tensor（锯齿张量）是专为变长序列设计的紧凑存储格式，用values+lengths/offsets替代padding，显著节省内存与计算。广泛应用于推荐系统中用户行为、多值标签等不等长特征处理，如HSTU模型中的拼接、拆分与矩阵乘法操作。

262 8 8

来自：人工智能平台PAI 版块

游客odhujb3iura5w

|

2月前

|

芯片

|

博文

两节锂电池保护芯片IC，PW7120在电路设计中的应用

1.两节锂电池保护芯片的工作原理（1）过充保护：防止任何一节电池电压过高起火（2）过放保护：防止任何一节电池电压过低损坏（3）过流/短路保护：防止输出端短路或电流过大烧毁电池 2.两节锂电池保护板电路的要点（1）为什么需要MOS管：（芯片是大脑，MOS管是肌肉，负责切断电流） 3.电路路径与连接方式（1）电池连接顺序（2）充电路径：充电电路+→P+/电池组+→电池组-→MOS管Q2→MOS管Q1→P-/充电电路（3）放电路径：电池组-→MOS管Q2→MOS管Q1→P-/负载+/P+/电池组+ 4.与充电电路的组合 5.与均衡电路的组合

435 3 3

游客odhujb3iura5w

|

2月前

|

芯片

|

博文

三节锂电池保护芯片电路攻略：PW7126设计要点与引脚功能

1，三节锂电池保护芯片的工作原理: ·过充保护：防正任何一节电池电压过高起火 ·过放保护：防止任何一节电池电压过低损坏 ·过流/短路保护：防止输出端短路或电流过大烧毁电池 2，三节锂电池保护板电路的要点 ·为什么需要MOS管：（芯片是大脑，MOS管是肌肉，负责切断电流） 3，电路路径与连接方式 ·电池接线顺序 ·充电路径：充电电路+一P+/电池组+一电池组-一MOS管O1一MOS管O2一采样电阻一P-/充电电路 ·放电路径：电池组-→MOS管Q2→P-/负载-→负载+/电池组+ 二、电路图 PW7126采用8引脚的SOP封装形式，PW7126是一款专用的三节可充电锂电池保护电路，它集高精度过电

484 2 2

Echo_Wish

|

2月前

|

机器学习/深度学习人工智能 PyTorch

|

博文

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

438 14 14

winx_19970108018

|

2月前

|

数据采集缓存自然语言处理

|

博文

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

LitBuy是面向海外用户的中国商品代购集运平台，支持粘贴淘宝/1688链接一键下单，提供多语言、多支付、智能合箱与全程物流追踪。核心盈利来自物流差价、代购服务费及增值服务，技术架构基于Next.js+Java/Node.js微服务，部署于AWS/阿里云国际节点。（239字）

436 0 1

Echo_Wish

|

3月前

|

数据采集人工智能监控

|

博文

大模型不是你家熊孩子：聊聊生成式模型“去偏 / 去毒”流水线怎么落地

291 1 1

vd6jcpp2zzci2

|

3月前

|

存储分布式计算 Java

|

博文

PySpark入门教程（非常详细）从零基础入门到精通

本教程聚焦Spark Core核心原理，基于3.5.8版本，用Python详解RDD五大特性（分区、计算函数、依赖关系、分区器、首选位置）、容错机制、Shuffle、DAG调度及共享变量等，并通过WordCount实战演示。

588 4 4

狸奴算君

|

3月前

|

机器学习/深度学习人工智能 JSON

|

博文

让ChatGPT更懂你：深入浅出解析大模型微调中的强化学习（PPO/DPO篇）

本文深入浅出解析大模型对齐人类偏好的两大核心方法：PPO（需训练奖励模型、在线优化，强但复杂）与DPO（直接学习“好vs差”对比数据、离线高效、更易用）。对比原理、流程与实践，揭示为何DPO正成为主流选择，并强调高质量偏好数据与平台化工具的关键价值。（239字）

646 9 9

cduukj

|

4月前

|

人工智能搜索推荐数据挖掘

|

博文

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

深度AI学术融合百度学术与Google Scholar优势，聚合2.8亿文献，支持中英文语义检索、AI自动摘要、引用追踪及趋势分析；创新提供批量翻译、自定义维度解析与学术报告生成，打造智能科研助手。（239字）

368 7 8

来自：智能搜索推荐版块

Echo_Wish

|

4月前

|

量子技术芯片异构计算

|

博文

量子芯片为什么这么难造？从“画电路”到“跑量子态”，中间全是坑

448 3 3

winx_19970108018

|

4月前

|

JSON 监控 API

|

博文

1688商品查询榜单API技术对接指南（含趋势数据应用实操）

本文详解1688商品查询榜单API对接全流程，涵盖核心能力、前置准备、调用规范与实战避坑。通过热销榜、新品榜等多维数据，助力B2B选品分析、竞品监控与趋势预判，结合实操建议与进阶优化策略，赋能开发者高效构建数据驱动型业务。

418 2 2

夜郎king

|

4月前

|

人工智能定位技术 API

|

博文

参加2025高德空间智能开发者大赛全国总决赛感悟-坚定空间智能之路

文章带你全面的回顾2025年高德空间智能开发者大赛的全部过程，从初赛到决赛，精彩纷呈，不仅有对参赛项目的介绍，也对本次活动中的硬核技术和产品功能进行了深度介绍。同时也分享了博主的参赛历程，所思所感，请您指正。

475 3 3

来自：人工智能平台PAI 版块

winx_19970108018

|

4月前

|

JSON 算法 API

|

博文

淘宝商品列表 API 使用指南

淘宝商品列表API（taobao.items.search）支持按关键词、价格、销量等条件检索商品，返回商品ID、标题、价格等结构化数据，适用于比价、市场分析。需注册开放平台、获取AppKey/AppSecret并实名认证。接口限100次/秒，建议先测沙箱。请求含基础参数与筛选条件，签名通过MD5加密生成。

379 3 3

游客fdogdvk2mf5da

|

4月前

|

数据采集人工智能算法

|

博文

AI数字人技术厂商市场格局观察

AI数字人技术正从娱乐迈向多元实用场景，2024年市场规模达41.2亿元，增速超85%。世优科技深耕全栈技术，拥60余项专利，服务千余家品牌，助力政企智能化升级，推动行业向标准化、生态化发展。

322 1 1

来自：人工智能平台PAI 版块

Eli智数派

|

4月前

|

算法搜索推荐

|

博文

当流量失效之后，企业真正的增长变量是什么？

“系统信任增长范式”提出：当流量红利消退，增长逻辑正从“获取用户”转向“积累可复用的信任资产”。信任不再是话语表达，而是跨时间、跨场景的行为一致性与可验证修复能力。企业需被系统判定为“值得持续推荐”，方能获得长期增长动力。这是一场规则层面的迁移，而非策略优化。

394 4 4

来自：智能搜索推荐版块

游客2hehlpp5ckvw4

|

5月前

|

人工智能 Java 关系型数据库

|

博文

[舍弃，后续需调整][Blog]JPA实现分页需求(☆☆)

本任务要求在博客系统中实现分页查询功能，需掌握SpringBoot、MySQL、Maven及JPA基础知识。建议使用AI辅助开发，预计耗时1-4小时。需自行添加测试数据以展示分页效果，可基于现有工程改造，注重实践而非标准答案。

282 0 0

游客pzghv3hjvp6f2

|

5月前

|

安全 Java 数据安全/隐私保护

|

博文

2.通用权限管理模型

本文介绍了ACL和RBAC两种常见的权限模型。ACL通过直接为用户或角色授权实现访问控制，简单直观；RBAC则基于角色进行权限管理，支持角色继承与职责分离，结构更清晰、易于维护，是现代系统主流的权限设计方式。

183 0 0

游客3y67jmtfeq4fa

|

5月前

|

Kubernetes IDE Java

|

博文

2.部署篇（开发部署）

本文介绍如何将SpringCloud应用部署到Kubernetes云端。通过EDAS导入ACK集群，初始化应用并选择运行环境，开发者可利用IDE插件快速上传JAR/WAR包部署，提升开发效率。后续将讲解运维视角的自动化构建与部署流程。（238字）

141 0 0

游客7km4snizezcsg

|

5月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与回答质量。本文系统解析五种主流分块方法：固定大小、语义、递归、基于文档结构及LLM分块，对比其优缺点与适用场景，并提出组合优化路径，助力构建高效、可信的RAG系统。

396 0 0

游客7km4snizezcsg

|

5月前

|

Linux 数据安全/隐私保护虚拟化

|

博文

虚拟机安装(CentOS7)

准备CentOS7镜像及VMware Workstation（可从百度云下载），提取码已提供。使用VMware创建虚拟机，参考指定教程完成安装。默认登录用户为root，密码由用户自设。确保电脑配置满足运行需求。（238字）

403 0 0

灵杰开发者

|

5月前

|

消息中间件 Java Kafka

|

博文

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

本文介绍OpenAI构建流处理平台的实践与挑战。面对Kafka高可用、Python生态兼容、云环境限制等问题，团队基于PyFlink打造跨区域流处理架构，集成Kafka HA组、自研代理与控制平面，支撑实时Embedding生成、特征计算等场景，并推动开源协作与平台自动化演进。

385 1 1

来自：实时计算 Flink 版块

建站专业户

|

6月前

|

缓存关系型数据库 MySQL

|

博文

网站源码二次开发基础：环境搭建与简单修改步骤

本文围绕 PageAdmin（PA）开源 CMS 展开，聚焦新手二次开发核心：先明确 PHP、MySQL 等环境需求，以 PHPStudy 为例详解安装配置、源码部署、数据库创建及系统安装步骤；再阐述后台登录、基础信息修改、栏目与内容管理、简单模板调整及缓存清理等实操流程，为新手提供清晰易懂的入门指南。

1055 11 11

来自：人工智能平台PAI 版块

数聚酷

|

6月前

|

人工智能搜索推荐物联网

|

博文

GEO优化：AI时代的流量新密码

生成式引擎优化（GEO）是针对AI驱动的搜索引擎（如ChatGPT、DeepSeek、Perplexity等）进行内容优化的策略，旨在提升品牌在AI生成回答中的可见性。一、 GEO优化的核心框架：SEO + RAG GEO优化主要围绕两个核心环节展开，因为AI搜索通常分为“检索”和“生成”两步。 1. SEO (S…

733 2 2

来自：智能搜索推荐版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

赌你一定想要！OpenDataLab首款大模型多模态标注平台Label-LLM正式开源

「Python入门」Python代码规范（风格）

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

阿里云PAI大模型评测最佳实践

免费泛域名申请以及无限续期

Moirai：Salesforce的时间序列预测基础模型

1688API接口推荐：1688口令转换真实链接接口

常用大数据组件的Web端口号总结

以ChatGPT为代表的AIGC发展现状

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

pdd 商品详情数据接口Python

挑战Transformer的新架构Mamba解析以及Pytorch复现

【MATLAB 】RBF径向基神经网络回归预测

在阿里云上训练机器学习模型：逻辑回归和GBDT实践指南

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

大数据技术解析：Hadoop、Spark、Flink和数据湖的对比

SREWorks数智运维平台开源一周年 | 智能运维aiops的回顾与展望

【DSW Gallery】DSW基础使用介绍

【DSW Gallery】COMMON_IO使用指南

基于 Flink 构建大规模实时风控系统在阿里巴巴的落地

阿里云云原生一体化数仓 — 离线实时一体化新能力解读

首次揭秘云原生Hologres存储引擎

持续定义Saas模式云数据仓库+实时搜索

不同行业的数字员工，效果为什么差那么多？

为什么我建议开发者建一个Discord社群？不只是拉人，更是技术协作的加速器

TorchRec大量使用Jagged Tensor

两节锂电池保护芯片IC，PW7120在电路设计中的应用

三节锂电池保护芯片电路攻略：PW7126设计要点与引脚功能

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

大模型不是你家熊孩子：聊聊生成式模型“去偏 / 去毒”流水线怎么落地

PySpark入门教程（非常详细）从零基础入门到精通

让ChatGPT更懂你：深入浅出解析大模型微调中的强化学习（PPO/DPO篇）

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

量子芯片为什么这么难造？从“画电路”到“跑量子态”，中间全是坑

1688商品查询榜单API技术对接指南（含趋势数据应用实操）

参加2025高德空间智能开发者大赛全国总决赛感悟-坚定空间智能之路

淘宝商品列表 API 使用指南

AI数字人技术厂商市场格局观察

当流量失效之后，企业真正的增长变量是什么？

[舍弃，后续需调整][Blog]JPA实现分页需求(☆☆)

2.通用权限管理模型

2.部署篇（开发部署）

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

虚拟机安装(CentOS7)

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

网站源码二次开发基础：环境搭建与简单修改步骤

GEO优化：AI时代的流量新密码

大数据与机器学习

活跃用户

相关产品