大数据与机器学习-博文-第26页-阿里云开发者社区

想飞的雪糕

|

机器学习/深度学习弹性计算人工智能

|

博文

大模型进阶微调篇（三）：微调GPT2大模型实战

本文详细介绍了如何在普通个人电脑上微调GPT2大模型，包括环境配置、代码实现和技术要点。通过合理设置训练参数和优化代码，即使在无独显的设备上也能完成微调，耗时约14小时。文章还涵盖了GPT-2的简介、数据集处理、自定义进度条回调等内容，适合初学者参考。

3104 6 7

来自：人工智能平台PAI 版块

Java开发者

|

IDE Java 编译器

|

博文

Java“找不到符号” 错误怎么查找解决

“找不到符号”是Java编程中常见的编译错误，通常表明代码试图访问未声明或不可见的符号（如类、方法或变量）。解决此问题需检查拼写、导入包是否正确及作用域是否合适。确保使用正确的类路径和库，可有效避免此类错误。若问题依旧，查阅官方文档或使用调试工具定位错误亦为良策。

7775 10 10

郑小健

|

安全网络安全 Android开发

|

博文

深度解析：利用Universal Links与Android App Links实现无缝网页至应用跳转的安全考量

【10月更文挑战第2天】在移动互联网时代，用户经常需要从网页无缝跳转到移动应用中。这种跳转不仅需要提供流畅的用户体验，还要确保安全性。本文将深入探讨如何利用Universal Links（仅限于iOS）和Android App Links技术实现这一目标，并分析其安全性。

2598 0 0

阿里云大数据Al技术

|

人工智能分布式计算大数据

|

博文

2024年是AI应用的元年，以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮，经历了虚拟机时代和云原生时代，正在全面拥抱以大模型为核心的 AI Native 阶段，推动大数据与AI的工作流前所未有地紧密结合。领先大模型、高效的AI计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。 9月20日，2024云栖大会上，阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级，为 AI Native 应用大爆发提供坚实的平台支撑。

2287 4 5

来自：人工智能平台PAI 版块

子午s

|

机器学习/深度学习算法 TensorFlow

|

博文

交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面

交通标志识别系统。本系统使用Python作为主要编程语言，在交通标志图像识别功能实现中，基于TensorFlow搭建卷积神经网络算法模型，通过对收集到的58种常见的交通标志图像作为数据集，进行迭代训练最后得到一个识别精度较高的模型文件，然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面，实现用户上传一张交通标志图片，识别其名称。

899 7 7

郑小健

|

机器学习/深度学习 PyTorch 算法框架/工具

|

博文

数据平衡与采样：使用 DataLoader 解决类别不平衡问题

【8月更文第29天】在机器学习项目中，类别不平衡问题非常常见，特别是在二分类或多分类任务中。当数据集中某个类别的样本远少于其他类别时，模型可能会偏向于预测样本数较多的类别，导致少数类别的预测性能较差。为了解决这个问题，可以采用不同的策略来平衡数据集，包括过采样（oversampling）、欠采样（undersampling）以及合成样本生成等方法。本文将介绍如何利用 PyTorch 的 `DataLoader` 来处理类别不平衡问题，并给出具体的代码示例。

3334 2 2

郑小健

|

机器学习/深度学习边缘计算 PyTorch

|

博文

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

【8月更文第29天】随着物联网技术的发展，越来越多的数据处理任务开始在边缘设备上执行，以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架，它不仅支持高效的模型训练，还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上，并通过一个具体的示例来展示整个流程。

4112 1 1

mwlwop5lh2fhq

|

机器学习/深度学习人工智能自动驾驶

|

博文

AI的奇思妙想之旅：探索未来的无限可能

人工智能（AI）正迅速变革世界，从自动驾驶到智能助手，乃至艺术创作领域。AI不仅能生成多样风格的艺术品，还能创造新艺术形式。例如，利用Python和深度学习库可将普通照片转化为梵高风格的画作。此外，AI还助力建筑设计，通过生成对抗网络（GAN）快速生成建筑草图。在医疗领域，AI支持个性化医疗决策，如通过随机森林算法预测心脏病风险。AI不仅象征技术飞跃，更预示着未来生活的无限可能。

559 2 2

nsu_xxy

|

机器学习/深度学习人工智能算法

|

博文

解决方案评测：通义万相 AI 绘画创作

通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色，为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处，但随着技术的不断发展和优化，相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说，通义万相都是一款值得尝试和探索的 AI 绘画工具。

1563 4 5

winx_19970108018

|

数据采集 API 开发者

|

博文

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

闲鱼的`goodfish.item_get`非官方API，其数据接口多为私有，适用于授权合作伙伴。获取商品详情数据可考虑官方合作、网络爬虫（需遵守反爬政策）、第三方API服务或直接联系闲鱼官方。合法合规使用数据至关重要。

1825 0 0

阿里云大数据Al技术

|

人工智能自然语言处理算法

|

博文

阿里云PAI大模型评测最佳实践

在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。

43241 15 19

来自：人工智能平台PAI 版块

Deephub

|

机器学习/深度学习自然语言处理索引

|

博文

Moirai：Salesforce的时间序列预测基础模型

过去几个月，时间序列基础模型发展迅速，包括TimeGPT、Lag-Llama、Google的TimesFM、Amazon的Chronos和Salesforce的Moirai。本文聚焦于Moirai，这是一个用于时间序列预测的通用模型，尤其强调零样本推理能力。Moirai处理各种数据频率、适应未知协变量并生成概率预测。文章介绍了Moirai的三个关键特性：多尺寸补丁投影层、任意变量注意力和混合分布。此外，还对比了Moirai与Chronos和TimeGPT，发现Moirai在性能上未超越Chronos，后者在数据效率上更优，但不支持多变量预测。

1379 2 2

winx_19970108018

|

API 开发者

|

博文

1688API接口推荐：1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret，通过POST或GET请求接口，输入淘口令代码和参数，返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款，确保合法使用API。

1089 0 0

来自：开源大数据平台 E-MapReduce 版块

Byyyi

|

SQL 分布式计算资源调度

|

博文

常用大数据组件的Web端口号总结

这是关于常用大数据组件Web端口号的总结。通过虚拟机名+端口号可访问各组件服务：Hadoop HDFS的9870，YARN的ResourceManager的8088和JobHistoryServer的19888，Zeppelin的8000，HBase的10610，Hive的10002。ZooKeeper的端口包括客户端连接的2181，服务器间通信的2888以及选举通信的3888。

924 2 2

楠竹11

|

人工智能搜索推荐算法

|

博文

以ChatGPT为代表的AIGC发展现状

【1月更文挑战第17天】以ChatGPT为代表的AIGC发展现状

594 1 1

Deephub

|

存储自然语言处理算法

|

博文

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后，大型语言模型(llm)变得非常受欢迎。从那时起，这些语言模型的使用得到了爆炸式的发展，这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。

702 3 3

机器智能社区

|

机器学习/深度学习人工智能 API

|

博文

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

OpenSPG 新版发布，支持大模型增强的图谱构建，仅需 3 个步骤快速搭建专属知识图谱。

1723 1 1

winx_19970108018

|

数据采集存储前端开发

|

博文

pdd 商品详情数据接口Python

2045 0 0

Lwcah

|

机器学习/深度学习算法数据挖掘

|

博文

【MATLAB 】RBF径向基神经网络回归预测

934 0 0

theMilkyWay`

|

机器学习/深度学习移动开发自然语言处理

|

博文

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

1990 0 0

奔跑的数据

|

数据采集存储安全

|

博文

利用爬虫技术自动化采集汽车之家的车型参数数据

汽车之家是一个专业的汽车网站，提供了丰富的汽车信息，包括车型参数、图片、视频、评测、报价等。如果我们想要获取这些信息，我们可以通过浏览器手动访问网站，或者利用爬虫技术自动化采集数据。本文将介绍如何使用Python编写一个简单的爬虫程序，实现对汽车之家的车型参数数据的自动化采集，并使用亿牛云爬虫代理服务来提高爬虫的稳定性和效率。

1307 0 0

aliyun8832924060

|

分布式计算 Hadoop 大数据

|

博文

大数据技术解析：Hadoop、Spark、Flink和数据湖的对比

Hadoop、Spark、Flink 和数据湖都在大数据处理领域有着重要的地位，但它们各自的优势和劣势也需考虑实际应用场景。Hadoop 适用于批处理任务，Spark 更适合实时分析，而 Flink 则强调低延迟的流式处理。数据湖则是存储和管理大规模多样性数据的选择。

2787 1 1

北村南

|

小程序定位技术 vr&ar

|

博文

【微信小程序AR】基于Kivicube零代码实现微信小程序AR

话不多说，先看实现效果作者之前尝试过Apple公司的ARkit、Google公司的ARCore以及国产的EasyAR和SenseAR。Apple公司和Google公司的AR产品是市面上的主流，功能非常的完善，基本可以满足所有的程序载体，但是开发门槛非常的高。国内这两款AR产品还不错，但是主要针对的是WebAR，在微信小程序上功能不是很完善，作者在网上查找资源后发现国内弥知科技公司的Kivicube产品完美的适配于微信小程序，而且几乎上是零代码。非常适合小白新手。

1944 0 0

北村南

|

索引

|

博文

本文由阿里云计算平台事业部 MaxCompute 产品经理孟硕为大家带来《持续定义Saas模式云数据仓库+实时搜索》的相关分享。以下是视频内容精华整理，主要包括以下三个部分：1.Why：概述与价值；2.What：应用场景；3.How：最佳实践。

20922 0 0

来自：大数据计算 MaxCompute 版块

大数据史记

|

存储容灾大数据

|

博文

分布式存储系统

本次分享内容主要包括三部分：（一）分布式存储系统应该具备的能力；（二）阿里云分布式存储系统盘古的介绍；（三）分布式系统技术展望。

12981 0 1

来自：大数据计算 MaxCompute 版块

游客avsawnkvmmxp6

|

11天前

|

SQL 数据采集机器学习/深度学习

|

博文

不同行业的数字员工，效果为什么差那么多？

截至2026年5月，企业数字员工效果差异根源在于技术路线选择：预置SQL、Text2SQL宽表、预制指标三类方案维护成本随业务复杂度指数增长；而UINO本体语义层路线通过语义化建模，实现高准确率与强泛化能力兼得，维护成本线性增长，更适配金融、政务、制造等复杂组织的长期演进需求。

82 1 1

s4puj2y4jsam4

|

16天前

|

JSON 缓存自然语言处理

|

博文

taocarts深度解析｜反向海淘系统+淘宝/1688一键采，核心代码实战（附避坑指南）

在反向海淘风口下，反向海淘系统的核心竞争力在于“货源对接”与“流程自动化”，而淘宝/1688一键采则是提升代购效率的关键。taocarts作为聚焦反向海淘的代购系统，不仅实现了淘宝、1688的无缝对接，更解决了传统代购系统“商品采集混乱、库存不同步、订单卡顿”等痛点，今天就深度解析taocarts的反向海淘系统 + 淘宝/1688一键采核心功能，附上实战代码和避坑指南，助力开发者快速落地反向海淘独立站、1688代采平台。

132 1 1

LuoRR

|

26天前

|

人工智能资源调度 API

|

博文

1.两节锂电池保护芯片的工作原理（1）过充保护：防止任何一节电池电压过高起火（2）过放保护：防止任何一节电池电压过低损坏（3）过流/短路保护：防止输出端短路或电流过大烧毁电池 2.两节锂电池保护板电路的要点（1）为什么需要MOS管：（芯片是大脑，MOS管是肌肉，负责切断电流） 3.电路路径与连接方式（1）电池连接顺序（2）充电路径：充电电路+→P+/电池组+→电池组-→MOS管Q2→MOS管Q1→P-/充电电路（3）放电路径：电池组-→MOS管Q2→MOS管Q1→P-/负载+/P+/电池组+ 4.与充电电路的组合 5.与均衡电路的组合

435 3 3

winx_19970108018

|

2月前

|

XML JSON 数据挖掘

|

博文

京东商品详情数据一键获取，item_get API接口讲解

京东item_get是获取单商品详情的核心API，支持一键拉取标题、价格、SKU、库存、详情HTML等结构化数据，适用于反向海淘、代购、ERP同步及比价分析等场景，分基础版与完整版，需认证授权后调用。（239字）

374 2 2

游客odhujb3iura5w

|

2月前

|

芯片

|

博文

三节锂电池保护芯片电路攻略：PW7126设计要点与引脚功能

1，三节锂电池保护芯片的工作原理: ·过充保护：防正任何一节电池电压过高起火 ·过放保护：防止任何一节电池电压过低损坏 ·过流/短路保护：防止输出端短路或电流过大烧毁电池 2，三节锂电池保护板电路的要点 ·为什么需要MOS管：（芯片是大脑，MOS管是肌肉，负责切断电流） 3，电路路径与连接方式 ·电池接线顺序 ·充电路径：充电电路+一P+/电池组+一电池组-一MOS管O1一MOS管O2一采样电阻一P-/充电电路 ·放电路径：电池组-→MOS管Q2→P-/负载-→负载+/电池组+ 二、电路图 PW7126采用8引脚的SOP封装形式，PW7126是一款专用的三节可充电锂电池保护电路，它集高精度过电

484 2 2

Echo_Wish

|

2月前

|

机器学习/深度学习人工智能 PyTorch

|

博文

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

438 14 14

winx_19970108018

|

2月前

|

数据采集缓存自然语言处理

|

博文

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

LitBuy是面向海外用户的中国商品代购集运平台，支持粘贴淘宝/1688链接一键下单，提供多语言、多支付、智能合箱与全程物流追踪。核心盈利来自物流差价、代购服务费及增值服务，技术架构基于Next.js+Java/Node.js微服务，部署于AWS/阿里云国际节点。（239字）

436 0 1

Echo_Wish

|

3月前

|

数据采集人工智能监控

|

博文

大模型不是你家熊孩子：聊聊生成式模型“去偏 / 去毒”流水线怎么落地

291 1 1

vd6jcpp2zzci2

|

3月前

|

存储分布式计算 Java

|

博文

PySpark入门教程（非常详细）从零基础入门到精通

本教程聚焦Spark Core核心原理，基于3.5.8版本，用Python详解RDD五大特性（分区、计算函数、依赖关系、分区器、首选位置）、容错机制、Shuffle、DAG调度及共享变量等，并通过WordCount实战演示。

588 4 4

狸奴算君

|

3月前

|

机器学习/深度学习人工智能 JSON

|

博文

让ChatGPT更懂你：深入浅出解析大模型微调中的强化学习（PPO/DPO篇）

本文深入浅出解析大模型对齐人类偏好的两大核心方法：PPO（需训练奖励模型、在线优化，强但复杂）与DPO（直接学习“好vs差”对比数据、离线高效、更易用）。对比原理、流程与实践，揭示为何DPO正成为主流选择，并强调高质量偏好数据与平台化工具的关键价值。（239字）

646 9 9

winx_19970108018

|

3月前

|

数据采集监控 API

|

博文

京东商品详情 API（jd.item_get）

京东商品详情API（jd.item_get）是京东开放平台提供的标准化REST接口，支持获取商品标题、价格、库存、规格、促销及售后等全量信息，适用于数据采集、价格监控、比价工具及代购系统等场景。

443 1 2

狸奴算君

|

4月前

|

数据采集人工智能监控

|

博文

AI也能“专业进修”？不用写代码，教你用微调打造行业专属模型

本文深入浅出解析AI微调（Fine-tuning）技术，聚焦如何让通用大模型成长为行业专才。详解LoRA等高效微调原理，对比RAG优劣，提供数据准备、模型选择、在线训练到效果评估的四步实战指南，助力零基础用户低成本打造专属专业AI。（239字）

309 10 10

cduukj

|

4月前

|

人工智能搜索推荐数据挖掘

|

博文

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

深度AI学术融合百度学术与Google Scholar优势，聚合2.8亿文献，支持中英文语义检索、AI自动摘要、引用追踪及趋势分析；创新提供批量翻译、自定义维度解析与学术报告生成，打造智能科研助手。（239字）

368 7 8

来自：智能搜索推荐版块

winx_19970108018

|

4月前

|

算法数据挖掘 API

|

博文

淘宝店铺全量商品API接口技术实践指南

本文详解淘宝开放平台taobao.item_search_shop接口，涵盖核心功能、参数配置、签名生成、调用流程及实战要点，助力开发者高效获取店铺全量商品数据，实现电商运营与数据分析的自动化对接。（238字）

373 4 4

winx_19970108018

|

4月前

|

JSON 监控 API

|

博文

1688商品查询榜单API技术对接指南（含趋势数据应用实操）

本文详解1688商品查询榜单API对接全流程，涵盖核心能力、前置准备、调用规范与实战避坑。通过热销榜、新品榜等多维数据，助力B2B选品分析、竞品监控与趋势预判，结合实操建议与进阶优化策略，赋能开发者高效构建数据驱动型业务。

418 2 2

夜郎king

|

4月前

|

人工智能定位技术 API

|

博文

参加2025高德空间智能开发者大赛全国总决赛感悟-坚定空间智能之路

文章带你全面的回顾2025年高德空间智能开发者大赛的全部过程，从初赛到决赛，精彩纷呈，不仅有对参赛项目的介绍，也对本次活动中的硬核技术和产品功能进行了深度介绍。同时也分享了博主的参赛历程，所思所感，请您指正。

475 3 3

来自：人工智能平台PAI 版块

winx_19970108018

|

4月前

|

JSON 算法 API

|

博文

淘宝商品列表 API 使用指南

淘宝商品列表API（taobao.items.search）支持按关键词、价格、销量等条件检索商品，返回商品ID、标题、价格等结构化数据，适用于比价、市场分析。需注册开放平台、获取AppKey/AppSecret并实名认证。接口限100次/秒，建议先测沙箱。请求含基础参数与筛选条件，签名通过MD5加密生成。

379 3 3

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

大模型进阶微调篇（三）：微调GPT2大模型实战

Java“找不到符号” 错误怎么查找解决

深度解析：利用Universal Links与Android App Links实现无缝网页至应用跳转的安全考量

AI Native平台，跨越AI应用从创新到生产的鸿沟

交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面

数据平衡与采样：使用 DataLoader 解决类别不平衡问题

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

AI的奇思妙想之旅：探索未来的无限可能

解决方案评测：通义万相 AI 绘画创作

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

阿里云PAI大模型评测最佳实践

Moirai：Salesforce的时间序列预测基础模型

1688API接口推荐：1688口令转换真实链接接口

常用大数据组件的Web端口号总结

以ChatGPT为代表的AIGC发展现状

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

pdd 商品详情数据接口Python

【MATLAB 】RBF径向基神经网络回归预测

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

利用爬虫技术自动化采集汽车之家的车型参数数据

大数据技术解析：Hadoop、Spark、Flink和数据湖的对比

【微信小程序AR】基于Kivicube零代码实现微信小程序AR

【Pytorch--代码技巧】各种论文代码常见技巧

【DSW Gallery】DSW基础使用介绍

【DSW Gallery】COMMON_IO使用指南

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

Hologres揭秘：高性能原生加速MaxCompute核心原理

持续定义Saas模式云数据仓库+实时搜索

分布式存储系统

不同行业的数字员工，效果为什么差那么多？

taocarts深度解析｜反向海淘系统+淘宝/1688一键采，核心代码实战（附避坑指南）

为什么我建议开发者建一个Discord社群？不只是拉人，更是技术协作的加速器

TorchRec大量使用Jagged Tensor

破局协同设计困局：从“各自为战”到“同频共振”，解锁企业创新新动能！

两节锂电池保护芯片IC，PW7120在电路设计中的应用

京东商品详情数据一键获取，item_get API接口讲解

三节锂电池保护芯片电路攻略：PW7126设计要点与引脚功能

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

大模型不是你家熊孩子：聊聊生成式模型“去偏 / 去毒”流水线怎么落地

PySpark入门教程（非常详细）从零基础入门到精通

让ChatGPT更懂你：深入浅出解析大模型微调中的强化学习（PPO/DPO篇）

京东商品详情 API（jd.item_get）

AI也能“专业进修”？不用写代码，教你用微调打造行业专属模型

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

淘宝店铺全量商品API接口技术实践指南

1688商品查询榜单API技术对接指南（含趋势数据应用实操）

参加2025高德空间智能开发者大赛全国总决赛感悟-坚定空间智能之路

淘宝商品列表 API 使用指南

大数据与机器学习

活跃用户

相关产品