大数据与机器学习-博文-第46页-阿里云开发者社区

阿里云实时计算Flink

|

机器学习/深度学习存储消息中间件

|

博文

FeatHub：流批一体的实时特征工程平台

本次分享中，将介绍 FeatHub，一个由阿里云自研并开源的实时特征平台。我们将介绍 FeatHub 的架构设计，已经完成的工作，以及近期的发展计划。

5747 0 0

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

存储分布式计算资源调度

|

博文

Spark on k8s 在阿里云 EMR 的优化实践

本文整理自阿里云技术专家范佚伦在7月17日阿里云数据湖技术专场交流会的分享。

2404 0 0

来自：开源大数据平台 E-MapReduce 版块

May-Hologres

|

SQL 存储供应链

|

博文

使用实践｜Hologres性能调优全方位解读

本文是Hologres阿里妈妈用户根据实际业务总结的经验贴，希望通过本文内容，能帮助大家更好的理解在Hologres中如何做性能调优，从而帮助业务实现更优的性能。

11591 6 10

来自：实时数仓 Hologres 版块

阿里云实时计算Flink

|

SQL 存储 Java

|

博文

Flink 1.14 新特性预览

一文了解 Flink 1.14 版本新特性及最新进展

4695 0 1

来自：实时计算 Flink 版块

亢海鹏

|

存储 SQL 分布式计算

|

博文

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

2279 0 0

来自：大数据计算 MaxCompute 版块

开发者说

|

机器学习/深度学习人工智能分布式计算

|

博文

开放下载！《SaaS模式云数据仓库实践手册》

本书的制作目的在于让MaxCompute帮助企业构建全托管的现代化数仓，简化数据洞察、加速价值实现。

44464 0 0

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

SQL 分布式计算 Spark

|

博文

钉钉群直播【Spark Relational Cache 原理和实践】

主要介绍Relational Cache/物化视图的历史和背景，以及EMR Spark基于Relational Cache加速Spark查询的技术方案，及如何通过基于Relational Cache的数据预计算和预组织，使用Spark支持亚秒级响应的交互式分析使用场景。

9454 0 0

来自：开源大数据平台 E-MapReduce 版块

木酱

|

弹性计算数据可视化 API

|

博文

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

~ DataV 后台21日晚上线，现在暂时还不能用哦 ~ DataV 增加了一个新的数据代理协议，旨在提供更安全的数据查询。它将 SQL 查询字符串和数据库 id 加密后传到这个应用，而后这个应用连接数据库将查询后的结果返回到 DataV 的页面中。根据新的协议，我做了一个示例应用在githu

47701 141 197

来自：数据可视化DataV 版块

游客7q6odlcu3jr5c

|

18天前

|

JSON API 数据格式

|

博文

国内电商平台商品详情API返回数据Python模型格式

本接口服务支持淘宝、京东、1688三大平台商品详情数据获取，返回标准化Python字典，涵盖标题、价格、库存、图片、SKU、规格、评价等核心字段，含OAuth2.0/签名认证、调用示例及统一解析函数，助力电商数据高效对接。

106 1 1

小唐同学.

|

18天前

|

存储安全应用服务中间件

|

博文

PbootCMS常见报错与解决方案大全：从权限配置到版本兼容

本文汇总PbootCMS常见报错（权限不足、SQLite扩展未启用、伪静态异常、图片压缩、PHP版本不兼容等），提供精准原因分析与实操解决方案，涵盖static/data/runtime目录权限设置、php.ini配置、配置文件参数调优等，助力高效建站运维。（239字）

78 0 0

winx_19970108018

|

1月前

|

人工智能 JSON 监控

|

博文

天猫商品详情API数据解析

天猫商品详情API解析方案，涵盖taobao/tmall.item.get接口字段说明、JSON结构、解析代码及SKU/详情图/规格提取。支持价格库存、竞品监测、舆情预警等场景，AI智能清洗、卖点解析与爆款预测，助力中小卖家高效用数。（239字）

151 0 0

yxybox

|

1月前

|

存储人工智能 API

|

博文

基于Flutter3.41+Dart3.11+DeepSeek生成式AI对话应用App助手

Flutter3.41+Dart3+Dio+Getx+Markdown聚合DeepSeek-chat实战AI流式打字智能会话模板。新增深度思考模式、latex公式、mermaid图表，代码高亮/复制代码、图片预览、链接、表格等功能。

148 4 4

pai_rec_coder

|

1月前

|

机器学习/深度学习自然语言处理 iOS开发

|

博文

Feature Generator（FG）特征算子配置指南

本文档全面介绍Feature Generator（FG）的各类特征算子配置方法，涵盖基础（ID/原始特征）、计算（表达式）、交叉（组合）、查找（Lookup/Match）、文本（重叠/BM25）、序列、预处理（分词/归一化）及字符串处理（正则替换/切片）等9大类算子，附详细配置示例与说明。

336 9 9

来自：智能搜索推荐版块

智象九维

|

2月前

|

人工智能运维安全

|

博文

基于云边协同的电线电缆押出机智能调机解决方案设计与落地

本方案基于云边协同架构，融合阿里云云原生技术，破解线缆行业押出机调机效率低、原料损耗高、数据孤岛等难题;边缘毫秒级实时控制+云端Al训练优化，实现调机提效80%、降耗60%，部署快、运维省、可扩展

353 9 9

游客nrsbfpn6qhcza

|

2月前

|

人工智能安全调度

|

博文

1949AI 轻量化 AI 自动化办公场景应用方案本地自动化工具与浏览器自动化实践

1949AI是一款轻量化AI办公自动化工具，基于Python实现，无需高性能算力，支持本地文件处理、网页数据抓取与Agent自主调度。模块化设计、低资源占用、全程离线运行，适配个人开发者与小型团队，安全合规、开箱即用。（239字）

523 11 11

狸奴算君

|

3月前

|

存储人工智能物联网

|

博文

大模型微调内存优化全攻略：无需昂贵显卡，打造你的AI助手

本文深入解析大模型微调为何“烧显存”，从原理（模型参数、优化器状态、激活值三大显存杀手）到实战：推荐QLoRA等高效方法，结合梯度累积、序列截断、混合精度与DeepSpeed优化，并介绍LLaMA-Factory Online等低门槛平台，助开发者用消费级显卡轻松微调专属模型。（239字）

440 22 22

狸奴算君

|

3月前

|

数据采集人工智能监控

|

博文

让大模型“开小灶”：手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调（Fine-tuning）技术：揭示通用大模型“懂常识却不懂行”的根源，详解LoRA等高效微调原理，对比RAG适用场景，并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。（239字）

426 1 1

大模型玩家七七

|

3月前

|

人工智能缓存 C++

|

博文

模型不该背的锅：哪些风险应该交给系统

本文揭示大模型项目中常见误区：问题常不在模型本身，而在系统责任边界模糊。模型只应负责生成与理解，而合规审查、回答授权、输入过滤、规则执行、兜底逻辑和一致性保障等，必须由系统层承担。厘清“能力”与“责任”之分，方能构建稳健AI系统。

187 4 4

你的橙来啦

|

3月前

|

人工智能 JSON 自然语言处理

|

博文

智能体来了从 0 到 1：工作流在智能体系统中的真实作用

本文探讨生成式AI落地关键：工作流（Workflow）是智能体从模型能力迈向工程能力的核心。它通过结构化拆解任务、编排逻辑、调度工具、拦截风险，为大模型注入确定性与可控性，成为生产级智能体的基石。

487 7 7

你的橙来啦

|

4月前

|

人工智能自动驾驶算法

|

博文

智能体来了！2026 AI 元年：在全新赛道上重构人类生产力边界

2026年被定义为“智能体元年”：AI从“能说”跃升为“能干”，实现自主决策、跨系统协作与具身执行。产业迎来智能体市场、数字劳动力网络和可信治理三大爆发点，人类角色转向目标设定与智能体调度。技术终指向人的升华。（239字）

443 3 3

cduukj

|

4月前

|

人工智能搜索推荐数据挖掘

|

博文

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

深度AI学术融合百度学术与Google Scholar优势，聚合2.8亿文献，支持中英文语义检索、AI自动摘要、引用追踪及趋势分析；创新提供批量翻译、自定义维度解析与学术报告生成，打造智能科研助手。（239字）

364 7 8

来自：智能搜索推荐版块

Echo_Wish

|

4月前

|

机器学习/深度学习存储人工智能

|

博文

量子机器学习：AI 的下一个维度，真不是玄学

311 9 9

Echo_Wish

|

4月前

|

消息中间件分布式计算 Kafka

|

博文

别再纠结了：Lambda 还是 Kappa？流批统一这件事，真没你想得那么玄乎

323 5 5

游客dvcta5xqvznk2

|

5月前

|

消息中间件 Java Nacos

|

博文

SpringCloud概述

Spring Cloud是微服务的统一解决方案，具备注解驱动、开箱即用、组件丰富等特点，通过版本命名规范整合多子项目。Spring Cloud Alibaba融合Nacos、Sentinel、Seata等阿里开源组件，成为主流技术栈选择。

301 0 0

星辰归鱼

|

5月前

|

SQL 关系型数据库 MySQL

|

博文

MySQL 并发控制核心原理与实践技巧

本文深入解析MySQL并发控制核心原理，涵盖事务隔离级别、锁机制与乐观锁实现，结合电商秒杀、订单重复等高并发场景，提供实战解决方案与优化技巧，助你平衡数据一致性与系统性能。

239 0 0

be4z2royodrny

|

5月前

|

Java

|

博文

Excel读取并数据List/Map-POI

该Java工具类通过POI解析Excel文件，利用反射将每行数据映射为VO对象，并存入全局Map。支持日期、数字等类型处理，适用于.xls格式模板，需确保VO属性与列数一致并生成set/get方法。

167 0 0

nick7259836553-25887

|

5月前

|

消息中间件负载均衡 Linux

|

博文

RabbitMQ部署指南

本文介绍了RabbitMQ在CentOS7中基于Docker的单机与集群部署方案，涵盖镜像安装、DelayExchange插件配置、普通模式与镜像模式集群搭建，并重点演示了仲裁队列的高可用特性及集群扩容操作，助力实现消息中间件的高可靠与可扩展。

221 0 0

游客hua3a7ejc2opu

|

5月前

|

人工智能 JSON 安全

|

博文

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者为跨模型工具调用的标准化协议，实现系统解耦与生态扩展；后者是模型调用外部功能的内置机制。二者互补协同，推动AI应用向高效、开放、安全演进。

412 0 0

游客hua3a7ejc2opu

|

5月前

|

人工智能缓存自然语言处理

|

博文

大模型推理与应用术语解释

本文系统介绍了大语言模型核心概念：推理、生成式AI、检索增强生成（RAG）、提示工程、上下文学习、代理、多模态学习与语义搜索。涵盖其原理、应用与优化技术，展现大模型在内容生成、知识融合、任务执行与跨模态理解等方面的前沿进展，揭示高效、智能AI系统的构建路径。

268 1 1

游客7km4snizezcsg

|

5月前

|

人工智能 NoSQL Java

|

博文

项目名称：多领域智能微服务系统技术架构：SpringBoot + Spring Cloud Alibaba + Spring AI + Nacos + MySQL + Redis + RabbitMQ + Neo4j + MCP 项目描述：本系列项目覆盖教育、金融、物流、家政等领域，基于微服务架构融合大模型与AI技术，实现智能推荐、风险控制、路径优化与服务调度等核心功能。结合RAG、知识图谱、MCP协议与多模态数据处理，提升系统智能化水平。通过Spring AI对接通义千问等大模型，利用Tool Calling整合微服务，构建高并发、可扩展的智能决策与调度引擎，赋能行业数字化升级。

173 0 0

游客aucdvipmftp5m

|

5月前

|

消息中间件存储 Java

|

博文

异步消息组件MQ高级

本文围绕消息中间件（如RabbitMQ）的可靠性机制展开，涵盖生产者重试与确认、消费者确认、消息持久化、失败处理、幂等性及延迟消息等核心内容。重点讲解如何通过重试机制、Confirm/Return确认模式保障消息发送可靠；通过手动或自动ACK确保消费可靠性；并结合定时任务实现失败消息重发，最终构建高可用的消息系统。

331 0 0

IvanCodes

|

5月前

|

SQL 存储 Apache

|

博文

三、Hive DDL数据库操作

Hive 中的数据库（Schema）是构建数据仓库的基础单位。这次我们来了解 Hive 中创建、查看、切换、修改与删除数据库的 DDL 操作语法与用法，涵盖 COMMENT、LOCATION、DBPROPERTIES 等常用参数，辅以丰富示例与练习，助你扎实掌握 Hive 数据库管理核心能力。

471 11 11

winx_19970108018

|

5月前

|

消息中间件自然语言处理供应链

|

博文

Pandabuy复制指南：淘宝1688代购系统搭建

Pandabuy以“反向海淘”模式为核心，助力海外用户代购中国商品，主打欧美市场。通过物流收费、佣金、汇率差等多元盈利，两年营收达40亿元。依托网红营销、低价策略与社区运营，实现高速增长。系统搭建推荐微服务架构，对接淘宝1688 API，强化合规与供应链管理，结合SEO、社媒营销及风控体系，打造高效安全的国际代购平台。

497 1 1

AI实战结果专家

|

5月前

|

人工智能索引 SEO

|

博文

AI搜索时代GEO与SEO双螺旋理论的三层核心逻辑（收藏版）

陈欢，毕业于西南政法大学，悟空空科技CEO，深耕品牌营销十余年，AI搜索双螺旋理论创立者。兼具技术实力与企业品牌运营能力，服务过地产，滋补，微商，农产品等行业品牌。目前专注于：AI营销IP，AI智能体，AI律师营销等领域。服务企业运用ai实现降本80%，得到了企业客户与广大学员的一致好评。以实战案例输出硬核知识，助力品牌方在ai时代从内容到转化的深度转型升级。

405 4 4

来自：智能搜索推荐版块

Echo_Wish

|

5月前

|

人工智能运维安全

|

博文

SOC 2.0 来了：不是加人加班，而是加“智能”！——智能化安全运营中心的建设之道

443 15 15

遗忘的我们平平-28588

|

5月前

|

机器学习/深度学习数据采集自然语言处理

|

博文

基于深度学习+NLP豆瓣电影数据爬虫可视化推荐系统

本研究构建基于深度学习与NLP的豆瓣电影数据系统，融合LSTM、BERT与CNN技术，实现高效爬取、情感分析、个性化推荐与动态可视化，提升影视数据分析效率与推荐精准度，推动产业智能化升级。

491 6 6

Lwcah

|

6月前

|

机器学习/深度学习数据可视化算法

|

博文

Python | 随机搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将带你掌握Python中XGBoost模型的随机搜索调参、SHAP可解释性分析及多种可视化技术，涵盖特征相关性热图、散点密度图、超参数优化等核心内容，助力科研论文与实际项目应用。

509 2 2

信风AI外贸获客智能体

|

6月前

|

机器学习/深度学习人工智能 API

|

博文

从外贸数据孤岛到智能引擎：信风AI多Agent架构深度解析

传统外贸获客面临数据孤岛、决策固化、工具割裂三大困境。信风TradeWind AI通过多Agent协同架构，构建“数据-决策-执行”闭环，实现从单点工具到智能协同系统的跃迁，打造可扩展、可定制、可进化的AI获客引擎。

457 9 10

Echo_Wish

|

6月前

|

存储运维 Serverless

|

博文

Serverless 不是“无服务器”，而是“别再让服务器绑架你的创新”

248 11 11

数聚酷

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

教育行业如何做GEO？让AI成为你的课程推荐官

过去，学生找课程靠搜索；现在，他们直接问AI：“附近有哪些性价比高的编程课？”或“商科最好的在线大学？”——AI不会简单罗列链接，而是直接推荐答案。如果你的教育机构没被AI“看见”，可能已经错过了新一轮流量红利。作为深耕GEO领域的实战团队，数聚酷科技结合教育行业特性，总结出以下可落地的GEO优化策略，帮助你的课程和…

490 6 6

来自：智能搜索推荐版块

数聚酷

|

6月前

|

人工智能安全数据可视化

|

博文

教育行业如何用AI搜索优化实现低成本获客？数聚酷实战指南

一、教育行业的“流量焦虑”与AI搜索的破局机会 “用户越来越难被触达了！”这是深圳某K12机构负责人的真实感叹。传统广告投放成本飙升，社交媒体流量见顶，用户决策路径从“主动搜索”转向“向AI提问”——数据显示，2025年教育类AI搜索咨询量同比激增350%，但能被AI优先推荐的机构不足5%。数聚酷的观察：AI搜索（G…

514 3 3

来自：智能搜索推荐版块

数聚酷

|

6月前

|

人工智能自然语言处理机器人

|

博文

把品牌塞进AI的“嘴”里——数聚酷亲测有效的3个小动作

数聚酷亲测3招：改官网为Q&A、拆白皮书碎片、蹭热点评论，让AI主动引用品牌。短内容+数据背书+高权重平台互动，轻松把品牌“喂”进AI答案。

324 1 1

来自：智能搜索推荐版块

Echo_Wish

|

6月前

|

人工智能大数据数据挖掘

|

博文

当电竞遇上大数据：原来高手是“算”出来的

388 9 9

灵杰开发者

|

6月前

|

人工智能并行计算算法

|

博文

为什么 OpenSearch 向量检索能提速 13 倍？

本文介绍在最新的 OpenSearch 实践中，引入 GPU 并行计算能力与 NN-Descent 索引构建算法，成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。

906 25 29

来自：智能搜索推荐版块

阿里云大数据

|

6月前

|

人工智能分布式计算大数据

|

博文

阿里云大数据AI产品月刊-2025年10月

大数据& AI 产品技术月刊【2025年 10 月】，涵盖 10 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

587 1 1

遗忘的我们平平-28588

|

6月前

|

数据可视化搜索推荐大数据

|

博文

2026版基于python大数据的旅游可视化及推荐系统

本研究聚焦基于Python大数据的旅游可视化与推荐系统，利用Python在数据处理、分析和可视化方面的优势，结合Django框架与MySQL数据库，构建高效、个性化的旅游推荐平台。通过爬取多源旅游数据，运用机器学习算法挖掘用户偏好，实现精准推荐；借助Matplotlib、Seaborn等工具进行数据可视化，直观展示景点分布、客流趋势等信息。系统不仅提升游客决策效率与体验，也助力旅游企业优化产品设计与营销策略，推动行业数字化转型与智能化发展。

690 11 11

winx_19970108018

|

7月前

|

自然语言处理监控 API

|

博文

速卖通商品详情API秘籍！轻松获取SKU属性数据

速卖通商品详情API（aliexpress.item.get）支持通过编程获取商品标题、价格、SKU、库存、销量、物流模板、评价及店铺信息，适用于价格监控、选品分析等场景。接口支持多语言返回，采用AppKey+AppSecret+Token认证，需签名验证，确保安全调用。

478 2 2

奔跑的数据

|

7月前

|

数据采集监控 NoSQL

|

博文

优化分布式采集的数据同步：一致性、去重与冲突解决的那些坑与招

本文讲述了作者在房地产数据采集项目中遇到的分布式数据同步问题，通过实施一致性、去重和冲突解决的“三板斧”策略，成功解决了数据重复和同步延迟问题，提高了系统稳定性。核心在于时间戳哈希保证一致性，URL归一化和布隆过滤器确保去重，分布式锁解决写入冲突。

409 2 2

蒋星熠Jaxonic

|

7月前

|

JavaScript 前端开发安全

|

博文

Vue 3 + TypeScript 现代前端开发最佳实践（2025版指南）

每日激励：“如果没有天赋，那就一直重复”。我是蒋星熠Jaxonic，一名执着于代码宇宙的星际旅人。用Vue 3与TypeScript构建高效、可维护的前端系统，分享Composition API、状态管理、性能优化等实战经验，助力技术进阶。

1062 1 1

Wenzhuang

|

8月前

|

存储 SQL 分布式计算

|

博文

MaxCompute 聚簇优化推荐原理

基于历史查询智能推荐Clustered表，显著降低计算成本，提升数仓性能。

498 4 4

来自：大数据计算 MaxCompute 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

FeatHub：流批一体的实时特征工程平台

Spark on k8s 在阿里云 EMR 的优化实践

使用实践｜Hologres性能调优全方位解读

Flink 1.14 新特性预览

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

开放下载！《SaaS模式云数据仓库实践手册》

钉钉群直播【Spark Relational Cache 原理和实践】

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

国内电商平台商品详情API返回数据Python模型格式

PbootCMS常见报错与解决方案大全：从权限配置到版本兼容

天猫商品详情API数据解析

基于Flutter3.41+Dart3.11+DeepSeek生成式AI对话应用App助手

Feature Generator（FG）特征算子配置指南

基于云边协同的电线电缆押出机智能调机解决方案设计与落地

1949AI 轻量化 AI 自动化办公场景应用方案 本地自动化工具与浏览器自动化实践

大模型微调内存优化全攻略：无需昂贵显卡，打造你的AI助手

让大模型“开小灶”：手把手教你打造能聊业务的专属AI

模型不该背的锅：哪些风险应该交给系统

智能体来了从 0 到 1：工作流在智能体系统中的真实作用

智能体来了！2026 AI 元年：在全新赛道上重构人类生产力边界

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

量子机器学习：AI 的下一个维度，真不是玄学

别再纠结了：Lambda 还是 Kappa？流批统一这件事，真没你想得那么玄乎

SpringCloud概述

MySQL 并发控制核心原理与实践技巧

Excel读取并数据List/Map-POI

RabbitMQ部署指南

大模型应用开发中MCP与Function Call的关系与区别

大模型推理与应用术语解释

参考简历模板

异步消息组件MQ高级

三、Hive DDL数据库操作

Pandabuy复制指南：淘宝1688代购系统搭建

AI搜索时代GEO与SEO双螺旋理论的三层核心逻辑（收藏版）

SOC 2.0 来了：不是加人加班，而是加“智能”！——智能化安全运营中心的建设之道

基于深度学习+NLP豆瓣电影数据爬虫可视化推荐系统

Python | 随机搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

从外贸数据孤岛到智能引擎：信风AI多Agent架构深度解析

Serverless 不是“无服务器”，而是“别再让服务器绑架你的创新”

教育行业如何做GEO？让AI成为你的课程推荐官

教育行业如何用AI搜索优化实现低成本获客？数聚酷实战指南

把品牌塞进AI的“嘴”里——数聚酷亲测有效的3个小动作

当电竞遇上大数据：原来高手是“算”出来的

为什么 OpenSearch 向量检索能提速 13 倍？

阿里云大数据AI产品月刊-2025年10月

2026版基于python大数据的旅游可视化及推荐系统

速卖通商品详情API秘籍！轻松获取SKU属性数据

优化分布式采集的数据同步：一致性、去重与冲突解决的那些坑与招

Vue 3 + TypeScript 现代前端开发最佳实践（2025版指南）

MaxCompute 聚簇优化推荐原理

大数据与机器学习

活跃用户

相关产品

1949AI 轻量化 AI 自动化办公场景应用方案本地自动化工具与浏览器自动化实践