大数据与机器学习-博文-第11页-阿里云开发者社区

miaogs

|

博文

lesson1

本人小白，初次学习PAI,欢迎和大家一起交流学习这个PAI学习。阿里API直播课程的“手把手在线直播实操：机器学习PAI教你如何品酒”，我这边也就是学习一下。 数据源: 数据大小:96.1 KB 字段数量:12 使用组件:归一化,拆分,SQL脚本,读数据表

804 0 0

来自：人工智能平台PAI 版块

黯灭_邓彬

|

弹性计算分布式计算 druid

|

博文

E-MapReduce 4月产品新功能

1164 0 0

来自：开源大数据平台 E-MapReduce 版块

tagnzi

|

博文

lr

第一次尝试 LR 数据源: 数据大小:770 KB 字段数量:20 使用组件:拆分,读数据表,特征编码

1019 0 0

来自：人工智能平台PAI 版块

翻滚的樱桃肉

|

11月前

|

数据挖掘计算机视觉 Windows

|

博文

Origin2024 汉化安装专业解析｜企业级部署教程+批量激活解决方案

Origin是一款由OriginLab开发的科学绘图与数据分析软件，支持Windows系统，提供丰富的2D/3D图形模板和强大的数据分析功能，如统计、信号处理、图像处理等。本文详细介绍Origin2024的下载与安装步骤，包括解压文件、运行安装程序、输入序列号、安装路径设置及破解方法，帮助用户快速完成软件安装与激活。

6286 21 21

cknote

|

博文

心脏病预测案例_test_2455

test 数据源: 数据大小:7.49 KB 字段数量:15 使用组件:归一化,拆分,过滤式特征选择,SQL脚本,读数据表,类型转换

1050 0 0

来自：人工智能平台PAI 版块

游客a33iifhc5zd4g

|

6月前

|

Python Windows

|

博文

Miniconda 安装与环境配置全流程图解（2025 最新版）

Miniconda 可以看作是 Anaconda 的“轻装版”，只自带 conda 包管理器与基础的 Python 运行时。它体积小、部署速度快，特别适合按需创建与管理虚拟环境的用户。与 Anaconda 相比，Miniconda 不会预先安装一大堆科学计算库，你可以根据项目需求再单独选择、安装需要的包，因此整体更轻巧、更灵活。本文将手把手演示在 Windows 下安装 Miniconda 的全过程：从下载安装器、完成向导配置、设置环境变量，到最后的基础验证与简单示例，帮助你迅速把 Miniconda 用起来。

7952 12 14

来自：人工智能平台PAI 版块

开源大数据EMR

|

博文

E-MapReduce产品探秘，扩展开源生态云上的能力

E-MapReduce的产品能力介绍，通过EMR来构建高效的云上大数据平台，优化云上的使用成本，更快的计算效率。

853 0 0

来自：开源大数据平台 E-MapReduce 版块

开源大数据EMR

|

分布式计算 Spark

|

博文

8月14日Spark社区直播【Spark Shuffle 优化】

本次直播介绍EMR Spark 在shuffle方面的相关优化工作，主要包含shuffle 优化的背景以及shuffle 优化的设计方案，最后会介绍Spark shuffle 在 TPC-DS测试中的性能数据

915 0 0

来自：开源大数据平台 E-MapReduce 版块

阿里云实时计算Flink

|

流计算调度缓存

|

博文

Apache Flink 进阶（一）：Runtime 核心机制剖析

本文主要介绍 Flink Runtime 的作业执行的核心机制。首先介绍 Flink Runtime 的整体架构以及 Job 的基本执行流程，然后介绍在这个过程，Flink 是怎么进行资源管理、作业调度以及错误恢复的。最后，本文还将简要介绍 Flink Runtime 层当前正在进行的一些工作。

2648 0 1

来自：实时计算 Flink 版块

啦啦啦191

|

7月前

|

Windows

|

博文

Microsoft Activation Scripts v3.6 （MAS）激活工具安装教程!中文汉化版(激活工具)

Microsoft Activation Scripts v3.6（MAS）是一款开源、轻量级的批量激活工具，支持HWID、KMS38、TSforge等多种方式，可离线永久激活Win7至Win11及Office全系列。兼容旧系统如Vista，操作简单，无误报风险。

10818 1 2

阿里云实时计算Flink

|

Java Shell API

|

博文

如何从 0 到 1 参与 Flink 社区？

本文首先介绍为何要参与开源社区以及在参与开源社区的过程中需要注意什么，然后重点介绍如何参与 Flink 社区以及在社区里面提交 PR 的整个流程。

1702 0 1

来自：实时计算 Flink 版块

开源大数据EMR

|

博文

节日快乐！！！

“我们的未来该有多酷”

870 0 1

来自：开源大数据平台 E-MapReduce 版块

Deephub

|

9月前

|

人工智能边缘计算自然语言处理

|

博文

普通电脑也能跑AI：10个8GB内存的小型本地LLM模型推荐

随着模型量化技术的发展，大语言模型（LLM）如今可在低配置设备上高效运行。本文介绍本地部署LLM的核心技术、主流工具及十大轻量级模型，探讨如何在8GB内存环境下实现高性能AI推理，涵盖数据隐私、成本控制与部署灵活性等优势。

9182 0 0

啦啦啦191

|

7月前

|

人工智能 UED

|

博文

【下载安装】Adobe XD 免费下载与安装教程

Adobe XD 2025是一款专业的UI/UX设计工具，支持矢量绘图、交互原型制作与响应式布局，兼容PS、AI及Jira、Slack等协作平台。内置动画、语音交互功能，提升设计效率。安装前需关闭杀毒软件，解压后以管理员身份运行安装程序即可。

4374 0 0

1371174247805583

|

1月前

|

人工智能安全 IDE

|

博文

2026年最值得关注的 6个开源 AI 工具

2026年，开源AI已迈入“Agent+Toolchain”时代。本文精选6个真正落地的开源工具：LingtiStudio（AI视频全自动生产）、OpenClaw（系统级自动化Agent）、Ollama（本地LLM基石）、Dify（AI应用开发平台）、Cline（编程Agent）和Gemini CLI（终端AI入口），聚焦自主执行、本地优先、多模型兼容与开发者深度集成四大趋势。（239字）

1389 3 5

bean_stalk

|

Java 分布式计算 Spark

|

博文

Spark Codegen浅析

Codegen是Spark Runtime优化性能的关键技术，核心在于动态生成java代码、即时compile和加载，把解释执行转化为编译执行。Spark Codegen分为Expression级别和WholeStage级别，分别针对表达式计算和全Stage计算做代码生成，都取得了数量级的性能提升。本文浅析Spark Codegen技术原理。

5148 0 0

来自：开源大数据平台 E-MapReduce 版块

游客s7fjknmuwki4m

|

27天前

|

人工智能自然语言处理 API

|

博文

Edge浏览器虽功能强大，却常因无法彻底卸载让用户体验困扰。本文推荐一款专清工具——Edge Remover，支持一键移除Edge及WebView2运行时，两种模式灵活选择，操作简单，无需专业技能，彻底清理不留残留，释放C盘空间，提升系统纯净度，是Windows用户必备的卸载利器。

4611 2 2

ChenAI_TGF

|

4月前

|

数据采集人工智能文字识别

|

博文

PDF 转 Markdown 神器：MinerU 2.5 (1.2B) 部署全攻略

MinerU是由OpenDataLab推出的开源PDF解析工具，支持精准布局分析、公式识别与表格提取。本文详解其2.5-2509-1.2B版本在Linux下的部署流程，涵盖环境搭建、模型下载、核心配置及实战应用，助你高效处理复杂PDF文档，提升AI数据清洗效率。

2429 3 7

ChenAI_TGF

|

5月前

|

编译器程序员 Linux

|

博文

实用工具：VS Code 配置 Markdown 编译器全指南

本文介绍如何在VS Code中配置高效Markdown写作环境，通过启用内置预览、安装Markdown All in One与Markdown Preview Enhanced插件，并配置Princexml实现PDF等格式导出，全面提升编辑、预览与输出效率，适合程序员、学生及内容创作者使用。

3580 2 2

吃一大口奶酪

|

1月前

|

编解码人工智能测试技术

|

博文

Anthropic最强王炸！Claude Opus 4.7来了：编程能力暴涨13%（附如何使用到Opus 4.7）

Anthropic发布Claude Opus 4.7：视觉能力跃升——图像分辨率提升3倍，支持2576像素长边，高精度解析截图、PDF、手写笔记；编码能力稳步增强（SWE-bench达87.6%）；新增/ultrareview代码审查命令、xhigh推理档位及安全防护机制；价格不变，仍为$5/$25每百万token。

1338 1 3

BugShare

|

3月前

|

人工智能 API 数据安全/隐私保护

|

博文

如何使用 LiteLLM 网关代理统一管理你的大模型

大模型使用混乱？费用失控、切换成本高、权限难管？LiteLLM 是轻量实用的大模型网关，统一 OpenAI 兼容接口，纳管 OpenAI、Qwen、本地 vLLM/Ollama 等多源模型。支持 Docker Compose 一键部署、虚拟 Key 权限控制、预算限额与全链路可观测性，业务代码零改造即可接入。

2521 8 10

来自：人工智能平台PAI 版块

游客ztmzh6tnotqpi

|

15天前

|

人工智能安全数据挖掘

|

博文

密钥配置+报错排查｜OpenClaw 适配DeepSeek完整教程

本教程为OpenClaw（v2.6.4/v2.6.6）对接DeepSeek大模型的零基础图文指南，涵盖实名认证、API密钥创建、配置测试及模型选用全流程，步骤清晰、截图详实，助Windows用户10分钟完成安全稳定接入。（239字）

535 0 0

AI小怪兽

|

机器学习/深度学习人工智能文字识别

|

博文

ultralytics YOLO11 全新发布！（原理介绍+代码详见+结构框图）

本文详细介绍YOLO11，包括其全新特性、代码实现及结构框图，并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进，如C3k2、C2PSA模块和更轻量级的分类检测头，显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别，并展示了训练过程和结果的可视化

25760 0 2

电力程序小学童

|

博文

【免费资料】IEEE33节点系统参数及拓扑图visio

初学者入门配电网可参考经典的IEEE 33节点系统，此系统在文献中广泛应用。资源包括节点和支路参数的Excel表格及Visio的网络拓扑图，可免费下载。配电网以闭环设计增强灵活性和可靠性，故障恢复涉及网络拓扑约束。提供的MATLAB相关链接探讨了孤岛、重构及故障恢复策略。

7221 0 0

Deephub

|

机器学习/深度学习并行计算 PyTorch

|

博文

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题，分析其根源为预编译二进制文件不支持sm_120架构，并提出解决方案：使用PyTorch Nightly版本、更新CUDA工具包至12.8。通过清理环境并安装支持新架构的组件，成功解决兼容性问题。文章总结了深度学习环境中硬件与框架兼容性的关键策略，强调Nightly构建版本和环境一致性的重要性，为开发者提供参考。

9014 64 64

游客yi5amrqumiddw

|

1月前

|

传感器数据采集人工智能

|

博文

AI+数字孪生：从实时映射到智能决策的技术架构与实践路径

当数字孪生遇上AI，物理世界拥有了“预演未来”的能力。2026年，“可执行数字孪生”兴起——凡拓数创自研AI 3D引擎支持多物理场仿真与千万次并行训练，已在机器人Sim2Real迁移、工业预测性维护等场景落地见效。

717 0 0

啦啦啦191

|

2月前

|

博文

office卸载工具教程!微软官方office卸载工具，怎么解决office卸载不干净怎么弄？Office2021家庭和学生版卸载不干净怎么办？

微软官方Office卸载工具SetupProd_OffScrub，专治卸载不干净难题：一键深度清除Office所有残留文件及注册表项，支持2013至Microsoft 365全系列，重装无忧，安全可靠。（239字）

1485 3 3

灵杰开发者

|

6天前

|

人工智能 Cloud Native Apache

|

博文

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Flink Forward Asia 2026将于6月26–27日首次落地深圳，主题为“实时数据，智能未来”。大会聚焦Flink从Cloud Native迈向AI Native的演进，发布Flink 2.0、Paimon 2.0、Fluss 1.0及Flink Agents等重磅进展，并联合NVIDIA、阿里云共探实时AI与多模态流处理。免费报名中！

169 1 1

来自：实时计算 Flink 版块

吃一大口奶酪

|

2月前

|

Shell API

|

博文

Python：ImportError:DLL loadfailed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败报错解决

在进行文件夹内人脸识别与对比聚类时，遇到onnxruntime库报错，通常因版本不兼容或环境冲突导致。本文整理了五种解决方案：降级onnxruntime至1.14.1、重装库、区分GPU/CPU版本、安装Visual C++运行库、创建Python虚拟环境。通过版本匹配与环境隔离，有效解决DLL初始化失败等问题，提升项目稳定性。

2692 8 8

游客kxwloxiunt6vy

|

25天前

|

存储算法安全

|

博文

新增密级管理能力，筑牢数据安全合规防线——基于阿里云密评合规框架的专业实践

本文以某制造企业8000万元数据泄露事件为引，揭示“全员可见”的粗放加密之弊，强调密级管理才是数据安全核心。通过对比传统加密与密级管理差异，剖析越权访问、密钥连锁泄露等风险，并介绍阿里云KMS、CloudHSM、RAM及国密算法四大能力，详解第三方软件如何实现密级标签映射、权限分级绑定与合规审计闭环，助力企业满足等保2.0、密评及《数据安全法》要求。（239字）

756 0 0

代理IP不迷路

|

3月前

|

数据采集监控数据可视化

|

博文

常用爬虫工具大盘点，附带基础知识点详解

在数据驱动时代，爬虫工具是高效获取公开网络数据的核心利器。从八爪鱼等可视化入门工具，到Requests/Scrapy等Python进阶方案，再到Selenium、Scrapy-Redis等专业级框架，覆盖不同技术门槛与场景需求。使用须恪守robots协议，尊重版权与隐私，合法合规采集。

702 1 2

狸奴算君

|

4月前

|

存储人工智能并行计算

|

本文探讨生成式引擎优化（GEO）——AI搜索时代的新基建。面对大模型从“检索链接”转向“生成答案”的范式变革，GEO通过语义向量对齐、结构化数据标记与动态知识图谱构建，提升品牌在AI答案中的可见性与引用率，助力企业抢占生成式流量入口。

869 0 0

来自：智能搜索推荐版块

winx_19970108018

|

5天前

|

数据采集 JSON API

|

博文

小红书笔记详情API实战总结（技术复盘）

本文为小红书笔记详情API实战复盘，涵盖OAuth2.0鉴权、代理与指纹配置避封、限流/风控应对等关键问题。详解note_id、access_token等核心参数及结构化返回字段（内容/媒体/互动/作者），助力竞品分析与内容监测。（239字）

133 6 7

Deephub

|

7月前

|

存储缓存调度

|

博文

vLLM 吞吐量优化实战：10个KV-Cache调优方法让tokens/sec翻倍

十个经过实战检验的 vLLM KV-cache 优化方法 —— 量化、分块预填充、前缀重用、滑动窗口、ROPE 缩放、后端选择等等 —— 提升 tokens/sec。

2834 10 10

灵杰开发者

|

10天前

|

人工智能运维安全

|

博文

让 AI 帮你运维 Elasticsearch：阿里云 ES Agent Skill 正式发布

阿里云Elasticsearch Agent Skill是一套面向AI编程助手的智能运维技能包，覆盖实例创建、故障诊断、网络配置三大核心场景。支持自然语言交互，自动校验参数、识别架构差异、执行幂等操作，并内置49条诊断规则与7套SOP，大幅提升ES运维效率与可靠性。

285 7 8

来自：检索分析服务 Elasticsearch版版块

dataworks_demo21

|

存储数据采集 DataWorks

|

博文

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

阿里巴巴一直将数据作为自己的核心资产与能力之一，从最早的淘宝、天猫等电商业务，到后续的优酷、高德、菜鸟等板块，DataWorks、MaxCompute、Hologres等产品用一套技术体系来支持不同业务的发展与创新，为企业带来整体的“数据繁荣”。数据繁荣为我们带来了红利，同时也带动了各类数据治理需求的井喷，特别是降本等需求的不断出现，阿里云DataWorks团队将13年的产品建设经验整理成最佳实践，从数据生产规范性治理、数据生产稳定性治理、数据生产质量治理、数据应用提效治理、数据安全管控治理、数据成本治理、数据治理组织架构及文化建设等7个方面为大家揭秘数据治理平台建设实践

34743 15 39

来自：大数据开发治理DataWorks 版块

1338327838187890

|

4天前

|

人工智能运维数据可视化

|

博文

2026年思维导图工具深度横评：7款主流平台技术向实测与选型建议

本文深度实测7款主流在线思维导图工具（ProcessOn、GitMind、boardmix、NuromBoard、MindMaster、知犀、幕布），从核心功能、AI能力、协作支持、免费可用性及场景匹配五大维度横向对比，专为技术从业者提供真实、客观、可落地的选型指南。

126 2 2

墨祤

|

大数据

|

博文

欢迎加入飞天大数据平台交流群

欢迎加入飞天大数据平台交流群，了解最新的产品资讯与最佳实践

3526 0 1

来自：大数据开发治理DataWorks 版块

游客ztmzh6tnotqpi

|

15天前

|

人工智能 API 网络安全

|

博文

OpenClaw 接入百炼模型：密钥创建+配置+报错排查全攻略

本教程详解OpenClaw客户端接入阿里云百炼的完整流程：从账号准备、API Key创建与保存，到客户端密钥配置、模型选择及连通测试，图文并茂，步骤清晰。涵盖自检清单与高频问题排查，助你快速稳定调用Qwen等百炼大模型。（239字）

270 2 2

你的橙来啦

|

3月前

|

人工智能安全搜索推荐

|

博文

智能体来了：从0到1教你三步构建属于你的 AI 数字分身

本文带你从零构建专属AI智能体：解析其自主性本质，详解“骨架—性格—应用”三步搭建法，涵盖决策中枢、记忆系统与行动接口，并强调隐私保护与伦理边界。门槛降低，人人可启程。

2039 1 1

探索云世界

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

PAIFuser：面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架，专为视频生成模型设计，通过模型并行、量化优化、稀疏运算等技术，显著提升DiT架构的训练与推理效率。实测显示，推理耗时最高降低82.96%，训练时间减少28.13%，助力高效低成本AI视频生成。

1866 22 22

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

lesson1

E-MapReduce 4月产品新功能

lr

Origin2024 汉化安装专业解析｜企业级部署教程+批量激活解决方案

心脏病预测案例_test_2455

Miniconda 安装与环境配置全流程图解（2025 最新版）

E-MapReduce产品探秘，扩展开源生态云上的能力

8月14日Spark社区直播【Spark Shuffle 优化】

Apache Flink 进阶（一）：Runtime 核心机制剖析

Microsoft Activation Scripts v3.6 （MAS）激活工具安装教程!中文汉化版(激活工具)

如何从 0 到 1 参与 Flink 社区？

节日快乐！！！

普通电脑也能跑AI：10个8GB内存的小型本地LLM模型推荐

【下载安装】Adobe XD 免费下载与安装教程

2026年 最值得关注的 6个 开源 AI 工具

Spark Codegen浅析

动动嘴就能建模？Blender全流程部署AI建模插件教程 | 零门槛实现AI驱动3D创作

云上一指禅：大数据产品DataWorks每日问答

五分钟看懂推送本地项目到 GitHub新手菜鸡

Egde卸载教程！edge浏览器卸载工具!EdgeRemover v18.38新版本，单文件便携版!

PDF 转 Markdown 神器：MinerU 2.5 (1.2B) 部署全攻略

实用工具：VS Code 配置 Markdown 编译器全指南

Anthropic最强王炸！Claude Opus 4.7来了：编程能力暴涨13%（附如何使用到Opus 4.7）

如何使用 LiteLLM 网关代理统一管理你的大模型

密钥配置+报错排查｜OpenClaw 适配DeepSeek完整教程

ultralytics YOLO11 全新发布！（原理介绍+代码详见+结构框图）

【免费资料】IEEE33节点系统参数及拓扑图visio

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

AI+数字孪生：从实时映射到智能决策的技术架构与实践路径

office卸载工具教程!微软官方office卸载工具，怎么解决office卸载不干净怎么弄？Office2021家庭和学生版卸载不干净怎么办？

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

最新，通过GACCode配置Codex桌面客户端使用方案！

Python：ImportError:DLL loadfailed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败 报错解决

新增密级管理能力，筑牢数据安全合规防线——基于阿里云密评合规框架的专业实践

常用爬虫工具大盘点，附带基础知识点详解

别再搞混了！一文看懂“显存”与“内存”：从办公桌到实验室的硬核分工

【电脑控制手机屏幕】windows11、10自带投屏功能，三步解决

PyCharm 2025.1 完整教程：下载安装 + 中文设置 + 激活，一步到位，附安装包

一文详解：电商商品选品与价格监控 API 接口实战指南

抖音视频详情API秘籍！轻松获取视频详情数据

生成式引擎优化（GEO）技术范式解析：从搜索重构到多模态对齐的落地路径

小红书笔记详情API实战总结（技术复盘）

vLLM 吞吐量优化实战：10个KV-Cache调优方法让tokens/sec翻倍

让 AI 帮你运维 Elasticsearch：阿里云 ES Agent Skill 正式发布

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

2026年思维导图工具深度横评：7款主流平台技术向实测与选型建议

欢迎加入飞天大数据平台交流群

OpenClaw 接入百炼模型：密钥创建+配置+报错排查全攻略

智能体来了：从0到1教你三步构建属于你的 AI 数字分身

PAIFuser：面向图像视频的训练推理加速框架

大数据与机器学习

活跃用户

相关产品

2026年最值得关注的 6个开源 AI 工具

Python：ImportError:DLL loadfailed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败报错解决