|
7月前
|
分布式计算 MaxCompute 人工智能
|

ODPS 的下一个15年,大数据将迎来春天还是寒冬?

9509 55
来自:大数据计算 MaxCompute 版块
|
10月前
|
API 开发者 Python
|

深入研究:1688商品跨境属性API接口详解

本文介绍了如何通过 1688 商品跨境属性 API 获取商品的跨境相关数据,助力企业开展电商业务。文章分为三部分:引言阐述了接口的重要性及应用场景;接口概述详细说明了调用步骤,包括参数准备、签名生成、请求发送和响应处理;Python 请求示例提供了一个完整的代码实现,帮助开发者快速上手。示例代码涵盖了请求参数配置、签名生成逻辑以及使用 requests 库发送请求的过程,为实际应用提供了参考。

1687 13
|
3月前
|
Python Windows
|

Miniconda 安装与环境配置全流程图解(2025 最新版)

Miniconda 可以看作是 Anaconda 的“轻装版”,只自带 conda 包管理器与基础的 Python 运行时。它体积小、部署速度快,特别适合按需创建与管理虚拟环境的用户。与 Anaconda 相比,Miniconda 不会预先安装一大堆科学计算库,你可以根据项目需求再单独选择、安装需要的包,因此整体更轻巧、更灵活。 本文将手把手演示在 Windows 下安装 Miniconda 的全过程:从下载安装器、完成向导配置、设置环境变量,到最后的基础验证与简单示例,帮助你迅速把 Miniconda 用起来。

2946 12
来自: 人工智能平台PAI  版块
|
4月前
|
数据采集 机器学习/深度学习 人工智能
|

反爬虫机制深度解析:从基础防御到高级对抗的完整技术实战

本文系统阐述了反爬虫技术的演进与实践,涵盖基础IP限制、User-Agent检测,到验证码、行为分析及AI智能识别等多层防御体系,结合代码实例与架构图,全面解析爬虫攻防博弈,并展望智能化、合规化的发展趋势。

1639 62
|
4月前
|
Java 项目管理 Maven
|

Maven项目管理与构建自动化完全指南

Maven彻底改变了Java项目管理方式,通过POM模型、依赖管理和标准化构建流程,大幅提升开发效率。本文深入解析其核心概念、多模块管理、私服搭建及与Spring Boot、Docker等现代技术栈的集成实践,助力开发者实现高效、规范的项目构建与团队协作。

841 156
|
4月前
|
数据采集 运维 监控
|

爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南

本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。

943 62
|
3月前
|
存储 安全 搜索推荐
|

企业网站模板 网站源码下载 网站源码建站

在数字化时代,企业需专业网站拓展市场,网站源码建站因高性价比、强灵活性成中小企业首选,比定制开发成本低、比模板建站自由。选源码要明确需求、看质量售后与 SEO 扩展性,下载用官方渠道,经准备服务器域名、安装设置可上线,助企业低成本建高自由度安全网站。

2301 2
来自: 人工智能平台PAI  版块
|
2天前
|
安全 物联网 C++
|

技术抉择:微调还是 RAG?——以春节祝福生成为例

本文以春节祝福生成为例,剖析微调与RAG的本质差异:RAG解决“信息缺失”,微调重塑“表达偏好”。当任务重风格、重分寸、重一致性(如拜年话术),模型缺的不是知识,而是默认的得体表达——此时微调比RAG更直接、可控、高效。

296 165
|
4月前
|
Windows
|

Microsoft Activation Scripts v3.6 (MAS)激活工具安装教程!中文汉化版(激活工具)

Microsoft Activation Scripts v3.6(MAS)是一款开源、轻量级的批量激活工具,支持HWID、KMS38、TSforge等多种方式,可离线永久激活Win7至Win11及Office全系列。兼容旧系统如Vista,操作简单,无误报风险。

6333 0
|
27天前
|
存储 人工智能 并行计算
|

别再搞混了!一文看懂“显存”与“内存”:从办公桌到实验室的硬核分工

本文以生动比喻与硬核解析,深入浅出地讲清内存(RAM)与显存(VRAM)的本质区别:内存是CPU的通用工作台,显存是GPU的专用高速实验室。二者分工明确,数据需通过PCIe传输,无法互相替代。尤其在AI训练中,显存容量与带宽直接决定模型能否运行。文章结合代码实例、性能对比表及排错指南,帮助开发者理解“CUDA out of memory”等常见问题,并提供优化策略与云平台建议,是迈向高效AI开发的必读指南。

962 0
|
12月前
|
流计算 关系型数据库 MySQL
|

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

8212 25
来自:实时计算 Flink 版块
|
4天前
|
算法 安全 物联网
|

第一次跑通 PPO:实战卡点全拆解

PPO实战难点不在算法理解,而在系统性不确定:需先明确对齐目标,以SFT模型为起点,严格使用reference model,设计偏好式reward,聚焦policy更新与KL系数调控,并通过行为变化而非loss曲线评估进展——本质是耐心跑通最小闭环。

260 151
|
3月前
|
人工智能 前端开发 数据挖掘
|

AI学习全景图:从大模型到RAG,从工具到变现,一条从0到1的路线

告别碎片化学习!本文系统梳理AI知识五层结构:从基础认知到商业变现,提供完整学习路径与优质资源链接。帮你构建AI知识网络,实现从工具使用到能力落地的跃迁。

2282 2
|
1天前
|
人工智能 安全 UED
|

多任务微调:拜年、感谢、道歉,为什么不是三个简单任务

本文探讨祝福类AI扩展多任务(拜年/感谢/道歉)时的关键工程抉择:表面相似的情绪表达,实则在风险等级、语气分寸与用户期待上差异巨大。多任务微调易致任务“污染”,尤其低风险任务会拉偏高风险任务的表达倾向。核心结论:技术难点不在模型能力,而在厘清人情世故的边界——何时共享,何时拆模,才是成熟落地的关键。

254 149
|
2天前
|
人工智能 自然语言处理 安全
|

微调落地:春节祝福 AI 是怎样炼成的

本文以春节祝福AI为例,深入剖析微调落地的典型场景:模型能力足够,但“人情味”不足。它揭示微调的核心价值——不教新知识,而是将符合场景的表达偏好固化为默认输出,30分钟即可见效。适合表达敏感、指标难量化、Prompt难稳定的业务场景。

254 164
|
1天前
|
数据采集 安全 C++
|

当 Prompt 和 RAG 都开始别扭时,你该认真考虑微调了

本文以春节祝福生成为例,揭示微调本质:它不是技术升级的“最后一招”,而是对任务性质的判断结果——当问题核心是“模型会做但不像你要的”(如风格不一致、分寸难拿捏),且Prompt/RAG已显乏力时,微调反而是最克制高效的选择。提供可落地的三维度决策框架。

235 148
|
6月前
|
人工智能 边缘计算 自然语言处理
|

普通电脑也能跑AI:10个8GB内存的小型本地LLM模型推荐

随着模型量化技术的发展,大语言模型(LLM)如今可在低配置设备上高效运行。本文介绍本地部署LLM的核心技术、主流工具及十大轻量级模型,探讨如何在8GB内存环境下实现高性能AI推理,涵盖数据隐私、成本控制与部署灵活性等优势。

3841 0
|
3月前
|
人工智能 UED Windows
|

Egde卸载教程!edge浏览器卸载工具!EdgeRemover v18.38新版本,单文件便携版!

Edge浏览器虽功能强大,却常因无法彻底卸载让用户体验困扰。本文推荐一款专清工具——Edge Remover,支持一键移除Edge及WebView2运行时,两种模式灵活选择,操作简单,无需专业技能,彻底清理不留残留,释放C盘空间,提升系统纯净度,是Windows用户必备的卸载利器。

1954 2
|
8天前
|
人工智能 Java API
|

Apache Flink Agents 0.2.0 发布公告

Apache Flink Agents 0.2.0发布!该预览版统一流处理与AI智能体,支持Java/Python双API、Exactly-Once一致性、多级记忆(感官/短期/长期)、持久化执行及跨语言资源调用,兼容Flink 1.20–2.2,助力构建高可靠、低延迟的事件驱动AI应用。

345 9
来自: 实时计算 Flink  版块
|
10月前
|
JSON 算法 API
|

一文掌握 1688 商品详情 API 接口:从入门到实战

1688是国内领先的综合电商批发平台,提供海量商品资源。其商品详情API助力开发者与企业获取商品的详细信息(如属性、价格、库存等),广泛应用于电商数据分析、比价系统及采购场景。API支持GET/POST请求,需传入通用参数(app_key、timestamp等)与业务参数(如product_id)。返回JSON格式数据,包含商品标题、价格、图片链接等详情,提升业务效率与决策精准度。

494 6
|
2月前
|
前端开发 安全 JavaScript
|

网站代码 网站源代码 网页源代码 网页代码网站

本文深入解析网站源代码与网页源代码的核心概念及区别,阐述其作为互联网技术基石的关键作用。通过剖析PageAdmin等典型源码案例,揭示源代码在技术学习、网站优化、安全维护等方面的核心价值,并探讨如何高效利用代码网站资源进行创新开发。文章强调在尊重版权的前提下,开发者可借助源码资源提升能力,推动网页技术持续发展。

855 10
来自: 大数据计算 MaxCompute  版块
|
1月前
|
数据采集 人工智能 文字识别
|

PDF 转 Markdown 神器:MinerU 2.5 (1.2B) 部署全攻略

MinerU是由OpenDataLab推出的开源PDF解析工具,支持精准布局分析、公式识别与表格提取。本文详解其2.5-2509-1.2B版本在Linux下的部署流程,涵盖环境搭建、模型下载、核心配置及实战应用,助你高效处理复杂PDF文档,提升AI数据清洗效率。

637 3
|
9天前
|
人工智能 并行计算 监控
|

别再混为一谈!万字拆解内存与显存:决定你模型训练成败的硬件真相

你好,我是AI科普博主狸猫算君!本文深入浅出解析内存(RAM)与显存(VRAM)的本质区别:前者是CPU的通用办公桌,后者是GPU的专属高速实验室。重点破除“大内存=能训大模型”误区,揭示显存带宽、容量为何直接决定AI训练成败,并提供监控、排错与硬件选配实战指南。(239字)

187 2
|
10月前
|
开发工具 C++ git
|

五分钟看懂推送本地项目到 GitHub新手菜鸡

五分钟看懂推送本地项目到 GitHub新手菜鸡

2552 0
|
10月前
|
JSON API 数据格式
|

深入研究:Shopee 商品详情 API 接口详解

Shopee 商品详情 API 是针对东南亚及中国台湾地区电商开发者的强大工具,可获取商品的详细信息(如价格、库存、描述等),支持竞品分析与市场调研。通过 HTTP GET/POST 请求,传入商品 ID 等参数,返回 JSON 格式的商品数据,包括基本信息、销售数据、商家信息等。以下是 Python 示例代码,展示如何使用 requests 库调用该接口并处理响应数据。注意实际应用需遵循 Shopee 认证要求。

464 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
|

人工智能技术全流程入门:10 个关键步骤快速上手

本教程系统讲解人工智能入门10大核心步骤,涵盖基础认知、工具使用、数据理解、实操应用与伦理规范,结合场景导向与避坑指南,帮助新手快速掌握AI技术应用逻辑,轻松实现从零到一的跨越,助力职场增效与技能提升。

882 1
|
10月前
|
机器学习/深度学习 并行计算 PyTorch
|

英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案

本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,分析其根源为预编译二进制文件不支持sm_120架构,并提出解决方案:使用PyTorch Nightly版本、更新CUDA工具包至12.8。通过清理环境并安装支持新架构的组件,成功解决兼容性问题。文章总结了深度学习环境中硬件与框架兼容性的关键策略,强调Nightly构建版本和环境一致性的重要性,为开发者提供参考。

6725 64
|
11天前
|
机器学习/深度学习 数据采集 算法
|

Scikit-learn 入门指南

scikit-learn 是 Python 最主流的机器学习库,提供统一、简洁的 API,覆盖数据预处理、模型训练到评估部署全流程。专注传统算法,轻量高效,无缝集成 NumPy/Pandas,是教学、原型开发与生产部署的首选工具。(239字)

236 15
|
9月前
|
存储 JSON 数据可视化
|

从零构建知识图谱:使用大语言模型处理复杂数据的11步实践指南

本文将基于相关理论知识和方法构建一个完整的端到端项目,系统展示如何利用知识图谱方法对大规模数据进行处理和分析。

2619 11
|
6天前
|
数据采集 人工智能 监控
|

别让大模型“学废了”!从数据清洗到参数调优,一次讲透微调实战

本文深入浅出讲解大模型微调(Fine-tuning):为何需要“岗前培训”,如何通过数据准备、参数调优(如LoRA)、训练监控与效果评估,让通用模型精准适配专业场景。强调“数据质量>数量”“监控胜过猜测”,助力开发者高效落地AI定制化应用。(239字)

123 4
|
8天前
|
JSON API 网络安全
|

Requests库入门指南

Requests是Python最流行的HTTP客户端库,以“为人类设计”为核心理念,封装HTTP复杂细节,提供简洁API。支持GET/POST等方法、会话管理、自动解码、SSL验证等,月下载超10亿次,广泛用于API调用、爬虫与微服务开发。(239字)

155 3
|
11月前
|
数据采集 Web App开发 API
|

B站高清视频爬取:Python爬虫技术详解

B站高清视频爬取:Python爬虫技术详解

2827 2
|
1月前
|
人工智能 PyTorch Linux
|

GLM-4V-9B 视觉多模态模型本地部署教程【保姆级教程】

本教程详细介绍如何在Linux服务器上本地部署智谱AI的GLM-4V-9B视觉多模态模型,涵盖环境配置、模型下载、推理代码及4-bit量化、vLLM加速等优化方案,助力高效实现图文理解与私有化应用。

525 2
|
3月前
|
人工智能 测试技术 Python
|

AI也有“智商”吗?我们到底该用什么标准来评估它?

AI也有“智商”吗?我们到底该用什么标准来评估它?

640 8
|
2月前
|
人工智能 自然语言处理 监控
|

通义AI搜索排名优化全攻略

武汉得知网络AI搜索优化基于内容质量、用户意图匹配与交互数据,通过语义深度、页面体验及权威链接提升排名,结合技术性能与多模态策略,助力企业精准抢占AI搜索流量高地。

632 4
来自: 实时数仓 Hologres  版块
|
3月前
|
机器学习/深度学习 人工智能 算法
|

PAIFuser:面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架,专为视频生成模型设计,通过模型并行、量化优化、稀疏运算等技术,显著提升DiT架构的训练与推理效率。实测显示,推理耗时最高降低82.96%,训练时间减少28.13%,助力高效低成本AI视频生成。

594 22
|
3月前
|
SQL 分布式计算 大数据
|

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

588 39
来自: 大数据计算 MaxCompute  版块
|
11月前
|
数据安全/隐私保护
|

5分钟注册一个可用Gemini的谷歌邮箱账号

5分钟注册一个可用Gemini的谷歌邮箱账号

5060 23
|
5月前
|
并行计算 数据格式 异构计算
|

完整教程:从0到1在Windows下训练YOLOv8模型

本文详细介绍在Windows系统下使用YOLOv8训练目标检测模型的完整步骤,涵盖环境配置、数据集准备、模型训练与测试、常见问题解决及GPU加速技巧。提供详细命令与代码示例,并推荐现成数据集与工具,助您高效完成模型训练。

2516 18
|
10月前
|
Linux 网络安全 虚拟化
|

阿里云开发者分享VMware17 Pro保姆级安装秘籍,详细步骤助你轻松搞定安装!

这是一篇超详细的VMware 17 Pro虚拟机下载与安装教程。VMware 17 Pro支持多操作系统模拟运行,适合开发、测试及教育使用。文章涵盖从下载到安装的全流程,包括解压安装包、接受协议、配置安装路径等步骤,并提供虚拟机优化(如安装VMware Tools、配置快照和共享文件夹)及使用指南。同时,针对常见问题如虚拟化未启用或软件阻止启动,提供了具体解决方案,帮助用户顺利部署和使用虚拟机环境。

5170 36
|
3天前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!30分钟微调一个懂你关系的“人情味”拜年AI

春节祝福太难写?本文手把手教你用LoRA微调大模型,让AI学会“看人下菜”:识别关系、风格、细节,30分钟训练出懂人情世故的拜年助手。无需代码,量化+批处理保障秒级响应,让每条祝福都像你亲手写的。(239字)

108 35
|
5天前
|
JSON 监控 安全
|

小红书笔记详情数据获取实战:从笔记链接提取 ID 到解析详情

小红书笔记详情API可获取标题、正文、作者、互动数据、图文/视频资源及话题标签等结构化信息,支持自定义字段与评论拉取。适用于内容分析、竞品监控、营销优化与用户研究,HTTPS+JSON接口,Python调用便捷。(239字)

108 6
|
4天前
|
安全 前端开发 中间件
|

Django 入门指南:从零构建强大的 Web 应用

Django是Python最流行的“电池全备”企业级Web框架,内置ORM、Admin后台、认证等核心功能,遵循MVT架构与DRY原则。专注业务逻辑,助力快速构建安全稳定的CMS、电商等数据驱动应用。(239字)

106 2
|
10月前
|

Multisim14.0中文下载安装步骤教程

Multisim14.0是由美国NI公司开发的EDA工具,适用于电路设计与仿真。本文提供详细中文安装步骤:下载安装包后解压,运行安装程序并设置路径,填写用户信息,选择安装位置,接受协议完成安装。随后安装NILicense激活器及中文语言包,最终实现软件汉化与正常运行。附带网盘下载链接,方便国内用户获取资源。

6896 15
|
2月前
|
编译器 程序员 Linux
|

实用工具:VS Code 配置 Markdown 编译器全指南

本文介绍如何在VS Code中配置高效Markdown写作环境,通过启用内置预览、安装Markdown All in One与Markdown Preview Enhanced插件,并配置Princexml实现PDF等格式导出,全面提升编辑、预览与输出效率,适合程序员、学生及内容创作者使用。

955 2
|
9天前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

PyTorch 入门指南:深度学习的瑞士军刀

PyTorch 是Meta开源的动态深度学习框架,以灵活的计算图、类NumPy的直观API和强大GPU加速著称。支持快速原型设计与生产部署,涵盖张量运算、自动求导、神经网络构建等核心功能,是研究与工程首选工具。(239字)

154 0
|
6月前
|
JSON 算法 API
|

小红书商品详情签名算法Python

本文分享了作者在对接小红书商品详情API过程中的实战经验,涵盖权限申请、签名算法、限流控制、数据解析及Webhook接入等关键技术环节,并附有实用Python代码示例。

490 0
|
29天前
|
数据采集 人工智能 自然语言处理
|

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

在AI迈向专业决策的关键节点,阿里云联合NVIDIA发起“寻找AI全能王”全球大奖赛,聚焦高质量数据构建与智能体开发两大挑战。赛事设高校与企业双赛道,覆盖万亿语料去重与DeepSearch智能体构建,提供工业级实战平台、专家指导与丰厚奖励,推动Data+AI融合创新,助力开发者实现“所想即所得”的技术突破。

461 2
来自: 大数据计算 MaxCompute  版块
|
8月前
|
自然语言处理 算法 API
|

阿里云增值税发票识别NET Rest API调用示例

本文介绍了使用NET代码调用阿里云增值税发票识别API的实现方式。通过示例代码,详细展示了如何构造请求、设置签名以及发送HTTP请求的具体步骤。代码中涵盖了请求参数的处理、签名生成逻辑(如HMAC-SHA256算法)以及调用API后的结果处理。此外,还提供了运行结果的截图和参考文档链接,帮助开发者更好地理解和应用该接口。

841 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69093
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务