|
1月前
|
机器学习/深度学习 传感器 算法
|

Python | K折交叉验证的参数优化的支持向量机回归(SVR)预测及可视化算法

本教程系统讲解基于Python的SVR回归预测,涵盖数据处理、模型训练、K折交叉验证及贝叶斯、随机、网格搜索等参数优化方法,适用于多领域回归任务,附完整代码与可视化实现。

155 5
|
1月前
|
机器学习/深度学习 人工智能
|

【AI大模型面试宝典四】- 基础架构篇

【AI大模型知识干货系列】深度解析Transformer位置编码:从绝对到相对,拆解Sinusoidal、RoPE、ALiBi等核心机制,对比优劣,直击面试高频问题。每篇聚焦一个知识点,助你系统掌握大模型关键技术,紧跟AI浪潮!欢迎关注、点赞、批评指正~

123 0
来自: 人工智能平台PAI  版块
|
1月前
|
XML JSON 算法
|

淘宝商品详情API接口指南

淘宝商品详情API(taobao.item.get)可获取商品标题、价格、图片、库存、销量等核心信息。支持POST/GET请求,返回JSON格式数据。需提供app_key、timestamp、sign等参数,常见响应码包括200(成功)、401(权限不足)、403(签名错误)等,适用于电商数据对接与分析。

145 0
|
1月前
|

经典题:求一个数是否为质数

介绍质数判断与自幂数概念:质数为仅被1和自身整除的大于1的自然数;自幂数是n位数等于各位数字n次幂之和,如水仙花数(三位)、四叶玫瑰数(四位)等,体现数字的独特数学之美。(239字)

80 1
|
1月前
|
存储 机器学习/深度学习 人工智能
|

构建AI智能体:七十九、从SVD的理论到LoRA的实践:大模型低秩微调的内在逻辑

本文系统介绍了奇异值分解(SVD)的核心原理及其在大模型微调中的应用。文章首先通过水果沙拉制作、员工评选等生活化案例,形象解释了SVD将复杂矩阵分解为三个简单矩阵乘积的过程。随后详细阐述了SVD公式A=UΣVᵀ的数学含义,包括奇异值矩阵Σ作为"重要性权重表"的关键作用。重点剖析了SVD的低秩近似特性,展示了如何通过保留主要奇异值实现数据压缩。最后深入探讨了SVD对LoRA技术的指导作用:通过分析权重更新矩阵的奇异值分布,科学确定低秩适配器的秩参数,实现大模型的高效微调。

150 3
|
2月前
|
存储 SQL 关系型数据库
|

3-MySQL篇

本文系统梳理MySQL核心知识点,涵盖查询语句的书写与执行顺序、多表连接方式、索引类型及底层结构(B+树)、聚簇与非聚簇索引区别、回表查询与覆盖索引优化、最左前缀原则、索引失效场景、SQL性能分析(EXPLAIN)及慢查询定位等,助力高效数据库开发与调优。

45 1
|
2月前
|
监控 Java 测试技术
|

微服务保护Sentinel

本课程深入讲解微服务中的雪崩问题及其解决方案,重点介绍阿里开源的流量治理组件Sentinel。内容涵盖Sentinel的部署与整合、限流模式(直接、关联、链路)、流控效果(快速失败、预热、排队等待)、熔断降级、线程隔离及规则持久化等核心知识点,结合Jmeter压测实战,帮助开发者构建高可用的分布式系统。

88 0
|
2月前
|
人工智能 缓存 自然语言处理
|

大模型推理与应用术语解释

简介:大语言模型核心技术涵盖推理、生成式AI、检索增强生成(RAG)、提示工程、上下文学习、代理、多模态学习与语义搜索。这些技术共同推动AI在内容生成、知识检索、智能决策和跨模态理解等方面的能力跃升,广泛应用于问答系统、创作辅助、企业服务与自动化任务,正重塑人机交互与信息处理范式。(238字)

100 0
|
2月前
|
Java Nacos Maven
|

Eureka服务注册与发现

本节介绍SpringCloud中Eureka注册中心的搭建与使用,完成服务注册与发现功能,为后续Nacos替换Eureka奠定基础。

53 0
|
2月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者是跨模型的标准协议,实现多工具动态集成;后者是模型调用外部功能的机制。MCP构建通用连接桥梁,支持多模型、跨平台协作,具备高扩展性与解耦能力;Function Call则依赖特定模型,直接解析意图并调用函数。两者在企业级系统中可协同工作:模型通过Function Call识别意图,转为MCP标准请求调用工具,兼顾智能解析与生态扩展。未来将趋向融合,形成“模型解析-协议传输-工具执行”的统一范式。

132 0
|
2月前
|
人工智能 自然语言处理 API
|

全面认识MCP:大模型连接真实世界的“USB-C接口”

MCP(模型上下文协议)是Anthropic推出的AI“万能接口”,旨在统一大模型与工具、数据源的连接标准。它简化集成、提升任务处理能力,被誉为AI时代的“USB-C”。通过标准化通信,MCP让智能体可自主调用工具、执行复杂任务,推动AI应用迈向高效、安全、可扩展的新阶段。

186 0
|
2月前
|

Watcher机制(一)

本文深入分析Zookeeper的Watcher机制,涵盖核心类与源码实现。重点解析Watcher、Event、WatchedEvent等接口与类,梳理其内部结构及事件通知流程,帮助理解Zookeeper的数据变更监听原理。

63 0
|
2月前
|
人工智能 搜索推荐 自动驾驶
|

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

167 0
|
2月前
|
运维 持续交付 API
|

具身智能:零基础入门睿尔曼机械臂(四)—— 夹爪无响应?官方例程踩坑与排错实战

本文复盘睿尔曼机械臂夹爪“指令成功但无动作”的故障,揭示官方例程遗漏末端电压配置与通信协议初始化两大隐患。通过“软件—硬件—通信”三步排查,结合万用表测量与示教器配置,最终解决供电缺失与指令失效问题,为末端执行器部署提供可落地的实战方案。

213 6
|
2月前
|
SQL 存储 分布式计算
|

Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!

Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!

276 9
|
2月前
|
机器学习/深度学习 人工智能 监控
|

NeurIPS 2025 Spotlight!跨模态重识别革命!东北大学等 MDReID 图像信息智能匹配

东北大学等提出MDReID,获NeurIPS 2025 Spotlight!该方法实现跨模态行人重识别,创新性地将图像特征解耦为通用与专用特征,支持RGB、NIR、TIR等任意模态自由匹配,显著提升异源图像检索精度,推动安防、监控等领域智能化发展。

199 1
|
2月前
|
JSON 数据挖掘 API
|

小红书笔记详情API接口指南

小红书笔记详情API可获取指定笔记的完整信息,涵盖内容、作者及互动数据,适用于内容分析与数据挖掘。接口采用GET请求,支持Bearer Token认证,返回JSON格式数据。代码具备完善封装、类型注解、异常处理与重试机制,需官方授权后使用,并遵守平台规范。(238字)

230 3
|
2月前
|
数据采集 人工智能 算法
|

GEO 技术落地教育与创业:周有贵博士与张弛教授共探校企协同技术赋能新路径

近日,湖南师范大学新闻传播学院张弛教授与 GEO 技术团队负责人 —— 巴黎学院人工智能博士、法国 GGI 商学院 GEO 首席技术专家周有贵,围绕 GEO 生成式引擎优化技术落地展开深度交流,为高校技术人才培养、学生创业冷启动及中小企业 AI 获客提供协同方案,对开发者社区关注的技术下沉与场景赋能具参考价值。

159 1
|
3月前
|
存储 监控 Cloud Native
|

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

263 16
|
3月前
|
存储 Web App开发 前端开发
|

新手如何建站.新手建站的全流程

建站是通过整合域名、服务器等要素搭建可访问数字平台的过程,分自助建站、CMS系统和代码开发三类工具。核心流程包括需求规划、域名注册(实名认证)、服务器配置(国内需ICP备案),搭建后填充内容并测试优化,解析域名上线,做好后续维护。

417 10
来自: 人工智能平台PAI  版块
|
3月前
|
供应链 API 定位技术
|

1688工厂数据API开发指南

1688工厂数据API是阿里巴巴提供的工厂信息查询接口,支持通过工厂ID、品类、地理位置等多维度检索,涵盖基础信息、生产能力、资质认证、产品分类及信用数据,助力企业高效采购与供应链管理。

142 3
|
3月前
|
机器学习/深度学习 数据采集 人工智能
|

构建AI智能体:三十五、决策树的核心机制(一):刨根问底鸢尾花分类中的参数推理计算

本文介绍了决策树算法的基本原理和应用。决策树通过一系列特征判断(如西瓜的纹路、声音)进行分类,其结构包括根节点、内部节点、叶节点和分支。算法通过计算信息增益或基尼不纯度选择最佳分裂特征,构建过程采用递归方式。以鸢尾花分类为例,展示了如何用Python实现决策树模型,并分析了节点参数(样本量、基尼值、类别分布)的含义。决策树具有直观易懂的优点,但也容易过拟合。文章强调理解决策树是学习更复杂算法的基础,为后续深入讲解分裂点计算做铺垫。

288 12
|
3月前
|
JavaScript 数据挖掘 关系型数据库
|

基于python的外卖配送及数据分析系统

本研究基于Python构建外卖配送及数据分析系统,结合Django、Vue和MySQL技术,实现配送路径优化、时效预测与用户行为分析,提升配送效率与服务质量,为平台科学决策提供支持。

233 9
|
3月前
|
监控 安全 数据安全/隐私保护
|

U盘如何防泄密?这几个技术手段迎刃而解

安得卫士提供U盘防泄密四大核心措施:准入控制、操作管控、行为审计与离线防护。通过注册授权、权限细分、敏感数据拦截、全流程操作审计及加密外发控制,实现U盘数据全周期安全防护,有效防范数据泄露风险。

234 6
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI 十大论文精讲(七):Switch Routing 如何破解 MoE 的路由、通信与稳定性三大痛点

Switch Transformers通过简化MoE路由机制,实现万亿参数模型的高效训练。其核心创新在于Switch Routing(单专家激活)、选择性精度与三重并行架构,在降低计算成本的同时提升模型规模与稳定性,为大模型稀疏化发展奠定基础。

472 132
|
4月前
|
机器学习/深度学习 人工智能 安全
|

当AI开始自己写AI:自主AI系统的时代正在到来

当AI开始自己写AI:自主AI系统的时代正在到来

409 92
|
4月前
|
JSON API 定位技术
|

京东商品评论API技术指南

京东商品评论API提供标准化接口,支持按评分、排序、分页获取商品评论数据,返回JSON格式的评论内容、用户信息、评分星级及热门标签等,助力电商数据分析与运营决策。

220 1
|
4月前
|
数据采集 缓存 大数据
|

【赵渝强老师】大数据日志采集引擎Flume

Apache Flume 是一个分布式、可靠的数据采集系统,支持从多种数据源收集日志信息,并传输至指定目的地。其核心架构由Source、Channel、Sink三组件构成,通过Event封装数据,保障高效与可靠传输。

313 1
|
4月前
|
人工智能 API 数据处理
|

Flink Agents 0.1.0 发布公告

Apache Flink Agents 0.1.0 首发预览版上线!作为 Flink 新子项目,它在流处理引擎上构建事件驱动的 AI 智能体,融合 LLM、工具、记忆与动态编排,支持高吞吐、低延迟、精确一次语义,实现数据与 AI 无缝集成,助力电商、金融等实时场景智能决策。

508 39
来自: 实时计算 Flink  版块
|
4月前
|
JSON 缓存 API
|

淘宝天猫商品详情API秘籍!轻松获取SKU属性数据

淘宝商品详情API(taobao.item.get)可获取商品标题、价格、SKU、库存等全量信息,支持RESTful调用,返回JSON数据,适用于电商导购与竞品分析。需企业实名认证,申请权限后通过签名加密请求。Python示例展示如何调用接口,配合fields参数可优化性能,应对频率限制与数据延迟建议轮询+缓存策略。

405 7
|
4月前
|
JavaScript 前端开发 安全
|

Vue 3 + TypeScript 现代前端开发最佳实践(2025版指南)

每日激励:“如果没有天赋,那就一直重复”。我是蒋星熠Jaxonic,一名执着于代码宇宙的星际旅人。用Vue 3与TypeScript构建高效、可维护的前端系统,分享Composition API、状态管理、性能优化等实战经验,助力技术进阶。

777 1
|
5月前
|
人工智能 物联网 BI
|

诊断设备企业必看!垂直医疗行业的CRM软件有哪些?

2025年,诊断设备企业竞争核心转向精细化服务。传统CRM难堪重任,垂直医疗CRM成破局关键。本文深度解析八骏医疗云等五大解决方案,揭秘如何通过设备全周期管理、代理商管控、智能耗材预警与私有化部署,构建以客户为中心的服务体系,抢占增长制高点。

365 124
来自: 大数据计算 MaxCompute  版块
|
5月前
|
JSON 监控 API
|

速卖通商品列表API秘籍!轻松获取商品列表数据

速卖通商品列表API支持关键词搜索、分类筛选、多语言返回及分页排序功能,适用于比价系统、库存监控、市场研究等场景。开发者可快速获取商品数据,构建自动化应用。

174 4
|
5月前
|
人工智能 搜索推荐 SEO
|

【1分钟解密】如何让 AI 大模型推荐你的品牌

随着AI逐渐取代传统搜索,企业如何让AI“看见”并“信任”你?GEO(生成式引擎优化)应运而生,它不仅是SEO的延伸,更是让AI主动推荐你的关键策略。通过优化内容结构、提升权威性与可读性,GEO助力企业在AI生成的答案中占据一席之地,赢得未来流量入口。

433 5
来自: 智能搜索推荐  版块
|
5月前
|
数据采集 传感器 人工智能
|

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

252 6
|
5月前
|
数据采集 数据库 索引
|

新闻网站的数据采集与更新思路

该方案设计了一个跨站点的增量更新引擎,用于高效采集央视新闻、中国新闻网和环球网等多源新闻数据。通过代理IP和内容哈希签名技术,实现新闻的新增与更新检测,大幅降低冗余抓取和带宽消耗。实验表明,该方法在多源新闻采集中具备高效性和实用性,可拓展为行业级舆情雷达系统,支持事件追踪与趋势分析。

320 2
|
5月前
|
存储 分布式计算 资源调度
|

【赵渝强老师】阿里云大数据MaxCompute的体系架构

阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。

449 1
来自: 大数据计算 MaxCompute  版块
|
6月前
|
存储 分布式计算 大数据
|

MaxCompute聚簇优化推荐功能发布,单日节省2PB Shuffle、7000+CU!

MaxCompute全新推出了聚簇优化推荐功能。该功能基于 31 天历史运行数据,每日自动输出全局最优 Hash Cluster Key,对于10 GB以上的大型Shuffle场景,这一功能将直接带来显著的成本优化。

310 3
来自: 大数据计算 MaxCompute  版块
|
6月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。

391 0
来自: 人工智能平台PAI  版块
|
6月前
|
机器学习/深度学习 算法 测试技术
|

NSA稀疏注意力深度解析:DeepSeek如何将Transformer复杂度从O(N²)降至线性,实现9倍训练加速

本文将深入分析NSA的架构设计,通过详细的示例、可视化展示和数学推导,构建对其工作机制的全面理解,从高层策略到底层硬件实现均有涉及。

528 0
|
7月前
|
JSON Java API
|

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息,支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明,并包含请求和响应示例。支持多种开发语言,如Curl、PHP、JAVA等,适用于电商应用开发。

269 0
|
7月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

搜索结果太乱?5种重排序模型让你的搜索系统准确率提升40%

本文将系统性地分析重排序模型的技术原理,深入探讨从传统学习排序方法到基于Transformer架构的前沿解决方案。

827 0
|
7月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源,拥有卓越的代码和 Agent 能力,在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

2019 27
来自: 人工智能平台PAI  版块
|
7月前
|
算法 安全 量子技术
|

量子计算来了,区块链还安全吗?我认真的研究了一下

量子计算来了,区块链还安全吗?我认真的研究了一下

281 2
|
7月前
|
存储 人工智能 自然语言处理
|

AI代理内存消耗过大?9种优化策略对比分析

在AI代理系统中,多代理协作虽能提升整体准确性,但真正决定性能的关键因素之一是**内存管理**。随着对话深度和长度的增加,内存消耗呈指数级增长,主要源于历史上下文、工具调用记录、数据库查询结果等组件的持续积累。本文深入探讨了从基础到高级的九种内存优化技术,涵盖顺序存储、滑动窗口、摘要型内存、基于检索的系统、内存增强变换器、分层优化、图形化记忆网络、压缩整合策略以及类操作系统内存管理。通过统一框架下的代码实现与性能评估,分析了每种技术的适用场景与局限性,为构建高效、可扩展的AI代理系统提供了系统性的优化路径和技术参考。

455 4
|
7月前
|
存储 SQL 分布式计算
|

MaxCompute x 聚水潭:基于近实时数仓解决方案构建统一增全量一体化数据链路

聚水潭作为中国领先的电商SaaS ERP服务商,致力于为88,400+客户提供全链路数字化解决方案。其核心ERP产品助力企业实现数据驱动的智能决策。为应对业务扩展带来的数据处理挑战,聚水潭采用MaxCompute近实时数仓Delta Table方案,有效提升数据新鲜度和计算效率,提效比例超200%,资源消耗显著降低。未来,聚水潭将进一步优化数据链路,结合MaxQA实现实时分析,赋能商家快速响应市场变化。

344 0
来自: 大数据计算 MaxCompute  版块
|
7月前
|
数据采集 缓存 NoSQL
|

分布式新闻数据采集系统的同步效率优化实战

本文介绍了一个针对高频新闻站点的分布式爬虫系统优化方案。通过引入异步任务机制、本地缓存池、Redis pipeline 批量写入及身份池策略,系统采集效率提升近两倍,数据同步延迟显著降低,实现了分钟级热点追踪能力,为实时舆情监控与分析提供了高效、稳定的数据支持。

313 1
|
7月前
|
人工智能 自然语言处理 并行计算
|

大模型面经:任务、clip、diffusion

本文简要介绍了文本生成的常见预训练任务(如MLM、CLM、NSP等),多模态模型中的SOTA模型及CLIP的优势,以及多模态大模型如Stable Diffusion的原理。重点解析了Stable Diffusion的扩散机制与图像生成流程,帮助理解其高效性和广泛应用的原因。

497 5
|
7月前
|
分布式计算 Java 大数据
|

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

422 2
|
7月前
|
SQL JSON 分布式计算
|

Spark SQL架构及高级用法

Spark SQL基于Catalyst优化器与Tungsten引擎,提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行,支持复杂数据类型、窗口函数与多样化聚合操作,结合自适应查询与代码生成技术,实现高性能大数据分析。

514 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69093
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务