|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议,实现工具与模型解耦;后者是模型调用外部功能的内置机制。二者互补协作,推动AI应用向更开放、灵活、可扩展的方向发展。

197 0
|
4月前
|
负载均衡 Java Nacos
|

Gateway服务网关

网关是微服务的统一入口,实现请求路由、权限控制、限流与负载均衡。基于SpringCloud Gateway可构建高性能响应式网关,支持断言与过滤器工厂,灵活实现路由匹配及请求处理,并可通过全局过滤器扩展功能,解决跨域等问题。

270 0
|
4月前
|
自然语言处理 监控 搜索推荐
|

分布式搜索引擎ElasticSearch

Elasticsearch是基于Lucene的开源分布式搜索引擎,支持全文检索、日志分析与实时监控,结合Logstash、Kibana等组成ELK技术栈,广泛应用于搜索、数据分析等领域。

150 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI 十大论文精讲(七):Switch Routing 如何破解 MoE 的路由、通信与稳定性三大痛点

Switch Transformers通过简化MoE路由机制,实现万亿参数模型的高效训练。其核心创新在于Switch Routing(单专家激活)、选择性精度与三重并行架构,在降低计算成本的同时提升模型规模与稳定性,为大模型稀疏化发展奠定基础。

563 132
|
5月前
|
JSON 监控 供应链
|

天猫商品详情API技术文档:智能电商开发的必备工具

天猫商品详情API(tmall.item_get)通过商品ID实时获取标题、价格、库存、SKU、评价等结构化数据,支持JSON格式返回,适用于电商分析、竞品监控与价格优化,需授权访问,可按需筛选字段,提升数据传输效率。

250 3
|
6月前
|
算法 数据挖掘 大数据
|

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

317 8
|
6月前
|

UPN512技术架构白皮书(英文版)

随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。

216
|
6月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

798 1
|
7月前
|
自然语言处理 安全
|

Min-p采样:通过动态调整截断阈值让大模型文本生成兼顾创造力与逻辑性

大语言模型通过预测下一个词生成文本,采样策略决定其创造力与连贯性。Min-p采样根据模型置信度动态调整选择阈值,在高不确定性时扩大候选范围,低不确定性时聚焦高概率词,相较Top-k、Top-p等方法,更好平衡了多样性与质量,尤其在高温下仍保持输出稳定,提升生成文本的流畅性与创新性。

314 3
|
7月前
|
XML JSON 算法
|

京东商品 SKU 信息接口(jingdong.ware.sku.get)技术干货:数据拉取、规格解析与字段治理(附踩坑总结 + 可运行代码)

本文详解京东商品SKU接口对接技术,涵盖核心参数、权限申请、签名生成、规格解析及常见坑点解决方案,结合可运行代码与实战经验,助力开发者高效集成SKU数据,实现库存、价格等关键信息精准获取。

505 1
|
7月前
|
存储 人工智能 数据可视化
|

企业级 AI 模型无代码落地指南:基于阿里云工具链,从 0 到 1 实现业务价值

某汽车零部件厂商通过阿里云PAI、OSS等工具,实现无代码AI质检落地:仅用控制台操作完成数据治理到部署,质检效率提升3倍,模型周期从2月缩至2周。本文详解全栈可视化方案,助力企业零代码落地AI。

805 1
|
8月前
|
JSON 缓存 API
|

孔夫子旧书网 API 实战:古籍与二手书数据获取及接口调用方案

孔夫子旧书网作为国内知名古籍与二手书交易平台,其数据对图书收藏、学术研究及电商系统具有重要价值。本文详解其API调用方法,涵盖认证机制、搜索参数、数据解析及反爬策略,并提供可直接使用的Python代码,助力开发者合规获取数据。

539 2
|
8月前
|
人工智能 自然语言处理 算法
|

提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍

LangChain作为主流大语言模型应用框架,其高级组件常被忽视。本文详解10个高价值但低使用率的核心组件,如语义检索、多模板路由、智能查询转换等,结合技术原理与实践案例,助开发者构建更高效、智能、适应性强的AI系统,提升应用性能与业务价值。

553 0
|
8月前
|
SQL 人工智能 数据挖掘
|

Apache Flink:从实时数据分析到实时AI

Apache Flink 是实时数据处理领域的核心技术,历经十年发展,已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用,支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布,其在流式湖仓、AI 驱动决策等方面展现出强大潜力,正推动企业迈向智能化、实时化的新阶段。

902 9
来自: 实时计算 Flink  版块
|
8月前
|
算法 安全 量子技术
|

“RSA还能撑多久?”——聊聊量子计算下密码学的危与机

“RSA还能撑多久?”——聊聊量子计算下密码学的危与机

508 0
|
9月前
|
JSON 搜索推荐 API
|

小红书笔记详情API响应数据解析

小红书开放平台提供笔记详情API,支持获取笔记内容、互动数据及用户信息,适用于品牌营销与市场分析。接口支持HTTP GET/POST请求,返回JSON格式数据。需申请权限并替换参数如note_id与access_token。附Python请求示例,建议添加异常处理。

349 0
|
9月前
|
消息中间件 人工智能 资源调度
|

云上AI推理平台全掌握 (5):大模型异步推理服务

针对大模型推理服务中“高计算量、长时延”场景下同步推理的弊端,阿里云人工智能平台 PAI 推出了一套基于独立的队列服务异步推理框架,解决了异步推理的负载均衡、实例异常时任务重分配等问题,确保请求不丢失、实例不过载。

915 13
来自: 人工智能平台PAI  版块
|
9月前
|
存储 分布式计算 大数据
|

【赵渝强老师】阿里云大数据存储计算服务:MaxCompute

阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。

428 0
来自: 大数据计算 MaxCompute  版块
|
9月前
|
人工智能 数据可视化 开发工具
|

开发效率提升5倍!聚AI的LangFlow可视化全栈指南

LangFlow 是一个强大的可视化流程开发工具,支持全平台部署与多模型集成。通过 Docker 快速启动、本地开发或云服务部署,用户可灵活配置环境。其核心功能包括四大对象管理、可视化编程、自定义组件开发及与 LangChain 的深度整合,适用于客户服务、金融、医疗等多领域自动化流程构建。结合性能优化与版本管理,助力开发者高效实现企业级 AI 应用。

1171 4
|
9月前
|
人工智能 缓存 资源调度
|

云上AI推理平台全掌握 (4):大模型分发加速

为应对大模型服务突发流量场景,阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供本地目录内存缓存(Memory Cache)的大模型分发加速功能,有效解决大量请求接入情况下的推理延迟。PAI-EAS 大模型分发加速功能,零代码即可轻松完成配置。

762 3
来自: 人工智能平台PAI  版块
|
9月前
|
存储 缓存 Apache
|

Apache Iceberg数据湖高级特性及性能调优

性能调优涵盖索引优化、排序策略与元数据管理。通过布隆过滤器、位图索引等提升查询效率,结合文件内/间排序优化I/O与压缩,辅以Z-Order实现多维数据聚集。同时,合理配置元数据缓存与清单合并,加速查询规划。适用于点查、全表扫描及高并发写入场景,显著提升系统性能与资源利用率。

851 0
|
9月前
|
人工智能 运维 自然语言处理
|

如何在 Elasticsearch 中构建你的智能 AI 助手?

本文将带你探索一种全新的思路:如何基于 Elasticsearch 快速构建一个具备自然语言理解能力、异常检测和安全威胁识别能力的智能运维 AI 助手 。文章会围绕实际部署流程、关键技术点和典型应用场景展开,帮助你把 Elasticsearch 从“日志仓库”升级为“智能决策中枢”。

437 30
|
10月前
|
SQL 分布式计算 Hadoop
|

别再云里雾里了!一文带你整明白Hadoop生态到底是啥玩意儿

别再云里雾里了!一文带你整明白Hadoop生态到底是啥玩意儿

429 0
|
10月前
|
机器学习/深度学习 存储 NoSQL
|

基于 Flink + Redis 的实时特征工程实战:电商场景动态分桶计数实现

本文介绍了基于 Flink 与 Redis 构建的电商场景下实时特征工程解决方案,重点实现动态分桶计数等复杂特征计算。通过流处理引擎 Flink 实时加工用户行为数据,结合 Redis 高性能存储,满足推荐系统毫秒级特征更新需求。技术架构涵盖状态管理、窗口计算、Redis 数据模型设计及特征服务集成,有效提升模型预测效果与系统吞吐能力。

1086 10
|
10月前
|
机器学习/深度学习 存储 运维
|

机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明,Isolation Forest作为一个强大的异常检测模型,无需显式建模正常模式即可有效工作,在处理未见风险事件方面具有显著优势。

780 46
|
11月前
|
XML 数据挖掘 API
|

1688商品详情API接口指南

1688 商品详情 API 是阿里巴巴提供的开发者接口,用于获取 1688 平台商品的详细信息,包括 ID、标题、价格、销量、评价、SKU 等。通过构造 HTTP 请求并使用 App Key 和 App Secret 验证,可实现安全调用。该接口适用于电商网站、内容管理系统、数据分析工具及第三方开发场景,助力商品信息同步、市场分析与应用开发。

553 0
|
11月前
|
数据采集 文字识别 JavaScript
|

视觉分析开发范例:Puppeteer截图+计算机视觉动态定位

本文介绍了在现代互联网中,传统DOM爬虫难以应对动态加载和视觉驱动内容的问题,并提出了“视觉爬虫”的解决方案。通过Puppeteer实现浏览器自动化,结合计算机视觉技术完成页面元素的动态定位与信息提取。文章对比了DOM爬虫与视觉爬虫的技术特点,展示了基于Node.js的核心代码示例,用于小红书平台的视频搜索、播放及截图处理。最后指出,视觉爬虫能够突破传统限制,在强JS渲染和动态内容场景中更具优势,为数据采集提供了新方向。

476 1
|
11月前
|
Web App开发 数据采集 JavaScript
|

动态网页爬取:Python如何获取JS加载的数据?

动态网页爬取:Python如何获取JS加载的数据?

1571 58
|
11月前
|
机器学习/深度学习 PyTorch 编译器
|

深入解析torch.compile:提升PyTorch模型性能、高效解决常见问题

PyTorch 2.0推出的`torch.compile`功能为深度学习模型带来了显著的性能优化能力。本文从实用角度出发,详细介绍了`torch.compile`的核心技巧与应用场景,涵盖模型复杂度评估、可编译组件分析、系统化调试策略及性能优化高级技巧等内容。通过解决图断裂、重编译频繁等问题,并结合分布式训练和NCCL通信优化,开发者可以有效提升日常开发效率与模型性能。文章为PyTorch用户提供了全面的指导,助力充分挖掘`torch.compile`的潜力。

1151 17
|
12月前
|
前端开发 JavaScript 开发者
|

这个被忽略的CSS:hover隐藏用法,让交互设计师都跪了

本文详细介绍了CSS中的伪类选择器`:hover`及其应用。`:hover`用于定义鼠标悬停在元素上时的样式,常见于超链接、按钮等交互场景。文章通过多个实例演示了`:hover`不仅可控制当前元素,还能影响其子元素或后代元素,但通常不适用于兄弟元素。此外,还分享了如何避免`:hover`导致的布局抖动问题,如提前设置透明边框。最后,结合实际案例展示了如何利用`:hover`实现复杂的交互效果,例如三级菜单,帮助开发者更好地掌握这一实用技巧。

732 1
|
12月前
|
文字识别 算法 小程序
|

【项目总结】快瞳医疗化验单的OCR识别

快瞳科技通过图像识别技术,成功解决了医疗化验单OCR识别难题。项目要求精准识别表格内容,尤其是化验数值和名称,准确率达85%以上。针对化验单来源多样、干扰因素多的问题,团队采用智能文档抽取模型、opencv技术(如霍夫变换)进行图片扶正与裁剪,优化识别精度。最终,项目不仅达到药企要求,还实现超越,为医疗行业智能化转型提供了高性价比解决方案,助力快瞳科技在医疗信息化领域树立良好口碑。

789 43
|
12月前
|
人工智能 自然语言处理 安全
|

基于LlamaIndex实现CodeAct Agent:代码执行工作流的技术架构与原理

CodeAct是一种先进的AI辅助系统范式,深度融合自然语言处理与代码执行能力。通过自定义代码执行代理,开发者可精准控制代码生成、执行及管理流程。本文基于LlamaIndex框架构建CodeAct Agent,解析其技术架构,包括代码执行环境、工作流定义系统、提示工程机制和状态管理系统。同时探讨安全性考量及应用场景,如软件开发、数据科学和教育领域。未来发展方向涵盖更精细的代码生成、多语言支持及更强的安全隔离机制,推动AI辅助编程边界拓展。

731 3
|
20天前
|
数据采集 监控 JavaScript
|

Node.js Axios代理配置指南与内存泄漏排查

本文讨论了如何优化Node.js+Axios+爬虫代理链路,解决高并发下的TCP握手开销和内存溢出问题。通过使用连接池、复用Agent、优化Axios配置等策略,显著提升了爬虫性能和稳定性。

119 1
|
20天前
|
自然语言处理 数据挖掘 数据库
|

数据智能引擎:从精准问数到深度分析的完整解决方案

数据智能引擎基于本体论,首创“精准问数+深度分析”双模式:技术专家可自然语言查数据,高管提方向性问题获自动洞察。多智能体协同、95%准确率、低门槛业务知识管理,赋能企业AI原生数据转型。(239字)

113 1
|
20天前
|
机器学习/深度学习 SQL 自然语言处理
|

数据智能体技术路线深度对比:本体神经网络 vs 预制指标平台

本文剖析数据智能体四大技术路径:RAG(简单但精度低)、NL2SQL(单表准、多表差)、预制指标(高维护成本、扩展性差)、本体神经网络(UINO首创,95%+准确率,维护成本线性增长)。推荐企业优先选择本体论路线,实现高精准、低成本、强扩展的AI原生问数。

129 1
|
26天前
|
人工智能 TensorFlow 算法框架/工具
|

别只会 `model.fit()`:聊聊 TensorFlow 2.x 的性能优化与生产部署那些事

别只会 `model.fit()`:聊聊 TensorFlow 2.x 的性能优化与生产部署那些事

191 6
|
1月前
|
消息中间件 监控 算法
|

别只盯着离线指标了:用大数据把模型“在线状态”盯死

别只盯着离线指标了:用大数据把模型“在线状态”盯死

145 2
|
1月前
|
Java 编译器 C++
|

#Java 逃逸分析与栈上分配:JIT 编译的极致性能优化底层

逃逸分析是JVM核心优化技术,JDK 1.6起默认启用。它通过分析对象动态作用域,对无逃逸对象实施栈上分配、标量替换和同步消除,显著降低GC压力、提升执行效率,是高性能Java开发的必备底层知识。(239字)

147 3
|
2月前
|
人工智能 自然语言处理 API
|

AI 新范式,从对话走向行动,奥尔特云全面接入OpenClaw,直接通过IM对话框下指令给AI完成工作任务

人机交互可能正迈向第三次变革:迈入自然语言指令时代。OortBot与OpenClaw等本地AI Agent兴起,支持私有部署、多智能体协同、深度系统集成,数据不出本地,成本可控、自由可定制——AI正加速从云端走向端侧。

142 0
|
2月前
|
人工智能 SEO
|

GEO时代,普通人也能抓住的AI红利

本文介绍“生成式引擎优化”(GEO)——普通人弯道超车的新机会。在AI搜索时代,无需烧钱投流,只需将真实专业经验结构化输出(如装修坑点、育儿知识),就能被ChatGPT等AI高频引用,获精准流量。早入局,竞争小,见效快。

194 1
|
2月前
|
数据采集 JSON 监控
|

京东宝贝详情数据采集指南

京东商品详情API是京东开放平台核心接口,合规、实时(延迟≤30秒)、全量获取商品结构化数据,涵盖价格、库存、图文、参数、评价等维度,支持高并发与企业级配额,广泛应用于比价监控、选品分析、ERP集成及营销推荐等场景。

220 1
|
2月前
|
数据采集 人工智能 数据可视化
|

从群发文案到私人定制:手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语:拆解人情世故为6个可量化要素,人工打磨3000条高质量种子数据,30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板,而是带共同记忆、有温度的真挚表达——技术不止提效,更可传递心意。(239字)

187 8
|
2月前
|
数据采集 人工智能 自然语言处理
|

从“通才”到“专才”:揭秘AI大模型预训练与微调的核心魔法

本文通俗解析AI“预训练+微调”范式:预训练如AI的“基础教育”,让模型从海量数据中自学语言与视觉规律;微调则是定向“专业培训”,用少量业务数据将通用大模型转化为解决具体问题的“专属专家”。全程兼顾原理、步骤与实践,助力零基础用户轻松上手。(239字)

258 7
|
2月前
|
数据采集 XML 前端开发
|

BeautifulSoup:Python网页解析的优雅利器

BeautifulSoup是Python最易用的HTML/XML解析库,以超强容错性与人性化API著称。它能将混乱网页转为结构化树,支持CSS选择器、多种解析器(推荐lxml),无需正则即可快速提取数据,是中小型爬虫、教学及原型开发首选工具。(239字)

180 1
|
2月前
|
机器学习/深度学习 数据可视化 程序员
|

模型说不清,人就不敢用:可解释性,往往死在数据准备那一步

模型说不清,人就不敢用:可解释性,往往死在数据准备那一步

150 7
|
2月前
|
JSON 监控 API
|

京东商品评论API(jd.item_review)开发指南

京东商品评论API(jd.item_review)是京东开放平台提供的合规REST接口,支持获取商品评论、评分、晒图、追评等多维数据,助力口碑监控、竞品分析与用户反馈收集,提升运营决策效率。(239字)

165 2
|
2月前
|
人工智能 物联网 Shell
|

告别“人工智障”:零代码驯服大语言模型,打造你的专属AI助手

本文详解大模型微调(Fine-tuning)如何破解通用AI“懂但不专”的痛点:用专属数据为大模型做“岗前培训”。全程零代码、纯在线,基于ModelScope与QLoRA技术,30分钟即可完成Yi-6B模型微调,重塑其身份认知。兼顾原理通俗解读与手把手实战,助你真正掌握“塑造AI”的主动权。(239字)

257 3
|
3月前
|
机器学习/深度学习 算法 安全
|

大模型微调参数设置:你调的不是效果,是不确定性

本文揭示大模型微调中参数的本质:它们并非提升性能的“旋钮”,而是分配不确定性的“阀门”。learning rate 决定行为漂移半径,batch size 影响共识强度,epoch 加速偏差固化,正则项约束激进程度。参数间存在风险耦合,调参实为风险管理——目标不是最优指标,而是可控的系统行为。

217 10
|
3月前
|
存储
|

RAG 为什么总是“看起来能用,实际不好用”?

RAG效果不佳?问题往往不在模型,而在于文档切分。错误的切分会导致语义断裂、关键信息丢失,使召回内容“看似相关却无用”。本文深入剖析切分误区:固定长度切割、过度依赖overlap、忽视文档结构等,并提出核心原则——保障语义完整性。不同文档需定制切分策略,FAQ按问答切,技术文档依章节分,流程类保完整上下文。切分是RAG的地基,而非细节,唯有夯实,才能让检索与生成真正生效。

197 3
|
3月前
|
人工智能 缓存 算法
|

【AI大模型面试宝典九】- 推理部署篇

【AI大模型面试宝典】聚焦推理加速核心技术:KV-Cache优化、连续批处理、投机解码、模型并行等,结合vLLM实战与面试高频题解析,帮你系统掌握得分要点,高效斩获offer!点赞关注,持续更新中~

329 0
来自: 人工智能平台PAI  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务