|
4月前
|
人工智能 架构师 API
|

智能体来了,智创未来背后隐藏着哪些新趋势?

2024年迈入AI Agent时代:从单体大模型走向多智能体协作、端侧轻量化部署与Agent即操作系统。告别“单打独斗”,开发者需掌握Multi-Agent架构、SLM优化及Agent-OS范式,主动参与智能生产力重构。(239字)

190 1
|
4月前
|
人工智能 前端开发 API
|

哇塞!智能体来了,智创未来欢乐冒险起航啦

AI Agent正引领开发者迈入“实干”新纪元:它不止会聊,更能自主规划、调用工具、记忆偏好,化身全能助手。告别玄学提示词,拥抱工作流编排;一人即一队,代码、测试、评审全包办。玩转LangChain、Coze或MetaGPT,扬帆起航!🚀(239字)

146 1
|
4月前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

272 0
|
4月前
|
数据采集 资源调度 安全
|

一次高并发采集系统的架构设计评审记录

本文讨论了高并发数据采集系统的架构设计问题。原系统因架构失配导致采集失败率高,解决方案是引入架构拆分与代理池,实现任务调度、代理管理、请求执行和失败处理的分离,以提高系统稳定性和资源利用率。评审结论强调,系统稳定性取决于架构设计而非代码质量。

122 1
|
4月前
|
混合部署
|

软件授时和 NTP 硬件时间服务器,项目里该怎么选

项目中多套系统、设备时间未统一,导致日志、视频等时间不一致,排查困难。经分析,采用专用授时设备NTS-886003作为内部唯一时间源,实现全系统统一对时,解决时间偏差问题。

162 0
|
4月前
|
存储 缓存 人工智能
|

向量数据库技术内核:从存储到检索,拆解其高效运作的秘密

本文深入剖析向量数据库从存储到检索的工程实现,揭秘其高效运作的核心机制。不同于传统数据库,它通过近似最近邻(ANN)、向量压缩与分层索引(如HNSW)等技术,在高维空间中以“算得少”实现“查得快”。文章结合真实场景,揭示其本质:不是追求绝对精确,而是工程权衡下的极致优化,是AI时代数据检索的实用化落地。

367 3
|
4月前
|
人工智能
|

当智能体开始长期运行,AI智能体运营工程师在系统中负责哪些关键决策?

在智能体逐步进入真实业务并开始长期运行的背景下,问题不再是是否需要智能体,而是如何保障其作为系统的稳定与可持续运行。随着运行周期拉长,目标调整、任务规划失效、成本与收益评估、异常处理以及能力复用等问题不断显现,这些问题往往无法通过一次性开发或模型训练解决。 在此过程中AI智能体运营工程师承担着关键的系统决策职责,其核心工作并非持续开发新功能,而是在智能体生命周期的多个关键节点上,对目标边界、执行路径、运行价值和风险进行判断与调整。通过这些系统层面的决策,运营工程师保障智能体从短期试验走向长期可用,避免因失控、低效或高成本而被淘汰。该角色的价值体现在对智能体整体运行质量的把控,是智能体实现规模化

141 4
|
4月前
|
人工智能 运维 自然语言处理
|

AI智能体运营工程师:智能体进入真实业务后,谁在负责系统的长期运行?

随着大模型能力逐步成熟,人工智能应用正从以单轮对话和内容生成为主的模式,向可承担复杂任务、支持长期运行的系统形态演进,智能体(AI Agent)成为连接大模型与真实业务的重要技术形态。 智能体是一种以目标为导向、具备任务规划、执行调度与结果反馈能力的系统结构,更强调多步骤任务处理、工具与系统调用以及基于结果的持续调整,因而适合嵌入真实业务流程并长期运行。 在此过程中,运行稳定性、目标边界、异常处理与效果评估等问题逐步显现,催生了AI智能体运营工程师这一角色。该角色关注智能体的长期可持续运行,并通过流程化、可编排方式(如“扣子”实践)推动人工智能能力向实际生产力转化。

138 2
|
4月前
|
数据采集 监控 API
|

1688商品列表API接口快速上手指南

本文介绍如何通过1688开放平台官方API,合规高效地获取店铺商品列表数据。以`item_search_shop`接口为例,详解请求参数、签名生成规则与调用限制,结合Python实战实现稳定采集。强调签名安全、频率控制与数据合规使用,助力B2B电商分析、选品监控等场景高效落地。(238字)

408 1
|
4月前
|
人工智能 运维 安全
|

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

337 12
|
4月前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

237 10
|
4月前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

300 0
|
4月前
|
存储 人工智能 运维
|

向量数据库实战指南:从部署到RAG落地

本文以轻量开源向量数据库Chroma为例,手把手带你完成环境部署、数据导入、相似性检索到RAG集成的全流程实战,避开新手常见坑,适配码农与大数据爱好者快速落地AI应用,助力掌握向量数据库核心技能。

695 1
|
4月前
|
SQL 存储 分布式计算
|

Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力团队依托Hologres Dynamic Table,实现亿级商品数据的高效治理。通过增量刷新与全量刷新机制,支持秒级圈选、分钟级报表更新,满足大促场景下高时效、多维度分析需求,显著提升数据灵活性与决策效率。

595 4
来自: 实时数仓 Hologres  版块
|
4月前
|
存储 搜索推荐
|

漫画说:为什么你的“增量计算”越跑越慢? ——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

面对海量数据,传统全量计算导致实时更新效率低下。阿里云 Hologres 通过有状态增量计算,仅处理变更数据并持久化中间状态,实现秒级刷新、降本增效,真正让“增量”摆脱重复扫描历史的困局。

249 1
来自: 实时数仓 Hologres  版块
|
4月前
|
人工智能 搜索推荐 算法
|

不懂向量数据库?一文讲透其原理与应用场景

向量数据库通过将文本、图像等非结构化数据转化为“数学指纹”(向量),实现语义级相似性检索。它突破传统数据库的精确匹配局限,支撑智能客服、推荐系统与RAG应用。核心原理是Embedding编码+高效索引(如HNSW、IVF),支持亿级数据毫秒搜索。结合元数据过滤的混合查询,显著提升准确性。未来将迈向多模态融合与自适应智能检索,是AI时代不可或缺的基础设施。

773 0
|
4月前
|
XML 供应链 API
|

1688店铺公司档案信息API接口开发全指南

本文系统讲解1688店铺公司档案信息API开发,涵盖接口认知、接入准备、调用实战、数据解析与合规风控五方面,助力企业高效获取供应商资质、产能、信用等核心数据,提升供应链数字化水平。通过第三方合规接口,实现ERP系统对接、供应商分级与风险预警,推动采购智能化升级。(239字)

279 0
|
4月前
|
机器学习/深度学习 人工智能 算法
|

大模型微调新篇章:从“学会知识”到“理解偏好”,PPO算法全解析与实践指南

本文深入解析大模型对齐人类偏好的核心技术——近端策略优化(PPO)。从原理到实践,详解PPO如何通过Actor、Reference、Reward与Critic四模型协作,结合强化学习实现更自然、安全、有用的对话。涵盖训练流程、常见问题、评估方法及进阶技巧,并以LLaMA-Factory为例演示操作,助力开发者快速上手,打造更“懂你”的AI助手。

934 3
|
4月前
|
数据采集 文字识别 BI
|

RAG 只做文本已经不够了:多模态问答的工程化落地指南

本文深入探讨多模态RAG的工程落地挑战与实践方案,揭示为何仅处理文本已无法满足企业真实需求。从图像、表格等多模态数据的解析、语义对齐、检索融合到生成控制,系统梳理三层架构与四大关键步骤,助力构建真正可用的多模态问答系统。

910 3
|
4月前
|
运维 安全 测试技术
|

机房项目中的时间系统:从忽视到谨慎的十年体会

本文分享了作者在机房系统集成项目中,对时间同步从忽视到重视的十年实践经验。早期依赖公网NTP的简单做法,常导致日志混乱、故障难查等问题;后期引入本地北斗授时服务器,强调时间源的确定性与统一性,提升系统稳定性和可维护性。文章还探讨了设备选型关注点及可靠部署方案,突出时间系统在政企、金融等关键场景中的重要价值。

215 0
|
4月前
|
存储 自然语言处理 监控
|

10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑

本文分享10万级文档RAG系统从Demo到生产的实战经验,剖析检索慢、召回率低、部署复杂三大痛点,涵盖文档切分、Embedding选型、向量库优化、重排序与生成约束等关键步骤,并提供可落地的工程方案与评估方法,助力构建高效、稳定的企业级RAG系统。

1006 3
|
4月前
|
安全 网络安全 数据安全/隐私保护
|

用好代理 IP:加密付费拒绝免费陷阱

代理IP兼具隐私保护与安全风险,合规使用可防追踪、保障跨境业务,但非正规服务易致信息泄露、账号风控,甚至被用于违法活动。用户应选择加密付费代理,避开免费陷阱,遵守法规,强化安全防护,让技术真正服务于合法需求。

340 4
|
4月前
|
人工智能 搜索推荐 数据库
|

从零搭建RAG系统:原理剖析+代码实践,解锁大模型“记忆力”新姿势

RAG(检索增强生成)为大模型配备“外接大脑”,通过连接专属知识库,提升回答准确性。广泛应用于医疗、法律、客服等领域,兼具专业性与可解释性。本文详解其原理、实战步骤与优化技巧,助你快速构建个性化AI助手。

1793 12
|
4月前
|
人工智能 运维 调度
|

数据中心节能:液冷 + AI 调度,到底是不是“真解法”?

数据中心节能:液冷 + AI 调度,到底是不是“真解法”?

269 4
|
4月前
|
机器学习/深度学习 数据采集 监控
|

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

284 8
|
4月前
|
前端开发 调度 决策智能
|

智能体应用场景拆解:它适合出现在系统的哪些位置?

智能体应用的关键不在“能否做”,而在“应放在系统何处”。本文从工程视角指出:智能体应作为被调度的执行模块,嵌入非结构化节点,避免成为中枢大脑。宜用于后台任务、辅助执行,而非前端交互或决策判断。合理位置需满足可降级、可替代、失败成本低等特征,确保系统稳定性。

226 2
|
4月前
|
存储 数据采集 数据处理
|

大模型RAG实战:从零搭建专属知识库问答助手

本文介绍如何用RAG技术从零搭建个人Python知识库问答助手,无需代码基础,低成本实现智能问答。涵盖数据准备、向量存储、检索生成全流程,附避坑技巧与优化方法,助力新手快速上手大模型应用。

1331 0
|
4月前
|
存储 安全 API
|

隐私合规红线不能碰:大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区,剖析90%开发者易踩的技术陷阱,从分层脱敏、差分隐私到权限管控,提供全链路可落地的防护方案,并结合性能与安全双重验证,助力企业实现合规与效能双赢。

494 0
|
4月前
|
数据采集 存储 监控
|

显存不够?16G显卡驾驭13B模型的计算与优化全指南

显存不够也能玩转大模型!本文详解如何用16G显卡成功微调13B参数模型,从显存精准计算、INT8量化、LoRA低秩适配到激活检查点优化,手把手教你规避OOM风险。结合实战代码与监控技巧,显存占用压至14.5GB内,效果显著优于7B模型。低成本实现高效大模型微调,个人开发者和小团队必备指南!

1011 0
|
4月前
|
人工智能 运维 物联网
|

民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?

本文深入解析大模型微调中民用卡、专业卡与云GPU的选型难题,从显存、算力、稳定性、成本四大维度对比三类GPU差异,结合个人、团队、企业不同场景,提供“三步选型法”与实测数据,帮你匹配最优方案,实现性能与成本的平衡。

484 2
|
4月前
|
数据采集 人工智能 搜索推荐
|

大模型入门指南:从看懂原理到动手微调,一步步打造你的专属AI

本文深入浅出地讲解大模型核心技术:从Token、Embedding到上下文窗口,揭秘AI如何理解语言;通过提示词工程、RAG与微调,教你打造专属智能助手。零基础也能学会,让AI真正为你所用,开启个性化智能时代。

1290 1
|
4月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

471 4
|
4月前
|
JSON 监控 API
|

1688商品查询榜单API技术对接指南(含趋势数据应用实操)

本文详解1688商品查询榜单API对接全流程,涵盖核心能力、前置准备、调用规范与实战避坑。通过热销榜、新品榜等多维数据,助力B2B选品分析、竞品监控与趋势预判,结合实操建议与进阶优化策略,赋能开发者高效构建数据驱动型业务。

417 2
|
4月前
|
机器学习/深度学习 人工智能 算法
|

新能源电池寿命预测模型

新能源电池寿命预测模型

282 11
|
4月前
|
存储 传感器 缓存
|

边缘到云:数据不是“搬家”,而是一场精打细算的流动博弈

边缘到云:数据不是“搬家”,而是一场精打细算的流动博弈

140 8
|
4月前
|
数据可视化 BI 定位技术
|

选择合适的工具

选择合适工具(如Excel、Tableau、Python等)进行数据可视化,确保数据清洁、结构合理。根据分析目标选用折线图、柱状图、散点图等图表类型,设计时优化颜色、字体、标签等视觉元素,提升可读性。通过代码示例实现图表并验证效果,确保信息准确传达。

147 8
|
4月前
|
数据采集 自然语言处理 搜索推荐
|

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

本文深入浅出解析大模型指令微调核心技术,从“能聊”到“会干”的关键跃迁。通过“教小孩做事”类比,拆解指令微调原理,详解数据格式、质量与策略三要素,提供16G显卡可跑的四步实操流程,并结合效果评估与未来趋势,助力新手快速掌握让大模型精准执行任务的核心方法。

504 3
|
4月前
|
数据采集 人工智能 监控
|

从原理到实操:大模型微调效果评估完全指南

微调大模型后如何判断效果?本文系统讲解评估核心方法:结合人工与自动化评估,覆盖通用能力与专项技能。通过明确目标、构建测试集、选用工具(如OpenCompass)、分析结果四步,打造完整评估体系。强调“对比”与“迭代”,助你避免灾难性遗忘,真实提升模型性能。

547 3
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
|

大数据与机器学习的定义

大数据指海量、高速、多样的信息集合,传统工具难以处理;机器学习是AI分支,能从数据中自动学习规律并决策。二者相辅相成:大数据为机器学习提供训练基础,机器学习则挖掘数据价值,推动金融、医疗、零售、工业等领域的智能化升级。核心技术包括Hadoop、Spark、TensorFlow等,未来趋势聚焦边缘计算、可解释AI与实时分析。

191 5
|
4月前
|
人工智能 JSON 物联网
|

别光“调戏”ChatGPT了!亲手微调一个专属大模型,你需要知道这些

本文深入浅出地讲解大模型“训练-微调-推理”三步法,类比医生培养过程,帮助读者理解AI如何从通才变为专才。涵盖技术原理、实操步骤、效果评估与GPU选型,助力个人与企业打造专属AI模型,推动AI应用落地。

445 9
|
4月前
|
存储 人工智能 并行计算
|

别再搞混了!一文看懂“显存”与“内存”:从办公桌到实验室的硬核分工

本文以生动比喻与硬核解析,深入浅出地讲清内存(RAM)与显存(VRAM)的本质区别:内存是CPU的通用工作台,显存是GPU的专用高速实验室。二者分工明确,数据需通过PCIe传输,无法互相替代。尤其在AI训练中,显存容量与带宽直接决定模型能否运行。文章结合代码实例、性能对比表及排错指南,帮助开发者理解“CUDA out of memory”等常见问题,并提供优化策略与云平台建议,是迈向高效AI开发的必读指南。

3425 0
|
4月前
|
存储 数据采集 人工智能
|

大模型微调显存计算:从原理到实践的精准把控

本文深入解析大模型微调中的显存占用问题,揭示8GB显存为何能跑7B模型的真相。从显存四大组成部分入手,结合量化、LoRA、AdamW8bit等优化策略,手把手教你精准计算与压缩显存,让低配显卡也能高效微调大模型,助力AI实践入门。

801 3
|
4月前
|
人工智能 自动驾驶 安全
|

V2X 车联网:不是“聪明的车”,而是“会聊天的车”

V2X 车联网:不是“聪明的车”,而是“会聊天的车”

434 6
|
4月前
|
消息中间件 分布式计算 监控
|

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

302 6
|
4月前
|
数据采集 人工智能 物联网
|

什么是微调?大模型定制化的核心技术与实操指南

微调让大模型从“通用助手”变为“专属专家”。通过少量数据训练,LoRA等轻量化方法可在单卡上实现高效优化,广泛应用于医疗、金融、电商等领域。数据驱动、成本低廉、效果显著,微调正推动AI定制化落地,人人皆可拥有专属AI。

971 3
|
4月前
|
XML JSON API
|

1688商品详情API接口使用指南

1688商品详情API(1688.item_get)是阿里1688开放平台核心接口,支持通过商品ID获取50+字段的全量信息,涵盖标题、价格、SKU、库存、图文、批发规则及商家资质等,适用于ERP同步、比价、跨境铺货等B2B场景。需实名认证并创建应用获取app_key与app_secret,接口仅返回JSON格式数据,是对接1688生态的关键技术通道。(239字)

610 4
|
4月前
|
数据采集 人工智能 自然语言处理
|

开源大模型微调对比:选对模型,让定制化更高效

本文对比Llama 3、Qwen2.5、Mistral三款开源大模型在中文场景下的微调表现,从算力门槛、数据效率、任务适配性等维度分析,结合实战案例与主观评估,为开发者提供选型建议,助力高效构建定制化AI模型。

799 10
|
4月前
|
传感器 自动驾驶 算法
|

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

308 13
|
4月前
|
消息中间件 存储 运维
|

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

233 8
|
4月前
|
数据采集 人工智能 自然语言处理
|

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

在AI迈向专业决策的关键节点,阿里云联合NVIDIA发起“寻找AI全能王”全球大奖赛,聚焦高质量数据构建与智能体开发两大挑战。赛事设高校与企业双赛道,覆盖万亿语料去重与DeepSearch智能体构建,提供工业级实战平台、专家指导与丰厚奖励,推动Data+AI融合创新,助力开发者实现“所想即所得”的技术突破。

1228 2
来自: 大数据计算 MaxCompute  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69521
内容
128
活动
439955
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务