|
5月前
|
SQL 缓存 Java
|

汇总

MyBatis配置优先级:方法参数 > resource/url > properties内定义。支持多环境、事务管理(JDBC/MANAGED),XML实现一对一、一对多、多对多映射,分页支持逻辑与物理方式,推荐物理分页。提供一级、二级缓存及三种执行器,优化批量操作性能。

578 1
|
5月前
|
人工智能 自然语言处理 监控
|

通义AI搜索排名优化全攻略

武汉得知网络AI搜索优化基于内容质量、用户意图匹配与交互数据,通过语义深度、页面体验及权威链接提升排名,结合技术性能与多模态策略,助力企业精准抢占AI搜索流量高地。

998 4
来自: 实时数仓 Hologres  版块
|
9月前
|
人工智能 分布式计算 自然语言处理
|

多智能体系统设计:5种编排模式解决复杂AI任务

本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。

1913 10
|
10月前
|
传感器 算法 数据挖掘
|

Python时间序列平滑技术完全指南:6种主流方法原理与实战应用

时间序列数据分析中,噪声干扰普遍存在,影响趋势提取。本文系统解析六种常用平滑技术——移动平均、EMA、Savitzky-Golay滤波器、LOESS回归、高斯滤波与卡尔曼滤波,从原理、参数配置、适用场景及优缺点多角度对比,并引入RPR指标量化平滑效果,助力方法选择与优化。

2315 0
|
11月前
|
数据采集 存储 数据可视化
|

Python爬取招标信息并生成可视化分析报告

Python爬取招标信息并生成可视化分析报告

1108 0
|
16天前
|
SQL 人工智能 自然语言处理
|

一条 SQL 生成广告:Hologres 如何实现素材生成到投放分析一体化

广告投放面临“量、准、快”不可兼得的不可能三角:素材产能不足、数据与创意割裂、测试周期远超素材生命周期。阿里云Hologres以“Data + AI = All in One”理念,通过Object Table、AI Function、Dynamic Table等能力,实现素材采集、智能打标、AI生成、投放分析全链路闭环,用SQL驱动一体化智能创意工厂。

190 0
来自: 实时数仓 Hologres  版块
|
4月前
|
机器学习/深度学习 传感器 算法
|

Python | Stacking回归和SHAP可解释性分析回归预测及可视化算法

本教程基于Python实现Stacking回归与SHAP可解释性分析,涵盖地球科学、医学、工程等多领域回归预测应用。结合CatBoost、LightGBM、XGBoost等模型,采用贝叶斯、随机与网格搜索优化参数,并通过SHAP值可视化特征贡献,提升模型性能与可解释性,适用于科研与实际项目。

772 2
|
5月前
|
canal 缓存 关系型数据库
|

微服务原理篇(Canal-Redis)

本文介绍了ES索引同步的常见方案,重点讲解Canal+MQ数据同步机制。通过解析MySQL的binlog日志,Canal模拟slave伪装接入主库,实现增量数据捕获,并结合RabbitMQ保证消息顺序性地同步至Elasticsearch。同时探讨了缓存一致性问题,提出使用分布式锁(如Redis)控制并发写操作,避免双写不一致。还涵盖Redis持久化、集群模式、过期淘汰策略及缓存三剑客(穿透、雪崩、击穿)的解决方案,系统梳理了高并发场景下的数据同步与缓存保障技术体系。

521 0
|
8月前
|
人工智能 数据可视化 数据处理
|

AI智能体框架怎么选?7个主流工具详细对比解析

大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。

2044 3
|
12天前
|
存储 人工智能 小程序
|

CDP 建设实践:从多源客户数据整合到运营闭环

本文从多源数据接入、OneID、标签体系、人群圈选、运营闭环和 AI 能力等维度,梳理企业建设客户数据平台 CDP 的核心判断标准。

164 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
|

跨越鸿沟:传统产品经理如何迈向AI产品经理的黄金赛道

跨越鸿沟:传统产品经理如何迈向AI产品经理的黄金赛道

378 9
|
4月前
|
数据采集 人工智能 物联网
|

什么是微调?大模型定制化的核心技术与实操指南

微调让大模型从“通用助手”变为“专属专家”。通过少量数据训练,LoRA等轻量化方法可在单卡上实现高效优化,广泛应用于医疗、金融、电商等领域。数据驱动、成本低廉、效果显著,微调正推动AI定制化落地,人人皆可拥有专属AI。

970 3
|
4月前
|
存储 SQL 运维
|

Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器

在实时数据架构中,Hologres Dynamic Table 基于有状态增量计算模型,有效解决“海量历史+少量新增”场景下的数据刷新难题。相比传统全量刷新,其通过持久化中间状态,实现复杂查询下的高效增量更新,显著降低延迟与资源消耗,提升实时数仓性能与运维效率。

664 36
来自: 实时数仓 Hologres  版块
|
5月前
|
Dubbo Java 应用服务中间件
|

入门运行Soul

Soul 是基于 WebFlux 的高性能响应式 API 网关,支持 Dubbo、Spring Cloud、Spring Boot,具备异步、跨语言、插件化扩展、动态流量控制等特性,集成鉴权、限流、熔断等丰富插件,支持集群部署与灰度发布。

581 0
|
5月前
|
SQL 安全 网络协议
|

常见的网络攻击

恶意软件指具有险恶目的的程序,如病毒、勒索软件、间谍软件等,常通过钓鱼邮件或漏洞入侵系统,窃取数据、破坏功能。网络钓鱼伪装成可信来源骗取敏感信息。中间人攻击窃听通信,DDoS攻击以海量流量瘫痪服务,SQL注入窃取数据库,零日漏洞利用未修复缺陷,DNS隧道则隐蔽传输恶意数据,均为常见网络安全威胁。

263 0
|
5月前
|
数据采集 安全 API
|

高精度IP定位:准确性提升与数据优化全攻略

使用IP数据云、IPinfo、IPnews这类专业的IP数据服务平台检测,不仅可以查询IP,更是一个网络风险识别仪器。对于跨境电商、安全研究人员,或者想提高上网隐私的人来说,都挺值得收藏学习。

1127 1
|
7月前
|
API 开发者 数据采集
|

高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案

2025反向海淘新机遇:依托代购系统,聚焦小众垂直品类,结合Pandabay数据选品,降本增效。系统实现智能翻译、支付风控、物流优化,助力中式养生茶等品类利润翻倍,新手也能快速入局全球市场。

1404 2
|
8月前
|

一键解决 Office 卸载难题!微软官方卸载工具,点击下载开启轻松卸载之旅

微软官方Office卸载工具可彻底清除Office 2007至2021及365版本残留,解决重装报错问题。支持深度扫描与一键卸载,操作简单,卸载后需重启生效。

2524 18
|
11月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

2805 4
|
11月前
|
人工智能 程序员 PHP
|

Cursor AI来袭!编程从此不再繁琐,一键生成代码,效率提升千倍

AI攻破最后防线!连架构设计都能自动生成,中级程序员集体破防

1888 10
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。

2339 7
来自: 人工智能平台PAI  版块
|
2月前
|
人工智能 算法 安全
|

AI辅助编程设计之道:从Spec到Code工程实践

大语言模型正重塑开发模式,但盲目依赖AI生成代码易陷入“描述-生成-修改”循环。核心问题在于跳过设计阶段:模糊需求无法支撑高质量输出。Spec驱动开发强调以结构化文档(需求、架构、接口等)明确设计,再由AI高效实现。人专注设计与验证,AI负责编码与建议——这才是提效关键。(239字)

868 7
|
4月前
|
存储 数据采集 人工智能
|

大模型微调显存计算:从原理到实践的精准把控

本文深入解析大模型微调中的显存占用问题,揭示8GB显存为何能跑7B模型的真相。从显存四大组成部分入手,结合量化、LoRA、AdamW8bit等优化策略,手把手教你精准计算与压缩显存,让低配显卡也能高效微调大模型,助力AI实践入门。

799 3
|
15天前
|
SQL 人工智能 安全
|

从 BI Copilot 到业务 Agent:指标服务如何成为统一数据接口?

一个能够提供标准化、语义化、服务化数据接口的指标层,正成为数据智能新阶段的战略基础设施。

120 3
|
4月前
|
物联网 测试技术
|

为什么 loss 几乎没用:微调里最容易让人“自嗨”的指标

本文揭示了大模型微调中一个常见误区:过度依赖loss曲线判断训练效果。loss仅反映模型对训练数据的拟合程度,并不衡量实际表现。它可能平稳下降,但模型输出无改善甚至变差。尤其在SFT/LoRA微调中,loss易被“虚假优化”,掩盖行为偏移、泛化缺失等问题。真正关键的是人工对照输出变化,结合loss作为辅助参考,而非决策核心。

666 5
|
4月前
|
人工智能 缓存 算法
|

【AI大模型面试宝典九】- 推理部署篇

【AI大模型面试宝典】聚焦推理加速核心技术:KV-Cache优化、连续批处理、投机解码、模型并行等,结合vLLM实战与面试高频题解析,帮你系统掌握得分要点,高效斩获offer!点赞关注,持续更新中~

561 0
来自: 人工智能平台PAI  版块
|
5月前
|
SQL NoSQL 前端开发
|

大厂如何解决订单幂等问题

本文详解分布式系统中订单接口幂等性设计:通过唯一订单号与数据库主键约束防止重复下单,结合Redis标识记录确保请求仅处理一次;针对ABA问题,引入版本号机制,更新时校验并自增版本,保证数据一致性。方案适用于各类数据库场景,保障服务在重试、并发下数据准确。

818 0
|
5月前
|
自然语言处理 监控
|

大模型评估与调试术语解释

困惑度衡量语言模型预测能力,值越低越好;过拟合指模型记住了训练数据却泛化差;泛化能力体现模型应对新任务的适应性;人工评估是生成质量的“金标准”;BLEU和ROUGE分别基于n-gram和召回率评估生成文本与参考的相似度;混淆矩阵用于分析分类错误模式。这些指标共同构成大模型评估体系,需结合使用以全面评价性能。

648 0
|
5月前
|
存储 文字识别 数据可视化
|

实用代码工具:Python打造PDF选区OCR / 截图批量处理工具(支持手动/全自动模式)

一款基于Python的PDF区域OCR与截图工具,支持精准框选、文字识别、图片截取及Excel一键导出。内置手动审核与全自动批量处理模式,结合PyMuPDF、easyocr等技术,实现高效、可视化的PDF数据提取,适用于发票、报表等场景,显著提升办公效率。

901 11
|
5月前
|
数据采集 算法 机器人
|

具身智能:零基础入门睿尔曼机械臂(五)—— 手眼标定核心原理与数学求解

本文系统讲解手眼标定技术,涵盖Eye-in-Hand与Eye-to-Hand两种架构,深入推导AX=XB方程的数学原理与求解方法,结合实际应用场景和操作步骤,为机器人视觉开发者提供从理论到实践的完整指南。

1034 9
|
10月前
|
数据采集 存储 大数据
|

大数据之路:阿里巴巴大数据实践——日志采集与数据同步

本资料全面介绍大数据处理技术架构,涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容,适用于构建企业级数据平台体系。

1033 1
|
24天前
|
人工智能 自然语言处理 搜索推荐
|

知识蒸馏(KD)深度落地:解锁GEO生成式优化轻量化高性能方案

知识蒸馏作为大模型轻量化的核心底层技术,有效解决了大模型落地贵、运行慢、部署难的痛点,让轻量化模型也能具备接近大模型的搜索语义理解与高质量内容生成能力。

230 4
来自: 智能搜索推荐  版块
|
1月前
|
人工智能 运维 Apache
|

Flink Agents 0.3 Roadmap解读

Apache Flink Agents 是 Apache Flink 新晋子项目,专注构建事件驱动的流式 AI Agent。0.3 版本 roadmap 已公布:支持 Agent Skills 集成、Mem0 长期记忆、跨语言 Action/Events、Python 3.12、日志分级与可观测性增强等,目标打造生产级流式 Agent 框架。

424 2
来自: 实时计算 Flink  版块
|
2月前
|
自然语言处理 PyTorch 算法框架/工具
|

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

706 10
|
4月前
|
人工智能 安全 物联网
|

企业专属AI从0到1:避开隐私雷区,用你的数据安全微调大模型

本文详解企业如何安全微调大模型:直击隐私痛点,融合差分隐私(梯度裁剪+噪声注入)与LoRA高效微调,在保障GDPR/HIPAA合规前提下,实现数据不出域、模型更懂业务。附低代码平台推荐与实操路径,兼顾安全性与可用性。(239字)

560 0
|
5月前
|
JSON 监控 API
|

京东商品评论API使用指南

京东商品评论API是京东开放平台提供的核心接口,用于查询指定SKU的用户评论数据,涵盖评分、内容、晒单图片、追评等信息。适用于电商分析、口碑监控等场景。需通过京东联盟申请appkey/appsecret授权调用,遵循平台规则与频率限制,严禁非合规爬取。

647 0
|
5月前
|
数据挖掘 BI API
|

微店店铺所有商品API接口指南

微店商品API支持通过店铺ID获取全部商品信息,提供分页、状态筛选与多维度排序功能,适用于商品管理、数据统计及跨平台同步。返回商品ID、标题、价格、库存、主图等详细信息,助力高效运营。

448 2
|
6月前
|
存储 人工智能 分布式计算
|

阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台

在2025年云栖大会,阿里云发布DLF 3.0,升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理,实现秒级实时处理、智能存储优化与细粒度安全控制,助力企业高效构建Data+AI基础设施。

2096 3
|
11月前
|
数据采集 数据挖掘 API
|

跨境卖家必看:1688店铺订单列表,订单详情,订单物流接口详解

1688平台提供丰富的API接口,涵盖商品、订单、物流等核心业务场景。主要接口包括:**order.list**(查询订单列表)、**order.get**(获取订单详情)及**logistics.track**(查询物流信息),均支持GET请求方式,广泛应用于跨境寻源、数据采集、ERP系统等场景。

580 0

养龙虾不破产,OpenClaw 三种使用技巧,降低 Token 消耗

这是一份OpenClaw降本增效实战指南,聚焦三大核心:①斜杠命令(/compact、/reset、/new)秒级优化对话长度;②多Agent分工实现上下文隔离与故障可控;③memory-search机制以查代记,精准调用长期知识。三法协同,直击Token浪费与响应迟缓痛点。(239字)

117 0
|
14天前
|
消息中间件 编解码 JSON
|

如何同时使用多个Logstash进行不同的日志传输

项目需新增Logstash处理Spring Boot日志,但与现有实例共用默认data目录导致启动失败。错误提示“another instance using the configured data directory”。解决方法:为新实例指定独立data路径,支持命令行`--path.data`、配置文件或环境变量三种方式,确保目录存在且有写权限。

170 0
|
1月前
|
数据采集 JavaScript 前端开发
|

告别空壳HTML!Node.js + Playwright + 代理IP 优雅抓取动态网页实战

本文详解Node.js+Playwright抓取动态网页的实战方案:针对React/Vue等框架渲染的SPA页面,结合代理IP(支持动态/固定转发模式)突破采集限制,并提供BrowserContext级代理配置、IP有效性验证、健壮重试机制及常见报错(407/429/403)应对策略,助你构建高可用工业级爬虫。

305 0
|
2月前
|
API 数据库 数据安全/隐私保护
|

别再只会调大模型了:用 Python 搭一套自己的知识库问答系统(RAG 实战指南)

别再只会调大模型了:用 Python 搭一套自己的知识库问答系统(RAG 实战指南)

846 2
|
3月前
|
存储 分布式计算 数据建模
|

淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效

本文介绍阿里云 Serverless Spark + Paimon 在淘宝闪购大数据湖仓场景的应用。

577 2
|
4月前
|
存储 人工智能 关系型数据库
|

传统数据库与向量数据库:一个管“是什么”,一个管“像什么”

向量数据库是AI时代的语义检索引擎,将文本、图片等非结构化数据转化为“语义向量”,支持基于相似性的毫秒级搜索。它不替代MySQL等传统数据库,而是作为大模型的“海马体”,赋能RAG、智能问答与多模态应用,实现从“关键词匹配”到“理解含义”的跃迁。(239字)

873 7
|
4月前
|
存储 机器学习/深度学习 人工智能
|

文档切分实战:5种方法详解,打造高效RAG系统的第一步

本文深入解析RAG中至关重要的文档切分技术,系统介绍5种主流策略(句子、定长、重叠、递归、语义切分),结合代码示例与实战调优技巧,涵盖PDF/Markdown/代码等多格式处理,并提供质量评估与避坑指南,助你打造高精度、高效率的私有知识库。

846 7
|
4月前
|
编解码 并行计算 物联网
|

【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术,解决下载慢、授权难、显存溢出等问题,实现稳定推理。

778 1
|
5月前
|
关系型数据库 应用服务中间件 nginx
|

容器引擎Docker

Docker是一种轻量级容器化技术,通过镜像打包应用及依赖,实现跨环境一致部署。它利用容器隔离运行,解决开发、测试、生产环境差异问题,相比虚拟机更高效便捷,提升交付效率与系统资源利用率。

455 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:十二、给词语绘制地图:Embedding如何构建机器的认知空间

Embedding是一种将词语、图像等信息转化为低维稠密向量的技术,使计算机能捕捉语义关系。不同于传统One-Hot编码,Embedding通过空间距离表达语义相似性,如“国王-男人+女人≈王后”,广泛应用于NLP、推荐系统与大模型中,是AI理解世界的基石。

1262 13

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69520
内容
128
活动
439953
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务