|
8月前
|
人工智能 自然语言处理 算法
|

AI时代如何让大模型「读懂」企业数据?——从“单一问数”到“复杂决策”的智能跃迁

从早期的传统BI,到敏捷BI,再到智能BI,BI工具正逐步进化为具备类人推理能力的数字助手。Gartner预测,到2025年,增强型消费者体验将首次推动增强型BI(ABI)能力的采用率超过50%,这将深刻重塑企业的业务流程与决策模式,“人人都是数据消费者”的时代正加速到来。

1148 1
|
8月前
|
监控 测试技术 Android开发
|

App Trace技术解析:传参安装、一键拉起与快速安装

本文从开发者视角解析App Trace技术的关键功能与实现方法,涵盖传参安装、一键拉起和快速安装技术。详细介绍了Android和iOS平台的具体实现代码与配置要点,探讨了参数丢失、跨平台一致性及iOS限制等技术挑战的解决方案,并提供了测试策略、监控指标和性能优化的最佳实践建议,帮助开发者提升用户获取效率与体验。

273 45
|
9月前
|
人工智能 开发框架 自然语言处理
|

企业级AI搜索解决方案:阿里云AI搜索开放平台

本文介绍了 阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务,兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

755 0
来自: 智能搜索推荐  版块
|
9月前
|
数据采集 Web App开发 JavaScript
|

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

676 68
|
11月前
|
流计算 搜索推荐 人工智能
|

如何用实时数据同步打破企业数据孤岛?

3929 88
来自:实时计算 Flink 版块
|
12月前
|
JSON 人工智能 API
|

云上玩转DeepSeek系列之四:DeepSeek R1 蒸馏和微调训练最佳实践

本文将为您带来“DeepSeek R1+Qwen 大模型蒸馏和微调训练”最佳实践。阿里云 PAI 平台提供了围绕 DeepSeek 模型的最佳实践,涵盖快速部署、应用搭建、蒸馏和微调等环节,帮助开发者高效利用计算资源,使用 Model Gallery 功能,轻松完成部署与微调任务。

1187 8
来自: 人工智能平台PAI  版块
|
23天前
|
存储 人工智能 分布式计算
|

阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)

185 1
|
1月前
|
机器学习/深度学习 人工智能 算法
|

构建AI智能体:八十四、大模型涌现能力的解构分析:从量变到质变的神秘跃迁

大模型涌现能力的出现标志着人工智能发展的一个重要转折点。这些能力不是通过专门编程获得的,而是模型规模达到临界点时自然产生的质变。这种现象不仅证明了规模在人工智能发展中的关键作用,也为我们理解智能的本质提供了新的视角。涌现能力的出现预示着人工智能正从专门化工具向通用智能系统转变。随着模型规模的继续扩大和架构的不断优化,我们可能会看到更多令人惊讶的能力涌现。

237 7
|
2月前
|
消息中间件 SQL API
|

今日练习

本课程作业旨在掌握Docker部署RabbitMQ、消息队列在医嘱系统中的应用,以及对接第三方短信API。通过实战完成消息发送与消费,并接入真实短信服务,提升中间件与外部接口集成能力。(238字)

201 1
|
2月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者是跨模型、标准化的通信协议,实现多工具动态集成;后者是模型调用外部函数的内置机制。MCP如同“蓝牙协议”,支持多设备互联互通,具备高兼容性与扩展性;Function Call则像“语音助手”,依赖特定模型完成具体任务。二者在功能上互补:MCP构建通用接口层,解耦模型与工具;Function Call负责意图解析与指令生成。

119 0
|
2月前
|
存储 人工智能 Java
|

面试回答示例篇

本文系统介绍了AI开发核心技术:SpringAI、LangChain4J与LangChain框架对比,智能体设计原理,RAG增强生成、Tool Calling工具调用、MCP协议、向量知识库等关键技术,并结合实际项目讲解AI集成、模型选型、私有化部署、流式输出、上下文管理及大模型幻觉解决方案,涵盖从架构设计到落地优化的完整实践路径。(239字)

184 0
|
2月前
|
SQL 分布式计算 算法
|

别再一把梭哈了:聊聊文件格式里的压缩取舍——Snappy 和 Zstd 到底怎么选?

别再一把梭哈了:聊聊文件格式里的压缩取舍——Snappy 和 Zstd 到底怎么选?

225 4
|
2月前
|
Prometheus 运维 监控
|

别再裸奔搞监控了!一篇带你上手 Prometheus+Grafana 的实战指南

别再裸奔搞监控了!一篇带你上手 Prometheus+Grafana 的实战指南

512 2
|
2月前
|
C++
|

报错解决:Selenium报错“Message: session not created: probably user data directory is already in use” 等

本文详解Selenium操作Edge浏览器时常见的“版本不匹配”和“进程冲突”问题,分析报错根源,并提供手动替换驱动与webdriver-manager自动管理两种解决方案,助你高效稳定实现浏览器自动化。

359 6
|
3月前
|
机器学习/深度学习 数据可视化 算法
|

Python | 网格搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost回归预测,结合网格搜索调参与SHAP可解释性分析,涵盖数据处理、模型训练、可视化及结果保存,助力科研论文提升模型可解释性,附完整代码与保姆级环境配置指南。

511 1
|
3月前
|
人工智能 架构师 开发者
|

破局2025:定义AI数字艺术新生态的十大关键人物

当AI艺术迈入生态竞争时代,十位创作者正重塑未来。他们超越技术炫技,以生态构建、商业创新与跨界影响力开辟新疆域。从乾元AIGC的多维赋能,到林响的数字乡建,再到织梦人的互动叙事,他们定义规则,连接技术与人文,成为AI艺术时代的建筑师与引路人。

403 12
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:十二、给词语绘制地图:Embedding如何构建机器的认知空间

Embedding是一种将词语、图像等信息转化为低维稠密向量的技术,使计算机能捕捉语义关系。不同于传统One-Hot编码,Embedding通过空间距离表达语义相似性,如“国王-男人+女人≈王后”,广泛应用于NLP、推荐系统与大模型中,是AI理解世界的基石。

724 13
|
9月前
|
机器学习/深度学习 数据可视化 大数据
|

基于马尔可夫链的状态转换,用概率模型预测股市走势

本文探讨了马尔可夫链在股市分析中的应用,通过定义市场状态和构建转移矩阵,揭示短期波动与长期趋势的概率特征。模型基于“无记忆性”假设,量化状态转换概率,帮助评估风险、识别模式并制定策略。例如,计算稳态分布可预测市场长期平衡态。尽管模型简化了复杂动态,但仍为投资决策提供了数据支持。同时,文章强调其局限性,如外部冲击影响和状态定义主观性,建议结合其他工具综合分析。未来可探索与机器学习融合,提升市场理解深度。

840 7
|
11月前
|
人工智能 边缘计算 算法
|

DistilQwen2.5-R1发布:知识蒸馏助推小模型深度思考

DistilQwen2.5-R1通过知识蒸馏技术,将大规模深度推理模型的知识迁移到小模型中,显著提升了小模型的推理能力。实验结果表明,DistilQwen2.5-R1在数学、代码和科学问题等多个基准测试中表现优异,尤其在7B参数量级上超越了其他开源蒸馏模型。 本文将深入阐述 DistilQwen2.5-R1 的蒸馏算法、性能评估,并且提供在阿里云人工智能平台 PAI 上的使用指南及相关下载教程。

1644 64
来自: 人工智能平台PAI  版块
|
11月前
|
存储 人工智能 自然语言处理
|

方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

900 2
|
11月前
|
机器学习/深度学习 算法
|

广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术

广义优势估计(GAE)由Schulman等人于2016年提出,是近端策略优化(PPO)算法的核心理论基础。它通过平衡偏差与方差,解决了强化学习中的信用分配问题,即如何准确判定历史动作对延迟奖励的贡献。GAE基于资格迹和TD-λ思想,采用n步优势的指数加权平均方法,将优势函数有效集成到损失函数中,为策略优化提供稳定梯度信号。相比TD-λ,GAE更适用于现代策略梯度方法,推动了高效强化学习算法的发展。

1875 3
|
11月前
|
算法
|

重磅!2025年中科院预警期刊名单正式发布!

中国科学院文献情报中心发布的《国际期刊预警名单》旨在防范学术不端与不当出版行为,保护科研生态良性发展。2025年版本聚焦两大问题:学术不端(如引用操纵、论文工厂)和不利于中国学术成果国际化传播的行为(如中国作者占比过高或APC费用不合理)。预警名单动态调整,发布时点从年底改为年初,便于科研人员及时调整投稿策略。被列入预警名单的期刊可能影响职称评审及科研经费认可,建议优先选择中科院分区表推荐期刊,警惕“快速代发”陷阱,并关注期刊官网声明。未来科研生态将更注重规范化与原创性,推动高质量学术发表。维护健康的学术环境对提升中国科研全球影响力至关重要。

1736 0
|
12月前
|
存储 弹性计算 运维
|

海量日志接入 Elasticsearch Serverless 应用降本70%以上

本文将探讨在日志场景下,使用阿里云Elasticsearch Serverless相较于基于ECS自建Elasticsearch集群的成本与性能优势,展示如何通过Serverless架构实现高达 70%以上的成本节约。

652 0
|
16天前
|
人工智能 供应链
|

智能体来了:2026,AI 元年开启的新赛道

2026年,AI从“能说会写”的模型跃升为“能想会做”的智能体:目标驱动、自主规划、调用工具、持续修正。它不再仅是工具,更成为现实世界的参与者。人类由此面临根本命题——重定义“参与者”,重构角色、责任与文明边界。(239字)

127 4
|
21天前
|
SQL 机器学习/深度学习 运维
|

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

131 13
|
23天前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

117 3
|
30天前
|
人工智能 监控 数据可视化
|

给大模型“开小灶”:零代码实战专属领域微调,手把手教你打造AI专家

本文介绍如何通过“模型微调”将通用大模型打造成特定领域的专家助手,聚焦Web安全场景,借助LLaMA Factory实现零代码、可视化微调。涵盖微调原理(如LoRA、量化)、全流程操作及效果评估,帮助用户低成本构建专属高性能AI模型。

193 0
|
1月前
|
人工智能 自然语言处理 安全
|

2026数字人公司TOP企业排行

随着AI、图形学等技术进步,数字人产业快速发展。2025年我国相关企业超1200家,规模突破300亿元。阿里、华为、腾讯、世优科技等企业在电商、通信、社交、AI交互等领域领先,推动数字人在金融、政务、教育等场景落地。技术趋同下,全栈能力与行业理解成竞争关键。

417 1
来自: 人工智能平台PAI  版块
|
1月前
|
消息中间件 存储 人工智能
|

风控不是算账,是“盯人”——聊聊 CEP 在风控与监控里的那些真本事

风控不是算账,是“盯人”——聊聊 CEP 在风控与监控里的那些真本事

194 1
|
1月前
|
Oracle Java 关系型数据库
|

Java命名规范

Java命名规范涵盖包、类、方法、变量等命名规则。包名全小写,类名首字母大写采用驼峰法,接口常用形容词,抽象类以Abstract/Base开头,异常类以Exception结尾,方法名小写驼峰,常量全大写用下划线分隔,枚举值按常量规范命名,提升代码可读性与一致性。

265 0
|
2月前
|
存储 安全 编译器
|

C++数据类型:

C++基本数据类型包括bool、char、int、float、double等,支持signed、unsigned、short、long修饰。wchar_t用于宽字符,typedef可为类型定义别名,enum定义枚举常量。支持static_cast、dynamic_cast、const_cast和reinterpret_cast四种类型转换,实现安全或强制类型变换。

104 1
|
2月前
|
安全 Cloud Native Serverless
|

2025数字员工技术选型白皮书:阿里云/亚马逊等5款产品云原生能力实测

本文深度评测阿里云、亚马逊、科大讯飞、玄晶引擎、安恒五款数字员工,围绕架构兼容性、开发友好度、性能稳定性三大维度,结合实测数据与企业案例,为开发者提供选型指南与避坑建议。

373 5
来自: 人工智能平台PAI  版块
|
3月前
|
人工智能 Serverless 开发者
|

参与 Elasticsearch Serverless AI 实践挑战 赢好礼!

参与ES Serverless AI应用实践挑战!活动期间部署应用并完成体验或创客赛道任务,即有机会赢取阿里云×Elasticsearch联名限量套装。

155 1
|
5月前
|
搜索推荐 算法 JavaScript
|

基于springboot的健康饮食营养管理系统

本系统基于Spring Boot、Vue与MySQL技术,融合大数据与AI算法,构建个性化健康饮食管理平台。结合用户身体状况、目标需求,智能推荐营养方案,助力科学饮食与健康管理。

486 2
|
5月前
|
存储 人工智能 NoSQL
|

用Context Offloading解决AI Agent上下文污染,提升推理准确性

上下文工程是将AI所需信息(如指令、数据、工具等)动态整合到模型输入中,以提升其表现。本文探讨了“上下文污染”问题,并提出“上下文卸载”策略,通过LangGraph实现,有效缓解长文本处理中的信息干扰与模型幻觉,提升AI代理的决策准确性与稳定性。

657 2
|
5月前
|
算法 API 数据安全/隐私保护
|

深度解析京东图片搜索API:从图像识别到商品匹配的算法实践

京东图片搜索API基于图像识别技术,支持通过上传图片或图片URL搜索相似商品,提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言,提供详细请求示例与文档。

628 5
|
6月前
|
机器学习/深度学习 API 异构计算
|

JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。

591 0
|
6月前
|
前端开发 JavaScript API
|

深度剖析epub reader for mac:原理、兼容性与工程实现全解读

数字内容正重塑阅读方式,而EPUB作为开放电子书标准,在Mac平台的体验却参差不齐。本文从工程师视角解析EPUB文件结构、渲染机制与跨平台兼容难题,探讨为何同一EPUB文件在不同阅读器中呈现效果迥异,涉及字体、排版、目录、多媒体支持等技术细节,并结合用户反馈与开发实践,揭示提升EPUB阅读体验的关键路径。

442 0
|
7月前
|
存储 人工智能 机器人
|

让大语言模型在不知道答案时拒绝回答:KnowOrNot框架防止AI幻觉

在政府AI服务中,如何让系统在知识不足时恰当拒绝回答而非生成错误信息是一大挑战。KnowOrNot框架通过构建“知识库外”测试场景,评估AI是否能识别知识边界并合理拒答,从而提升AI服务的可靠性与安全性。

503 0
|
8月前
|
机器学习/深度学习 数据采集 分布式计算
|

阿里云PAI AutoML实战:20分钟构建高精度电商销量预测模型

本文介绍了如何利用阿里云 PAI AutoML 平台,在20分钟内构建高精度的电商销量预测模型。内容涵盖项目背景、数据准备与预处理、模型训练与优化、部署应用及常见问题解决方案,助力企业实现数据驱动的精细化运营,提升市场竞争力。

1361 0
|
9月前
|
机器学习/深度学习 数据采集 人工智能
|

孰优孰劣?监督与非监督学习大对决

幽默风趣地解析监督学习与非监督学习的区别与应用场景,通过生动比喻和直观图表,帮你在轻松阅读中找到AI学习的最佳路径,轻松掌握机器学习的核心概念。

604 10
|
9月前
|
人工智能 自然语言处理 算法
|

大模型备案需要通过算法备案才能进行吗?

本内容详细介绍了算法备案与大模型备案的流程、审核重点及两者关系。算法备案覆盖生成合成类等5类算法,需提交安全自评估报告,审核周期约2个月;大模型备案针对境内公众服务的大模型,涉及多维度审查,周期3-6个月。两者存在前置条件关系,完成算法备案是大模型备案的基础。阿里云提供全流程工具支持,包括合规预评估、材料校验和进度追踪,助力企业高效备案。此外,文档解答了常见问题,如算法迭代是否需重新备案,并解析政策红利与技术支持,帮助企业降低合规成本、享受补贴奖励。适用于需了解备案流程和技术支持的企业和个人开发者。

1474 4
|
9月前
|
机器学习/深度学习 数据采集 算法
|

智能限速算法:基于强化学习的动态请求间隔控制

本文分享了通过强化学习解决抖音爬虫限速问题的技术实践。针对固定速率请求易被封禁的问题,引入基于DQN的动态请求间隔控制算法,智能调整请求间隔以平衡效率与稳定性。文中详细描述了真实经历、问题分析、技术突破及代码实现,包括代理配置、状态设计与奖励机制,并反思成长,提出未来优化方向。此方法具通用性,适用于多种动态节奏控制场景。

367 6
|
9月前
|
人工智能 自然语言处理 数据库
|

云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

877 5
来自: 人工智能平台PAI  版块
|
10月前
|
数据采集 人工智能 大数据
|

演讲实录:中小企业如何快速构建AI应用?

AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。

757 3
来自: 人工智能平台PAI  版块
|
11月前
|
并行计算 PyTorch 算法框架/工具
|

融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。

1020 3
|
12月前
|
SQL 数据可视化 atlas
|

低空经济新基建!DataV Atlas 如何用大模型玩转空间数据?

阿里云DataV Atlas推出搭载通义千问最新2.5 Max大模型「时空SQL智能小助手」,通过自然语言生成专业SQL,简化空间数据分析流程,助力智慧农田、城市低空交通及应急调度等领域,推动精准决策和智能化管理。零门槛体验空间智能分析革命,开启“会思考的天空网络”新时代。

847 5
来自: 数据可视化DataV  版块
|
12月前
|
数据采集 JSON API
|

小红书笔记详情 API 接口(小红书 API 系列)

小红书作为热门生活方式平台,拥有海量用户生成内容。通过其笔记详情接口,开发者可获取指定笔记的完整内容、作者信息及互动数据(点赞、评论、收藏数等),助力内容分析与市场调研。接口采用HTTP GET请求,需提供笔记ID,响应数据为JSON格式。注意小红书有严格反爬虫机制,建议使用代理IP并控制请求频率。

2229 3
|
12月前
|
机器学习/深度学习 自然语言处理 算法
|

Transformer 学习笔记 | Decoder

本文记录了笔者学习Transformer的过程,重点介绍了填充(padding)和掩码(masking)机制。掩码确保解码器只依赖于之前的位置,避免信息泄露,保持因果关系及训练与推理的一致性。通过线性层和softmax函数生成输出概率,并使用梯度下降和反向传播进行训练。评估指标包括BLEU、ROUGE、METEOR和困惑度等。欢迎指正。

1134 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务