|
6月前
|
存储 编解码 Prometheus
|

大模型推理加速实战:vLLM 部署 Llama3 的量化与批处理优化指南

本文详解如何通过量化与批处理优化,在vLLM中高效部署Llama3大模型。涵盖内存管理、推理加速及混合策略,提升吞吐量并降低延迟,适用于大规模语言模型部署实践。

1571 2
|
7月前
|
自动驾驶 5G 网络性能优化
|

5G标准化背后的江湖:技术规范如何塑造未来通信

5G标准化背后的江湖:技术规范如何塑造未来通信

436 19
|
8月前
|
数据采集 机器学习/深度学习 人工智能
|

面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布

2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。

1161 13
|
9月前
|
存储 机器学习/深度学习 数据挖掘
|

数据湖 vs 数据仓库:你家到底该买冰箱还是建个地下室?

数据湖 vs 数据仓库:你家到底该买冰箱还是建个地下室?

1242 17
|
9月前
|
数据采集 Web App开发 API
|

B站高清视频爬取:Python爬虫技术详解

B站高清视频爬取:Python爬虫技术详解

2164 2
|
9月前
|
存储 分布式计算 负载均衡
|

数据分布式存储:在海量数据面前,我们如何站稳脚跟?

数据分布式存储:在海量数据面前,我们如何站稳脚跟?

1309 1
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

很火的DeepSeek到底是什么

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年。因推出开源 AI 模型 DeepSeek-R1 而引起了广泛关注。与ChatGPT相比,大幅降低了推理模型的成本。

3757 36
|
11月前
|
机器学习/深度学习 人工智能 算法
|

AI在体育分析与预测中的深度应用:变革体育界的智能力量

AI在体育分析与预测中的深度应用:变革体育界的智能力量

1080 31
|
27天前
|
SQL 人工智能 自然语言处理
|

企业级 AI 数据分析“专家”——Data Agent 推动数据分析民主化

Data Agent(数据智能体)正从辅助工具向企业核心数据分析中枢演进,推动“人人都是分析师”的愿景落地。

240 0
|
29天前
|
人工智能 安全 算法
|

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

312 15
|
1月前
|
人工智能 Cloud Native 数据可视化
|

PyCharm 2025.1 完整教程:下载安装 + 中文设置 + 激活,一步到位,附安装包

PyCharm 2025.1 发布,重磅升级AI代码补全、类型推断与ruff集成,提升开发效率。支持渐进式补全、智能提交信息生成、冲突可视化解决,优化启动速度与内存占用,全面增强云原生及现代Python开发体验。

544 5
|
1月前
|
人工智能 自然语言处理 机器人
|

中小企业也能玩转大模型:把AI搬到自己机房里不是梦

中小企业也能玩转大模型:把AI搬到自己机房里不是梦

360 3
|
3月前
|
数据采集 存储 人工智能
|

拆解AI-Agentforce企业级智能体中台:如何让企业AI落地从“噱头”到“实效”

在GDMS峰会上,迈富时集团尹思源指出41.3%中国企业尚未布局AI Agent,已应用者亦陷“Demo化、孤岛化”困局。其发布的AI-Agentforce智能体中台,以“冰山模型”重构架构,打通认知、价值、能力三重鸿沟,覆盖内容、获客、销售、陪练、分析五大场景,助力企业实现AI从“工具”到“数字员工”的全链路协同升级。

403 3
|
4月前
|
人工智能 分布式计算 自然语言处理
|

多智能体系统设计:5种编排模式解决复杂AI任务

本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。

766 10
|
5月前
|
存储 算法 安全
|

JAVA 八股文全网最详尽整理包含各类核心考点助你高效学习 jAVA 八股文赶紧收藏

本文整理了Java核心技术内容,涵盖Java基础、多线程、JVM、集合框架等八股文知识点,包含面向对象特性、线程创建与通信、运行时数据区、垃圾回收算法及常用集合类对比,附有代码示例与学习资料下载链接,适合Java开发者系统学习与面试准备。

1207 0
|
7月前
|
机器学习/深度学习 人工智能 算法
|

大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析

该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。

567 13
|
9月前
|
并行计算 PyTorch 算法框架/工具
|

融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。

791 3
|
10月前
|
JSON API 数据格式
|

携程网获取景点列表 API 接口(携程 API 系列)

携程作为国内知名的在线旅游服务提供商,其景点列表API对接口功能、参数和返回格式进行了详细定义。该接口可获取景点基本信息(名称、地区、开放时间等),支持条件筛选查询(如按地区、评分、价格区间等)。接口返回JSON或XML格式数据,并设有调用限制以确保系统稳定性和数据安全。虽然携程未公开免费API,开发者可通过商务合作申请权限。以下为模拟Python请求示例,展示了如何使用该接口获取景点信息。 代码示例中,通过`requests.get()`发送GET请求,设置请求参数(如地区、门票价格等)和请求头(模拟浏览器访问),并处理响应数据。实际应用需替换为真实的接口URL,并遵循携程官方文档要求。

1968 0
|
10月前
|
安全 区块链 数据安全/隐私保护
|

区块链技术在跨境支付中的应用:打破传统,畅行全球支付新时代

区块链技术在跨境支付中的应用:打破传统,畅行全球支付新时代

1443 12
|
11月前
|
数据采集 JSON 数据格式
|

Python爬虫:京东商品评论内容

京东商品评论接口为商家和消费者提供了重要工具。商家可分析评论优化产品,消费者则依赖评论做出购买决策。该接口通过HTTP请求获取评论内容、时间、点赞数等数据,支持分页和筛选好评、中评、差评。Python示例代码展示了如何调用接口并处理返回的JSON数据。应用场景包括产品优化、消费者决策辅助、市场竞争分析及舆情监测。

844 5
|
11月前
|
存储 SQL 数据挖掘
|

深入理解 Flink 中的 State

Flink 的 State(状态)是其四大核心之一,为流处理和批处理任务提供强大支持。本文深入探讨 Flink 中的状态管理,涵盖 State 在 HDFS 中的存储格式、存在形式(如 ValueState、ListState 等)、使用方法、过期时间 TTL 和清除策略,并介绍 Table API 和 SQL 模块中的状态管理。通过实际案例,帮助读者理解如何在电商订单处理、实时日志统计等场景中有效利用状态管理功能。

1092 16
来自: 实时计算 Flink  版块
|
12月前
|
人工智能 自然语言处理 搜索推荐
|

智能语音助手的发展与未来:开启人机交互的新篇章

智能语音助手的发展与未来:开启人机交互的新篇章

1879 28
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

355 9
|
3月前
|
存储 机器学习/深度学习 人工智能
|

RAG系统嵌入模型怎么选?选型策略和踩坑指南

嵌入是RAG系统的核心,直接影响检索质量。本文详解嵌入原理,解析稠密/稀疏、长上下文、多向量等类型,梳理选型关键:领域匹配、上下文长度、维度与成本,并结合MTEB基准给出实用建议,助你为业务挑选高效稳健的嵌入方案。

514 2
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

基于PAI-ChatLearn的GSPO强化学习实践

近期,阿里通义千问团队创新性提出了GSPO算法,GSPO 算法与其他 RL 算法相比,定义了序列级别的重要性比率,并在序列层面执行裁剪、奖励和优化。同时具有强大高效、稳定性出色、基础设施友好的突出优势。

567 3
来自: 人工智能平台PAI  版块
|
5月前
|
人工智能 数据可视化 Java
|

性能提升 10 倍, DIFY 模式迁移至 Spring AI Alibaba 模式 零改造实现

将 Dify 应用迁移至 Spring AI Alibaba,可兼顾可视化开发效率与代码工程灵活性,显著提升系统性能与扩展能力,适用于复杂 AI 业务场景。

805 0
|
6月前
|
存储 自然语言处理 算法
|

RAG系统文本分块优化指南:9种实用策略让检索精度翻倍

本文深入探讨了RAG系统中的九种文本分块策略。固定大小分块简单高效,但可能破坏语义完整性;基于句子和语义的分块保留上下文,适合语义任务;递归与滑动窗口分块灵活控制大小;层次化和主题分块适用于结构化内容;特定模态分块处理多媒体文档;智能代理分块则通过大语言模型实现动态优化。开发者需根据文档类型、需求及资源选择合适策略,以提升RAG系统的性能和用户体验。作者Cornellius Yudha Wijaya详细分析了各策略的技术特点与应用场景。

1199 1
|
7月前
|
机器学习/深度学习 数据可视化 大数据
|

基于马尔可夫链的状态转换,用概率模型预测股市走势

本文探讨了马尔可夫链在股市分析中的应用,通过定义市场状态和构建转移矩阵,揭示短期波动与长期趋势的概率特征。模型基于“无记忆性”假设,量化状态转换概率,帮助评估风险、识别模式并制定策略。例如,计算稳态分布可预测市场长期平衡态。尽管模型简化了复杂动态,但仍为投资决策提供了数据支持。同时,文章强调其局限性,如外部冲击影响和状态定义主观性,建议结合其他工具综合分析。未来可探索与机器学习融合,提升市场理解深度。

577 7
|
8月前
|
存储 SQL 监控
|

ClickHouse 应用剖析:设计理念、机制与实践

ClickHouse 是一款高性能的列式数据库管理系统,主要用于实时的大数据分析场景。它由俄罗斯 Yandex 公司开源于 2016 年,在网页日志分析、物联网监控、广告计费等领域有广泛应用。ClickHouse 通过列式存储、向量化执行和分布式架构,实现对海量数据的快速查询分析。本文将介绍 ClickHouse 的设计理念,以及在实际使用中如何处理数据删除更新、冷热数据分离等问题,并提供常见配置的调优建议和异常问题的处理方法。

1031 14
|
8月前
|
存储 人工智能 监控
|

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。

759 4
|
9月前
|
数据采集 XML JavaScript
|

Python爬虫:从人民网提取视频链接的完整指南

Python爬虫:从人民网提取视频链接的完整指南

1368 2
|
12月前
|
算法 数据处理 Python
|

高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用

Savitzky-Golay滤波器是一种基于局部多项式回归的数字滤波器,广泛应用于信号处理领域。它通过线性最小二乘法拟合低阶多项式到滑动窗口中的数据点,在降噪的同时保持信号的关键特征,如峰值和谷值。本文介绍了该滤波器的原理、实现及应用,展示了其在Python中的具体实现,并分析了不同参数对滤波效果的影响。适合需要保持信号特征的应用场景。

1404 11
|
12月前
|
机器学习/深度学习 数据采集 运维
|

数据分布检验利器:通过Q-Q图进行可视化分布诊断、异常检测与预处理优化

Q-Q图(Quantile-Quantile Plot)是一种强大的可视化工具,用于验证数据是否符合特定分布(如正态分布)。通过比较数据和理论分布的分位数,Q-Q图能直观展示两者之间的差异,帮助选择合适的统计方法和机器学习模型。本文介绍了Q-Q图的工作原理、基础代码实现及其在数据预处理、模型验证和金融数据分析中的应用。

1497 11
|
1月前
|
存储 人工智能 自然语言处理
|

阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元

本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。

369 22
|
1月前
|
人工智能 Cloud Native IDE
|

超详细!JetBrains Rider 2025.1 安装到能用,激活 + 安装步骤—附安装包

JetBrains Rider 2025.1 是全能型跨平台全栈 IDE,深度集成 AI 编码助手,支持 .NET 9、Unity 2025、Blazor 等最新技术,覆盖 C#、Python、Go 等 20+ 语言,赋能游戏、云原生与微服务开发,实现 AI 辅助生成、调试、测试与文档一体化。

341 2
|
5月前
|
传感器 算法 安全
|

机器人路径规划和避障算法matlab仿真,分别对比贪婪搜索,最安全距离,RPM以及RRT四种算法

本程序基于MATLAB 2022A实现机器人路径规划与避障仿真,对比贪婪搜索、最安全距离、RPM和RRT四种算法。通过地图模拟环境,输出各算法的路径规划结果,展示其在避障性能与路径优化方面的差异。代码包含核心路径搜索逻辑,并附有测试运行图示,适用于机器人路径规划研究与教学演示。

614 64
|
7月前
|
存储 安全 Android开发
|

HarmonyOS实战:一招搞定保存图片到相册

本文介绍了在鸿蒙系统中实现保存图片到相册的功能,包括申请权限和使用系统安全控件两种方式。文中详细讲解了如何通过网络请求下载图片并保存为本地文件,以及如何将指定布局生成图片并保存。鸿蒙系统对权限管理较为严格,推荐使用系统提供的安全控件(如 SaveButton)以保护用户隐私,避免手动申请权限。此外,文章还对比了鸿蒙与 Android/iOS 的实现差异,指出鸿蒙在功能实现上更简单,但需注意权限规范以确保项目顺利上线。

1015 0
|
7月前
|
SQL 存储 NoSQL
|

Flink x Paimon 在抖音集团生活服务的落地实践

本文整理自抖音集团数据工程师陆魏与流式计算工程冯向宇在Flink Forward Asia 2024的分享,聚焦抖音生活服务业务中的实时数仓技术演变及Paimon湖仓实践。文章分为三部分:背景及现状、Paimon湖仓实践与技术优化。通过引入Paimon,解决了传统实时数仓开发效率低、资源浪费、稳定性差等问题,显著提升了开发运维效率、节省资源并增强了任务稳定性。同时,文中详细探讨了Paimon在维表实践、宽表建设、标签变更检测等场景的应用,并介绍了其核心技术优化与未来规划。

711 10
来自: 实时计算 Flink  版块
|
7月前
|
数据采集 安全 数据挖掘
|

Pandas数据合并:10种高效连接技巧与常见问题

在数据分析中,数据合并是常见且关键的步骤。本文针对合并来自多个来源的数据集时可能遇到的问题,如列丢失、重复记录等,提供系统解决方案。基于对超1000个复杂数据集的分析经验,总结了10种关键技术,涵盖Pandas库中`merge`和`join`函数的使用方法。内容包括基本合并、左连接、右连接、外连接、基于索引连接、多键合并、数据拼接、交叉连接、后缀管理和合并验证等场景。通过实际案例与技术原理解析,帮助用户高效准确地完成数据整合任务,提升数据分析效率。

685 13
|
9月前
|
数据采集 人工智能 分布式计算
|

MCP+Hologres+LLM搭建数据分析Agent

本文探讨了LLM大模型在数据分析领域的挑战,并介绍了Hologres结合MCP协议和LLM搭建数据分析Agent的解决方案。传统LLM存在实时数据接入能力不足、上下文记忆短等问题,而Hologres通过高性能数据分析能力和湖仓一体支持,解决了这些痛点。MCP协议标准化了LLM与外部系统的连接,提升集成效率。文中详细描述了如何配置Hologres MCP Server与Claude Desktop集成,并通过TPC-H样例数据展示了分析流程和效果。最后总结指出,该方案显著提高了复杂分析任务的实时性和准确性,为智能决策提供支持。

1432 3
来自: 实时数仓 Hologres  版块
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI如何预测体育比赛结果

AI预测体育比赛结果依赖于历史数据、球员表现、球队状态等多因素。通过数据收集与处理、机器学习模型(如回归分析、神经网络)、模拟与蒙特卡洛方法、实时数据分析及自然语言处理等技术,AI能识别影响比赛的关键模式,评估胜负概率,并结合统计学与优化算法不断调整预测,提升准确性。

993 1
|
10月前
|
机器学习/深度学习 人工智能
|

Diffusion-DPO:一种基于直接偏好优化的扩散模型对齐新方法

本文介绍了一种名为 Diffusion-DPO 的创新方法,该方法基于直接偏好优化(DPO)原理,简化了扩散模型与人类偏好的对齐过程。相比传统的基于人类反馈的强化学习(RLHF)方法,Diffusion-DPO 避免了显式奖励模型的训练,通过数学近似简化实现流程,并在处理开放词汇表场景时展现出更强的能力。实验结果表明,该方法在 Stable Diffusion 1.5 和 SDXL-1.0 等主流模型上显著提升了生成图像的质量和可控性,为未来扩散模型的发展提供了新的思路。

815 14
|
10月前
|
人工智能 自然语言处理 监控
|

大语言模型的解码策略与关键优化总结

本文系统性地阐述了大型语言模型(LLMs)中的解码策略技术原理及其应用。通过深入分析贪婪解码、束搜索、采样技术等核心方法,以及温度参数、惩罚机制等优化手段,为研究者和工程师提供了全面的技术参考。文章详细探讨了不同解码算法的工作机制、性能特征和优化方法,强调了解码策略在生成高质量、连贯且多样化文本中的关键作用。实例展示了各类解码策略的应用效果,帮助读者理解其优缺点及适用场景。

1046 20
|
27天前
|
人工智能 分布式计算 运维
|

阿里云携手 MiniMax 构建云原生数仓最佳实践:大模型时代的 Data + AI 数据处理平台

MiniMax 是全球领先的通用人工智能公司,致力于推动AGI发展。依托自研多模态大模型,服务超200国1.57亿用户及5万企业客户。携手阿里云构建云原生数仓与Data+AI平台,实现数据高效处理、成本大幅降低,支撑全球业务高速迭代与AI创新落地。

183 9
|
1月前
|
人工智能 自然语言处理 数据可视化
|

2025 ChatBI 产品选型推荐:智能问数+归因分析+报告生成

当企业站在 ChatBI 选型的十字路口,技术架构的先进性、场景适配的完整性、落地实践的可验证性应成为核心考量标准。

307 0
|
4月前
|
数据采集 监控 数据可视化
|

数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研

本案例讲述了在豆瓣电影数据采集过程中,面对数据量激增和限制机制带来的挑战,如何通过引入爬虫代理、分布式架构与异步IO等技术手段,实现采集系统的优化与扩展,最终支撑起百万级请求的稳定抓取。

226 0
|
5月前
|
人工智能 数据可视化 开发工具
|

开发效率提升5倍!聚AI的LangFlow可视化全栈指南

LangFlow 是一个强大的可视化流程开发工具,支持全平台部署与多模型集成。通过 Docker 快速启动、本地开发或云服务部署,用户可灵活配置环境。其核心功能包括四大对象管理、可视化编程、自定义组件开发及与 LangChain 的深度整合,适用于客户服务、金融、医疗等多领域自动化流程构建。结合性能优化与版本管理,助力开发者高效实现企业级 AI 应用。

657 4
|
7月前
|
自然语言处理 前端开发 API
|

10个常用的无头CMS(Headless CMS)

无头CMS是一种内容管理系统,它将前端和后端分离,只关注内容的创建和管理,而不处理呈现内容的前端界面。传统的CMS通常将内容管理和展示耦合在一起,即内容的创建、编辑和展示都依赖于特定的前端界面和模板。而无头CMS则将内容与前端逻辑完全解耦,提供了一种更加灵活的方式来处理内容。

1373 3
|
8月前
|
数据采集 存储 Web App开发
|

如何避免爬虫因Cookie过期导致登录失效

如何避免爬虫因Cookie过期导致登录失效

757 7
|
8月前
|
机器学习/深度学习 数据可视化 机器人
|

比扩散策略更高效的生成模型:流匹配的理论基础与Pytorch代码实现

扩散模型和流匹配是生成高分辨率数据(如图像和机器人轨迹)的先进技术。扩散模型通过逐步去噪生成数据,其代表应用Stable Diffusion已扩展至机器人学领域形成“扩散策略”。流匹配作为更通用的方法,通过学习时间依赖的速度场将噪声转化为目标分布,适用于图像生成和机器人轨迹生成,且通常以较少资源实现更快生成。 本文深入解析流匹配在图像生成中的应用,核心思想是将图像视为随机变量的实现,并通过速度场将源分布转换为目标分布。文中提供了一维模型训练实例,展示了如何用神经网络学习速度场,以及使用最大均值差异(MMD)改进训练效果。与扩散模型相比,流匹配结构简单,资源需求低,适合多模态分布生成。

650 13

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67668
内容
128
活动
439482
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务