|
机器学习/深度学习 存储 缓存
|

LLM高效推理:KV缓存与分页注意力机制深度解析

随着大型语言模型(LLM)规模和复杂性的增长,高效推理变得至关重要。KV缓存和分页注意力是优化LLM推理的两项关键技术。KV缓存通过存储键值对减少重复计算,而分页注意力则通过将序列分割成小块来降低内存消耗,从而有效处理长序列。本文深入剖析这些技术的工作原理及其在仅解码器模型中的应用,探讨其优势与挑战,并展示其实现示例。

929 16
|
数据采集 Web App开发 存储
|

打造高效的Web Scraper:Python与Selenium的完美结合

本文介绍如何使用Python结合Selenium,通过代理IP、设置Cookie和User-Agent抓取BOSS直聘的招聘信息,包括公司名称、岗位、要求和薪资。这些数据可用于行业趋势、人才需求、企业动态及区域经济分析,为求职者、企业和分析师提供宝贵信息。文中详细说明了环境准备、代理配置、登录操作及数据抓取步骤,并提醒注意反爬虫机制和验证码处理等问题。

456 1
|
存储 供应链 数据库
|

Hologres 索引:概念与实用场景

本文介绍了 Hologres 索引的概念、类型及在实际场景中的应用。Hologres 是阿里云的一款强大数据库产品,其索引功能显著提升了数据查询性能。文章详细探讨了 B 树索引、哈希索引和位图索引的特点及应用场景,并介绍了索引的创建和维护方法。此外,还列举了 Hologres 中的重要参数设置及其使用限制,最后通过电商、金融、物流和社交媒体等领域的具体案例,展示了索引在不同场景下的实用价值。

594 10
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 人工智能 PyTorch
|

使用Pytorch构建视觉语言模型(VLM)

视觉语言模型(Vision Language Model,VLM)正在改变计算机对视觉和文本信息的理解与交互方式。本文将介绍 VLM 的核心组件和实现细节,可以让你全面掌握这项前沿技术。我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。

523 2
|
机器学习/深度学习 算法 计算机视觉
|

边缘检测评估方法:FOM、RMSE、PSNR和SSIM对比实验和理论研究

本文探讨了图像分割与边缘检测之间的关系,并通过实验评估了多种边缘检测指标的有效性。研究发现,常用的RMSE、PSNR和SSIM指标在海岸线检测任务中可能高估性能,而FOM(优点图)指标则能更准确地选择最佳边缘检测参数。实验结果表明,FOM在92.6%的情况下选择了更好的阈值,在66.3%的情况下选择了最佳阈值。此外,FOM通过考虑预测边缘与真实边缘之间的距离,提供了更合理的评估标准。本文不仅对海岸线检测有重要意义,还对医学图像分析、计算机视觉和遥感等多个领域具有广泛的应用价值。作者通过理论分析和实证研究,证明了FOM在边缘检测评估中的优越性。

899 3
|
机器学习/深度学习 缓存 PyTorch
|

异步数据加载技巧:实现 DataLoader 的最佳实践

【8月更文第29天】在深度学习中,数据加载是整个训练流程中的一个关键步骤。为了最大化硬件资源的利用率并提高训练效率,使用高效的数据加载策略变得尤为重要。本文将探讨如何通过异步加载和多线程/多进程技术来优化 DataLoader 的性能。

2624 1
|
机器学习/深度学习 边缘计算 PyTorch
|

PyTorch 与边缘计算:将深度学习模型部署到嵌入式设备

【8月更文第29天】随着物联网技术的发展,越来越多的数据处理任务开始在边缘设备上执行,以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架,它不仅支持高效的模型训练,还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上,并通过一个具体的示例来展示整个流程。

3923 1
|
机器学习/深度学习 人工智能 算法
|

AI入门必读:Java实现常见AI算法及实际应用,有两下子!

本文全面介绍了人工智能(AI)的基础知识、操作教程、算法实现及其在实际项目中的应用。首先,从AI的概念出发,解释了AI如何使机器具备学习、思考、决策和交流的能力,并列举了日常生活中的常见应用场景,如手机助手、推荐系统、自动驾驶等。接着,详细介绍了AI在提高效率、增强用户体验、促进技术创新和解决复杂问题等方面的显著作用,同时展望了AI的未来发展趋势,包括自我学习能力的提升、人机协作的增强、伦理法规的完善以及行业垂直化应用的拓展等...

2182 3
|
机器学习/深度学习 算法 数据挖掘
|

深度学习中常用损失函数介绍

选择正确的损失函数对于训练机器学习模型非常重要。不同的损失函数适用于不同类型的问题。本文将总结一些常见的损失函数,并附有易于理解的解释、用法和示例

1547 0
|
机器学习/深度学习 人工智能 自然语言处理
|

大语言模型的Scaling Law:如何随着模型大小、训练数据和计算资源的增加而扩展

在这篇文章中,我们将介绍使这些模型运作的秘密武器——一个由三个关键部分组成的法则:模型大小、训练数据和计算能力。通过理解这些因素如何相互作用和规模化,我们将获得关于人工智能语言模型过去、现在和未来的宝贵见解。

1987 7
|
数据采集 机器学习/深度学习 数据挖掘
|

基于Python实现时间序列分析建模(ARIMA模型)项目实战

基于Python实现时间序列分析建模(ARIMA模型)项目实战

1236 0
来自: 人工智能平台PAI  版块
|
Cloud Native Java API
|

Java一分钟之-Micronaut:轻量级微服务框架

【6月更文挑战第16天】Micronaut是面向JVM的微服务框架,以其快速启动、低内存占用著称。文章探讨了配置管理、注解理解和AOT编译的挑战,提供了解决方案,并通过一个简单的HTTP服务示例展示了如何创建控制器和应用启动类。通过克服这些问题,开发者能更好地利用Micronaut构建高效微服务。

594 8
|
XML 安全 搜索推荐
|

大数据之 Solr 集群搭建

Solr是一个基于Java的高性能全文搜索服务器,扩展自Lucene,提供丰富查询语言和优化的查询性能。它支持通过HTTP接口以XML格式进行索引和搜索操作。在集群环境中,涉及解压软件包,配置环境变量,修改Zookeeper参数,文件分发,启动Solr和Zookeeper服务。建议使用非root用户启动,确保安全。启动后,通过WEB UI验证Solr集群部署是否成功,遇到问题如找不到solr.xml文件,可通过指定-Dsolr.solr.home参数解决。

596 8
|
SQL 关系型数据库 MySQL
|

实时计算 Flink版产品使用合集之使用 MySQL CDC 进行数据同步时,设置 server_id 参数如何解决

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

761 1
来自: 实时计算 Flink  版块
|
机器学习/深度学习 自然语言处理 机器人
|

实时数仓 Hologres产品使用合集之业级问答知识库该如何部署有教程吗

实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。

395 0
来自: 实时数仓 Hologres  版块
|
运维 监控 安全
|

什么是NetDevOps

总之,NetDevOps是一种综合性的方法,旨在将DevOps原则引入网络运维领域,通过自动化、持续交付、基础设施即代码等实践,

750 1
|
机器学习/深度学习 算法 物联网
|

LoRA及其变体概述:LoRA, DoRA, AdaLoRA, Delta-LoRA

LoRA可以说是针对特定任务高效训练大型语言模型的重大突破。它被广泛应用于许多应用中。在本文中,我们将解释LoRA本身的基本概念,然后介绍一些以不同的方式改进LoRA的功能的变体,包括LoRA+、VeRA、LoRA- fa、LoRA-drop、AdaLoRA、DoRA和Delta-LoRA。

1747 2
|
机器学习/深度学习 算法 Python
|

CatBoost中级教程:集成学习与模型融合

CatBoost中级教程:集成学习与模型融合【2月更文挑战第13天】

642 3
|
设计模式 缓存 安全
|

设计模式-代理模式(静态代理、动态代理、cglib代理)、代理模式和装饰者模式的区别

设计模式-代理模式(静态代理、动态代理、cglib代理)、代理模式和装饰者模式的区别

293 1
|
人工智能 JSON 运维
|

AI大模型运维开发探索第三篇:深入浅出运维智能体

大模型出现伊始,我们就在SREWorks开源社区征集相关的实验案例。玦离同学提供了面向大数据HDFS集群的智能体案例,非常好地完成了运维诊断的目标。于是基于这一系列的实验和探索。本文详细介绍智能体在运维诊断中的应用探索。

4708 3
来自: 大数据运维SREWorks  版块
|
自然语言处理 分布式计算 算法
|

通过OpenSearch向量检索版进行混合检索的最佳实践

本文介绍如何通过OpenSearch向量检索版,使用稀疏-稠密向量进行混合检索,获得更好的搜索效果。

2174 0
来自: 智能搜索推荐  版块
|
API Apache 数据库
|

Flink CDC 3.0 正式发布,详细解读新一代实时数据集成框架

Flink CDC 于 2023 年 12 月 7 日重磅推出了其全新的 3.0 版本 ~

110432 8
来自: 实时计算 Flink  版块
|
数据处理 Python
|

Python实现post请求微店商品详情数据接口

Python实现post请求微店商品详情数据接口

317 0
|
算法 调度 决策智能
|

Python高级算法——模拟退火算法(Simulated Annealing)

Python高级算法——模拟退火算法(Simulated Annealing)

1847 1
|
机器学习/深度学习 存储 分布式计算
|

在阿里云上训练机器学习模型:逻辑回归和GBDT实践指南

机器学习在当今数据驱动的世界中扮演着关键角色,为业务决策提供了强大的支持。本文将详细介绍如何在阿里云上使用相关产品,训练逻辑回归(Logistic Regression)和梯度提升决策树(Gradient Boosted Decision Trees,GBDT)模型。我们将使用MaxCompute、PAI(机器学习平台)、DataWorks等阿里云产品,通过代码示例和详细说明,带你一步步完成整个流程。

732 0
|
机器学习/深度学习 人工智能 分布式计算
|

大模型时代的人工智能+大数据平台,加速创新涌现

2023年10月31日,2023云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布阿里云人工智能+大数据平台升级发布,以服务大模型时代下各行各业的业务创新。

3419 0
来自: 人工智能平台PAI  版块
|
人工智能 算法 Java
|

ACM模式之输入输出(Java/Python例题)

ACM模式之输入输出(Java/Python例题)

977 0
|
开发框架 .NET
|

ASP.NET Core 关系映射

Get新知识:IPropertyMappingServicePropertyMappingService 服务提供类 的提取接口。 public interface IPropertyMappingService { Dictionary<string, PropertyMappingValue> GetPropertyMapping<TSource, TDest...

235 0
|
算法 C++
|

Morton码的计算

Morton码是对栅格格网进行编码的一种算法,在Google中搜索Morton,搜索结果第一位是Wikipedia的Z-order Curve,这是因为Morton码编码结果展现为一种Z形的填充曲线。下面简要说一下如何计算四进制和十进制的Morton码。

1783 0
|
自然语言处理 搜索推荐 算法
|

阿里云OpenSearch重磅推出LLM问答式搜索产品,助力企业高效构建对话式搜索服务

OpenSearch推出LLM智能问答版,面向行业搜索场景,提供企业专属问答搜索服务,基于内置的LLM大模型提供问答能力,一站式快速搭建问答搜索系统。

13267 7
来自: 智能搜索推荐  版块
|
机器学习/深度学习 算法 大数据
|

【持续更新】阿里云大数据&AI开源项目合集

阿里云大数据&AI开源项目合集,了解全部阿里云AI&大数据开源项目,欢迎加入。

5264 18
来自: 人工智能平台PAI  版块
|
13天前
|
机器学习/深度学习 自然语言处理 监控
|

别再用“好评率”骗自己了:用 Python + Transformers 做一套真正能用的情感分析系统

别再用“好评率”骗自己了:用 Python + Transformers 做一套真正能用的情感分析系统

119 8
|
18天前
|
人工智能 监控 安全
|

1949AI轻量化AI自动化:有头浏览器自动化竞品词排名监控与邮件提醒实践

1949AI轻量化AI自动化工具,基于Playwright实现有头浏览器本地监控:可视化调试、低资源占用、安全合规。支持关键词排名追踪、波动预警与邮件提醒,单文件部署、零外部依赖,专为个人开发者与小型团队打造。

251 5
|
19天前
|
存储 安全 编译器
|

嵌入式软件可靠性:从代码细节到系统化设计的工程实践

本文系统阐述高可靠嵌入式软件设计方法,涵盖编译器可信性、冗余容错、软硬协同、存储保护、人机安全交互、功能安全(ISO 26262/IEC 61508)、DFMEA分析及可维护性评价七大维度,强调可靠性源于全流程工程实践与习惯养成。(239字)

145 1
|
19天前
|
自然语言处理 数据挖掘 数据库
|

数据智能引擎:从精准问数到深度分析的完整解决方案

数据智能引擎基于本体论,首创“精准问数+深度分析”双模式:技术专家可自然语言查数据,高管提方向性问题获自动洞察。多智能体协同、95%准确率、低门槛业务知识管理,赋能企业AI原生数据转型。(239字)

111 1
|
2月前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

202 2
|
2月前
|
存储 人工智能 JSON
|

从入门到实践:不懂代码也能微调大模型,普通人AI进阶指南

本文详解大模型微调:为何需要(让AI更懂你)、原理何在(参数微调如“专项特训”)、如何实操(四步完成数据准备→云端训练→参数配置→效果评估),并指出工具平民化正使个性化AI触手可及。(239字)

316 4
|
2月前
|
机器学习/深度学习 运维 监控
|

数据不出门,也能一起“卷模型”——聊聊隐私保护下的联邦学习:原理与工程实践

数据不出门,也能一起“卷模型”——聊聊隐私保护下的联邦学习:原理与工程实践

306 4
|
2月前
|
数据采集 人工智能 监控
|

让大模型“开小灶”:手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调(Fine-tuning)技术:揭示通用大模型“懂常识却不懂行”的根源,详解LoRA等高效微调原理,对比RAG适用场景,并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。(239字)

263 0
|
3月前
|
缓存 搜索推荐 算法
|

RAG 的上限不在模型,而在你怎么切文档

RAG失效常因切分不当:碎片化chunk导致信息割裂、语义丢失。本文直击核心——切分不是预处理,而是知识工程:需结构感知、保留标题/表格/步骤完整性,以“可独立阅读、可直接引用”为黄金标准,避免“检索准、答案错”。

161 1
|
3月前
|
机器学习/深度学习 人工智能 监控
|

从原理到实践:零代码也能搞定的PPO微调全攻略

本文深入浅出解析PPO(近端策略优化)算法——大模型对齐人类偏好的核心技术。通过“温和教练”比喻、四步原理拆解与实操指南,零基础也能理解其剪切机制、优势函数与稳定训练逻辑,并亲手微调出更懂你的AI。(239字)

248 0
|
3月前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

189 0
|
3月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

303 4
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型面试宝典

【AI大模型面试宝典】聚焦Transformer核心架构,拆解自注意力、多头机制、位置编码等高频考点,配代码实现与面试真题解析,助你快速掌握大模型面试关键知识点,无痛拿下offer!

213 0
来自: 人工智能平台PAI  版块
|
3月前
|
XML JSON 算法
|

淘宝商品详情API接口指南

淘宝商品详情API(taobao.item.get)可获取商品标题、价格、图片、库存、销量等核心信息。支持POST/GET请求,返回JSON格式数据。需提供app_key、timestamp、sign等参数,常见响应码包括200(成功)、401(权限不足)、403(签名错误)等,适用于电商数据对接与分析。

341 0
|
3月前
|
存储 定位技术
|

北斗GPS卫星授时服务器运行介绍

北斗GPS授时服务器通过接收GNSS卫星信号,利用NTP/PTP协议输出精准时间,部分设备如SYN2136系列还支持串口RMC语句输出。本文介绍冷启动(需数分钟)、温启动(数十秒至数分钟)、热启动(数秒)的区别,以及常用通信语句GGA与RMC的对比。RMC提供位置、速度、航向和时间等全面信息,更适用于导航等综合场景,而GGA主要用于基础定位。根据需求选择合适模式与语句,可提升授时效率与精度。(238字)

187 1
|
3月前
|
存储
|

原码,反码,补码

原码是二进制的直观表示,符号位决定正负;反码用于解决负数计算问题,负数按位取反;补码在反码基础上加1,解决跨0误差。计算机中所有数据存储与运算均采用补码形式,可准确处理正负数运算,并能多表示一个特殊值-128。

475 5
|
4月前
|
运维 Devops 开发工具
|

生产环境缺陷管理

为解决大型团队多分支开发中bug管理混乱、人为疏漏导致生产事故的问题,我们基于go-git开发了分布式工具git-poison。它实现bug的追溯、查询与发布卡点,自动化同步“投毒-解毒”信息,阻塞带未修复bug的版本发布,降低协同成本,避免“重复翻车”。已集成至发布与运维平台,提升缺陷管理效率与系统稳定性。

157 0
|
4月前
|
消息中间件 Java Nacos
|

SpringCloud概述

Spring Cloud是Spring团队推出的微服务一站式解决方案,弥补了各独立组件(如Nacos、RabbitMQ等)缺乏统一架构的不足。其特点为约定优于配置、组件丰富、开箱即用,支持云原生。版本以伦敦地铁站命名,避免与子项目冲突。Spring Cloud Alibaba由阿里贡献,集成Nacos、Sentinel、Seata等成熟组件,因Netflix套件停更,现成为主流选择,功能更完整且经大规模验证,是当前微服务架构的优选技术栈。

357 0
|
4月前
|
机器学习/深度学习 安全 算法
|

基于yolov8的安全帽检测系统

本研究基于YOLOv8目标检测算法,构建安全帽佩戴智能识别系统,针对建筑、矿山等高危作业场景,实现对人员头部防护的实时监控与预警。系统结合深度学习与计算机视觉技术,通过高效标注数据集、优化模型结构,提升检测精度与速度,在1080P图像下可达35FPS以上,满足工业级实时性需求。相比传统人工巡查,显著降低漏检率,提高监管效率,助力高危行业向智能化安全管理转型,具有重要应用价值与推广前景。

279 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69319
内容
128
活动
439806
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务