|
1月前
|
存储 搜索推荐 Python
|

TorchRec大量使用Jagged Tensor

Jagged Tensor(锯齿张量)是专为变长序列设计的紧凑存储格式,用values+lengths/offsets替代padding,显著节省内存与计算。广泛应用于推荐系统中用户行为、多值标签等不等长特征处理,如HSTU模型中的拼接、拆分与矩阵乘法操作。

260 8
来自: 人工智能平台PAI  版块
|
1月前
|
SQL 人工智能 分布式计算
|

EMR Serverless Spark 携手 PAI/百炼,开启“SQL 即 AI”的新篇章

EMR Serverless Spark 深度集成 AI Function 能力,并无缝对接 阿里云百炼与 阿里云人工智能平台 PAI 模型在线服务 PAI-EAS,定义了“SQL 即 AI”的新解决思路,数据分析师只需一行 SQL,即可直接调用世界顶尖的大模型。

243 4
|
2月前
|
JavaScript 芯片
|

三节串联锂电池充电芯片应用与PCB设计指南

PW4053A(异步)是一款5V输入,最大1.2A充电电流(是指电池端的电流,输出12.6V电池端的电压),支持三节锂电池的升压充电管理IC。PW4053A集成功率MOS采用异步开关架构,使其在应用时仅需极少的外围器件,可有效减少整体方案尺寸,降低BOM成本。PW4053A的升压开关充电转换器的工作频率为500KHz,转换率微90%。PW4053A啊呼入电压为5V,内置自适应环路,可智能调节充电电流大小,防止拉垮适配器输出,可匹配所有适配器。PW4053A提供SOP8-EP封装形式,工作温度额定范围为-40℃至85℃。

303 5
|
2月前
|
安全
|

1949AI 零代码本地自动化工具:轻量化部署适配低配置电脑设备

本文介绍1949AI轻量化本地自动化方案:零代码、免配置、纯本地运行,安全合规无数据外传;低资源占用,兼容低配电脑;面向小白用户,三步搞定表格整理、文件批量重命名等重复任务,离线可用,开箱即用。(239字)

439 0
|
2月前
|
自然语言处理 数据挖掘 数据库
|

数据智能引擎:从精准问数到深度分析的完整解决方案

数据智能引擎基于本体论,首创“精准问数+深度分析”双模式:技术专家可自然语言查数据,高管提方向性问题获自动洞察。多智能体协同、95%准确率、低门槛业务知识管理,赋能企业AI原生数据转型。(239字)

299 1
|
2月前
|
机器学习/深度学习 BI
|

数据智能体目前能做到多少准确率?

本文客观分析字节、帆软、京东、Palantir、UINO等主流数据智能体的准确率表现,揭示NL2SQL、宽表、本体+智能体等技术路线的真实水平(单表最高98%+,多表本体路线达95%+),指出语义深度、知识积累、测试集差异等核心影响因素,并提供可落地的POC评估框架。(239字)

265 0
|
2月前
|
SQL 分布式计算 大数据
|

三朵云的大数据江湖:AWS、GCP、Azure 托管服务到底谁更香?

三朵云的大数据江湖:AWS、GCP、Azure 托管服务到底谁更香?

322 2
|
2月前
|
XML JSON 数据挖掘
|

京东商品详情数据一键获取,item_get API接口讲解

京东item_get是获取单商品详情的核心API,支持一键拉取标题、价格、SKU、库存、详情HTML等结构化数据,适用于反向海淘、代购、ERP同步及比价分析等场景,分基础版与完整版,需认证授权后调用。(239字)

373 2
|
2月前
|
数据采集 缓存 自然语言处理
|

LitBuy模式反向海淘系统(欧美淘宝/1688代购)搭建指南

LitBuy是面向海外用户的中国商品代购集运平台,支持粘贴淘宝/1688链接一键下单,提供多语言、多支付、智能合箱与全程物流追踪。核心盈利来自物流差价、代购服务费及增值服务,技术架构基于Next.js+Java/Node.js微服务,部署于AWS/阿里云国际节点。(239字)

435 0
|
3月前
|
监控 安全 网络安全
|

8080 和 3128 端口的核心区别及使用场景

HTTP代理常用端口8080与3128各有侧重:8080多用于管理监控(如Web配置界面),易记但可能被防火墙拦截;3128为标准端口,稳定性高,主供客户端正常请求转发。端口可自定义,需据安全与性能需求合理选用。

387 9
|
4月前
|
机器学习/深度学习 搜索推荐 算法
|

推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

311 0
|
4月前
|
人工智能 监控 API
|

Opus 4.5、GPT-5.2 与 Gemini 3 Pro:企业级场景下的大模型工程表现对比

本文从工程与生产视角,对比Opus 4.5、GPT-5.2、Gemini 3 Pro三款大模型在输出一致性、可控性、长上下文、接口确定性等维度的表现,强调企业级AI选型应重稳定性与系统友好度,而非单纯比拼能力。

380 4
来自: 人工智能平台PAI  版块
|
4月前
|
机器学习/深度学习 分布式计算 Java
|

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

434 8
|
4月前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

300 0
|
4月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

471 4
|
4月前
|
SQL 人工智能 自然语言处理
|

企业落地 AI 数据分析,如何做好敏感数据安全防护?

在 AI 问数时代,数据安全与使用效率并非零和博弈。

414 8
|
4月前
|
消息中间件 运维 监控
|

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

293 7
|
4月前
|
人工智能 算法
|

【AI大模型面试宝典十】- 推理部署篇

【AI大模型面试宝典】聚焦模型压缩核心技术:量化解析(INT8/INT4/GPTQ/AWQ)、激活量化、稀疏化与知识蒸馏,配实战代码与面试高频题。助你攻克大模型部署难题,精准提升面试竞争力,offer轻松拿!点赞关注,持续更新中~

383 0
来自: 人工智能平台PAI  版块
|
4月前
|
存储 人工智能 Serverless
|

AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

2026年AI进入应用爆发期,但非结构化数据成为瓶颈。Hologres推出AI原生新架构HSAP 2.0,融合语义搜索、多维分析与Serverless弹性,打造统一数据平面,让企业海量数据高效赋能AI,破解“数据熵”难题,支撑智能客服、销售助手等复杂场景,实现从“为人服务”到“为AI服务”的跨越。

409 1
来自: 实时数仓 Hologres  版块
|
4月前
|
人工智能 自然语言处理 搜索推荐
|

当AI搜索“偏爱”某些信息:GEO优化的技术逻辑与生活影响

AI搜索时代,信息分发由GEO优化主导:它通过语义匹配、结构化呈现与可信度背书,让优质内容被AI“选中”。从亲子游到咖啡机推荐,企业、个人皆需掌握这一新规则,重塑信息传播方式,提升曝光效率。

488 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI数字人厂商的技术发展与行业生态分析

AI数字人融合语音识别、自然语言处理与3D建模等技术,正加速应用于金融、教育、医疗等领域。依托大模型与多模态交互,实现拟人化智能服务。世优科技推出“波塔AI数字人”,支持定制化形象与实时交互,助力政企数字化升级。行业快速发展的同时,也面临隐私、伦理与标准化挑战,需多方协同推进。

539 2
来自: 人工智能平台PAI  版块
|
4月前
|
Java Go 开发者
|

IDEA开发常用的快捷键

IntelliJ IDEA常用快捷键汇总:涵盖代码生成(如main、sout)、编辑(复制、删除、重命名)、导航(跳转、查找)、格式化、代码阅读及版本控制等高频操作,提升开发效率。熟练掌握可显著优化编码体验,是Java开发者必备技能。

507 1
|
5月前
|
uml C语言
|

系统时序图

时序图(Sequence Diagram)是UML中描述对象间消息传递时间顺序的交互图,横轴为对象,纵轴为时间,展现动态协作过程。它强调交互的时间次序,可用于建模并发进程与方法调用,核心元素包括角色、对象、生命线、控制焦点和各类消息,是分析系统行为的重要工具。

220 0
|
5月前
|
安全 Java 数据安全/隐私保护
|

2.通用权限管理模型

本文介绍了ACL和RBAC两种常见的权限模型。ACL通过直接为用户或角色授权实现访问控制,简单直观;RBAC则基于角色进行权限管理,支持角色继承与职责分离,结构更清晰、易于维护,是现代系统主流的权限设计方式。

182 0
|
5月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与安全性。分块策略是其核心,直接影响检索效果与答案质量。本文系统解析五种主流分块方法——固定大小、语义、递归、基于结构及LLM分块,对比优缺点与适用场景,助力构建高效、可靠的RAG系统。

453 0
|
5月前
|
缓存 Java 数据库连接
|

MyBatis常见配置

MyBatis配置优先级:方法参数 > resource/url > properties。支持缓存、延迟加载、主键生成等常用配置,可多环境管理,默认使用development环境。事务由JDBC或MANAGED控制,集成Spring后由其接管事务管理。

186 0
|
5月前
|
负载均衡 中间件 Java
|

每日必会1

微服务并非绝对优于单体,需结合业务。简单场景下单体更轻便;复杂业务链路适合微服务,解耦利于扩展。常用中间件:Nacos(注册/配置中心)、OpenFeign(远程调用)、Gateway(网关)。Nacos支持心跳机制,临时实例异常则剔除,非临时实例不剔除,且支持服务变更推送,集群可切CP/AP模式。负载均衡常用轮询、加权轮询等。

532 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF等技术构成大模型核心训练体系:预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本实现快速迁移,指令微调增强指令理解,自监督利用海量无标注数据,温度控制生成风格,蒸馏压缩模型,缩放定律指导高效扩展。

412 0
|
5月前
|
存储 缓存 运维
|

一场FullGC故障排查

本文记录了一次线上CPU使用率异常升高的排查过程,最终定位为JVM频繁Full GC导致。通过对比机器监控与JVM堆内存监控,发现根本原因是处理Excel样本时大对象长期驻留内存,引发内存膨胀。结合JProfiler分析堆 dump 文件,定位到List<Map>结构存储导致内存占用激增,空间效率不足15%。提出“激进治疗”(数据外存化)与“保守治疗”(减少冗余字段)两类解决方案,并总结了排查思路:优先排查Full GC、关注JVM而非机器内存、利用工具精准定位大对象,避免被表象误导。

199 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同构建大模型核心能力。预训练夯实语言基础,微调适配特定任务,RLHF对齐人类偏好,思维链提升推理,少/零样本实现快速迁移,指令微调增强指令理解,自监督利用海量文本,温度控制生成风格,蒸馏压缩模型规模,缩放定律指引性能增长路径。

498 0
|
5月前
|
SQL 自然语言处理 数据可视化
|

大火的 ChatBI,是如何实现灵活的自然语言数据分析?

这对业务人员而言,不仅简化了数据分析流程,更无需依赖 IT 代码开发,实现了自主灵活的智能问数,高效敏捷展开分析。

573 1
|
5月前
|
SQL 人工智能 分布式计算
|

阿里云大数据AI产品月刊-2025年11月

大数据& AI 产品技术月刊【2025年 11 月】,涵盖 11 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

389 0
|
5月前
|
存储 Linux 数据处理
|

实用程序:基于Python+Tkinter开发表格比对&整理工具

一款基于Python+Tkinter开发的免费开源Excel处理工具,支持表格差异比对与错乱行整理,完整保留图片,兼容.xlsx和.csv格式。操作简单,支持自定义比对列、多线程处理,解决日常办公中数据比对、行合并及图片丢失等痛点,适用于各类Excel数据清理场景。(239字)

482 12
|
5月前
|
机器学习/深度学习 存储 人工智能
|

AI 十大论文精讲(九):无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

本文解读AI十大核心论文第九篇《LLM.int8()》,聚焦大模型推理中的内存瓶颈问题。该论文提出创新的混合精度量化方法,通过向量级量化与异常值分离技术,首次实现千亿参数模型无损8位量化,显著降低部署成本,提升计算效率,推动大模型在消费级硬件上的落地应用,为低比特量化研究奠定重要基础。

664 8
|
6月前
|
分布式计算 Hadoop 大数据
|

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

500 6
|
6月前
|
人工智能 算法 前端开发
|

实验报告:让AI自动生成采集代码,会踩哪些坑?

本文复盘AI自动生成采集代码的实战效果,梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好,适合简单场景;但面对加密接口与强反爬时仍需人工介入。最终结论:AI是高效助手,但核心难题仍需工程师掌控。

585 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI 十大论文精讲(七):Switch Routing 如何破解 MoE 的路由、通信与稳定性三大痛点

Switch Transformers通过简化MoE路由机制,实现万亿参数模型的高效训练。其核心创新在于Switch Routing(单专家激活)、选择性精度与三重并行架构,在降低计算成本的同时提升模型规模与稳定性,为大模型稀疏化发展奠定基础。

693 132
|
6月前
|
机器学习/深度学习 人工智能 计算机视觉
|

AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型,通过轻量化设计、增强多尺度融合与小目标优化,在保证高精度的同时显著提升速度,实现复杂场景下更优的性能平衡。

612 0
|
6月前
|
数据采集 机器学习/深度学习 人工智能
|

AI 十大论文精讲(二):GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明:当Transformer模型参数规模扩大到1750亿时,仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式,无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现,其中在LAMBADA长文本任务上准确率达86.4%,较此前最优提升18.4%。这一研

1094 152
|
6月前
|
数据可视化 API 开发工具
|

Unity3D 2023 游戏开发软件完整部署指南:安装步骤、激活方法及安装包

Unity 2023是一款多功能游戏开发引擎,支持3D游戏、建筑可视化与实时动画创作。新增对Apple Vision Pro的visionOS支持,强化XR设备兼容性,优化多平台图形性能,提升开发效率。

1213 1
|
7月前
|
存储 分布式计算 运维
|

云栖实录|驰骋在数据洪流上:Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台,应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断,实现分钟级向秒级跃迁,提升性能3-5倍,降低存储成本。通过Flink+Hologres+MaxCompute技术栈,打造高效、稳定、可扩展的实时数仓,支撑100万台量产车背后的数据驱动决策,并迈向流批一体与AI融合的未来架构。

566 3
来自: 实时计算 Flink  版块
|
8月前
|
分布式计算 Java 关系型数据库
|

二、Sqoop 详细安装部署教程

在大数据开发实战中,Sqoop 是数据库与 Hadoop 生态之间不可或缺的数据传输工具。这篇文章将以 Sqoop 1.4.7 为例,结合官方站点截图,详细讲解 Sqoop 的下载路径、安装步骤、环境配置,以及常见 JDBC 驱动的准备过程,帮你一步步搭建出能正常运行的 Sqoop 环境,并通过 list-databases 命令验证安装是否成功。如果你正打算学习 Sqoop,或者在搭建大数据平台过程中遇到安装配置问题,本文将是非常实用的参考指南。

833 6
|
8月前
|
XML JSON 算法
|

京东商品 SKU 信息接口(jingdong.ware.sku.get)技术干货:数据拉取、规格解析与字段治理(附踩坑总结 + 可运行代码)

本文详解京东商品SKU接口对接技术,涵盖核心参数、权限申请、签名生成、规格解析及常见坑点解决方案,结合可运行代码与实战经验,助力开发者高效集成SKU数据,实现库存、价格等关键信息精准获取。

652 1
|
8月前
|
机器学习/深度学习 数据可视化 数据挖掘
|

香烟品牌识别和规格识别设计思路

基于YOLOv8实现香烟品牌与规格(条装/单盒装)识别,采用“品牌+规格”组合为60类的复合类别方案,结合充足标注数据(每类300-500张)、数据增强与反例优化,进行端到端联合训练,提升模型在复杂场景下的检测与分类精度。

986 6
|
8月前
|
人工智能 JSON 测试技术
|

AI智能体开发实战:从提示工程转向上下文工程的完整指南

曾被热捧的提示工程正逐渐退潮,本文揭示其局限性,并提出“上下文工程”新范式:通过结构化提示、精准上下文管理、工具调用与统一状态,构建可扩展、可恢复、生产级的智能体工作流,推动AI系统迈向工程化与可控化。

948 9
|
8月前
|
机器学习/深度学习 数据采集 算法
|

量子机器学习入门:三种数据编码方法对比与应用

在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。

681 8
|
9月前
|
机器学习/深度学习 监控 大数据
|

数据当“安全带”:金融市场如何用大数据玩转风险控制?

数据当“安全带”:金融市场如何用大数据玩转风险控制?

521 10
|
9月前
|
算法 Linux
|

数据分布平滑化技术:核密度估计KDE解决直方图不连续问题

核密度估计(KDE)通过平滑处理解决直方图密度估计中的不连续问题,提供连续密度函数。其核心在于使用核函数对数据点进行加权,避免区间划分带来的信息丢失。带宽参数h影响估计效果,过小导致波动大,过大则过度平滑。常用核函数包括高斯核与Epanechnikov核,实际应用中可借助Statsmodels或Seaborn库快速实现。

582 0
|
9月前
|
机器学习/深度学习 人工智能 算法
|

GSPO:Qwen让大模型强化学习训练告别崩溃,解决序列级强化学习中的稳定性问题

这是7月份的一篇论文,Qwen团队提出的群组序列策略优化算法及其在大规模语言模型强化学习训练中的技术突破

1873 0
|
10月前
|
Java 编译器 数据安全/隐私保护
|

Java 大学期末考试真题与答案 含知识点总结 重难点归纳及题库汇总 Java 期末备考资料

本文汇总了Java大学期末考试相关资料,包含真题与答案、知识点总结、重难点归纳及题库,涵盖Java基础、面向对象编程、异常处理、IO流等内容,并提供完整代码示例与技术方案,助你高效复习备考。

962 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务