|
8月前
|
机器学习/深度学习 监控 大数据
|

数据当“安全带”:金融市场如何用大数据玩转风险控制?

数据当“安全带”:金融市场如何用大数据玩转风险控制?

341 10
|
8月前
|
JSON 搜索推荐 API
|

小红书笔记列表API数据解析(附代码)

本内容介绍如何利用小红书开放平台的笔记列表API,批量获取与关键词或用户相关的笔记数据,包括标题、封面图、互动数据等。接口支持按关键词分页查询及排序筛选,适用于内容聚合与用户分析。附Python示例代码,演示通过GET请求调用API的方法,并处理返回的JSON数据。

578 4
|
8月前
|
存储 缓存 Apache
|

StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询

A+流量分析平台是阿里集团统一的全域流量数据分析平台,致力于通过埋点、采集、计算构建流量数据闭环,助力业务提升流量转化。面对万亿级日志数据带来的写入与查询挑战,平台采用Flink+Paimon+StarRocks技术方案,实现高吞吐写入与秒级查询,优化存储成本与扩展性,提升日志分析效率。

1047 1
|
8月前
|
人工智能 测试技术 芯片
|

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。

743 0
|
9月前
|
存储 缓存 NoSQL
|

Redis核心数据结构与分布式锁实现详解

Redis 是高性能键值数据库,支持多种数据结构,如字符串、列表、集合、哈希、有序集合等,广泛用于缓存、消息队列和实时数据处理。本文详解其核心数据结构及分布式锁实现,帮助开发者提升系统性能与并发控制能力。

759 0
|
9月前
|
安全 Java 网络安全
|

Java 实现 SMTP 协议调用的详细示例及实战指南 SMTP Java 调用示例

本文介绍了如何使用Java调用SMTP协议发送邮件,涵盖SMTP基本概念、JavaMail API配置、代码实现及注意事项,适合Java开发者快速掌握邮件发送功能集成。

1047 0
|
11月前
|
人工智能 自然语言处理 算法
|

DistilQwen-ThoughtX:变长思维链推理模型,能力超越DeepSeek蒸馏模型

阿里云PAI团队开发的 OmniThought 数据集,其中包含200万思维链,并标注了推理冗余度(RV)和认知难度(CD)分数。基于此数据集,我们还推出了 DistilQwen-ThoughtX 系列模型,可以通过RV和CD分数对思维链进行筛选,训练得到的模型获得根据问题和本身的认知能力,生成变长思维链的能力。同时在 EasyDistill 框架中开源了 OmniThought 数据集和 DistilQwen-ThoughtX 模型的全部权重。这些模型在性能上超过了 DeepSeek-R1-Distill 系列。

1147 9
来自: 人工智能平台PAI  版块
|
12月前
|
人工智能 边缘计算 前端开发
|

人工智能平台 PAI DistilQwen2.5-DS3-0324发布:知识蒸馏+快思考=更高效解决推理难题

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建,显著提升推理速度,使得在资源受限的设备和边缘计算场景中,模型能够高效执行复杂任务。实验显示,DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出,其32B模型效果接近参数量接近其10倍的闭源大模型。

1259 56
来自: 人工智能平台PAI  版块
|
12月前
|
弹性计算 运维 算法
|

阿里云 Elasticsearch Serverless 检索增强型 8.17 版来袭!

阿里云Elasticsearch Serverless 8.17版本,深度融合无服务器架构与分层扩展能力,面向信息检索、向量搜索、语义分析等通用场景,提供全托管服务,在最新特性扩展、自动扩缩性能、资源成本优化等维度均有显著提升。

626 15
|
12月前
|
移动开发 人工智能 定位技术
|

用 Godot 开发像素风《饥荒》的流程

用 Godot 开发像素风《饥荒》的流程

962 6
|
12月前
|
SQL API Apache
|

Dinky 和 Flink CDC 在实时整库同步的探索之路

本次分享围绕 Dinky 的整库同步技术演进,从传统数据集成方案的痛点出发,探讨了 Flink CDC Yaml 作业的探索历程。内容分为三个部分:起源、探索、未来。在起源部分,分析了传统数据集成方案中全量与增量割裂、时效性低等问题,引出 Flink CDC 的优势;探索部分详细对比了 Dinky CDC Source 和 Flink CDC Pipeline 的架构与能力,深入讲解了 YAML 作业的细节,如模式演变、数据转换等;未来部分则展望了 Dinky 对 Flink CDC 的支持与优化方向,包括 Pipeline 转换功能、Transform 扩展及实时湖仓治理等。

1355 12
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

DAPO: 面向开源大语言模型的解耦裁剪与动态采样策略优化系统

DAPO(Decoupled Clip and Dynamic Sampling Policy Optimization)是由字节跳动提出的一种突破性的开源大语言模型强化学习系统。基于Qwen2.5-32B基础模型,DAPO在AIME 2024测试中以50分的优异成绩超越了现有最佳模型,

1298 6
|
人工智能 程序员 C++
|

通义灵码 AI 程序员-全平台AI程序员插件

人工智能正在深度融入开发流程,阿里云通义灵码AI程序员全面上线,支持VS Code与JetBrains IDEs,是国内首个真正落地的AI程序员工具。它不仅能生成代码、续写功能,还支持跨语言编程和图片生成代码。相较1.0版本,新增多项功能,模型更丰富,生成速度更快。快来体验未来开发的魅力!链接附上,欢迎探索。

688 7
|
JSON API 数据格式
|

京东商品SKU价格接口(Jd.item_get)丨京东API接口指南

京东商品SKU价格接口(Jd.item_get)是京东开放平台提供的API,用于获取商品详细信息及价格。开发者需先注册账号、申请权限并获取密钥,随后通过HTTP请求调用API,传入商品ID等参数,返回JSON格式的商品信息,包括价格、原价等。接口支持GET/POST方式,适用于Python等语言的开发环境。

2217 11
|
存储 JSON API
|

淘宝直播间弹幕API接口(taobao.item_video_barrage)

淘宝直播间弹幕 API(`taobao.item_video_barrage`)用于获取直播间的弹幕数据。通过指定直播间 ID 和模式参数(如 `start` 建立连接、`refresh` 获取弹幕),可以获取弹幕消息列表、直播间信息等。响应数据为 JSON 格式,包含状态码、直播间 ID、连接状态和弹幕详情。使用时需注意权限限制、接口稳定性和数据处理。

1276 7
|
JSON 缓存 监控
|

淘宝商品详情接口(Taobao.item_get)丨淘宝API接口指南

淘宝商品详情接口(Taobao.item_get)允许开发者通过HTTP GET方法获取淘宝商品的详细信息,包括商品ID、价格、库存等。请求需包含key、secret、num_iid等必选参数,支持缓存及多种返回格式。此接口广泛应用于电商数据分析、商品选品、价格监控等领域,提升商家运营效率。

2625 1
|
人工智能 算法 物联网
|

企业级RAG全链路优化关键技术

本文深入解析了企业级RAG全链路的关键技术、效果优化、性能优化及应用实践。

1434 7
|
人工智能 分布式计算 DataWorks
|

大数据&AI产品月刊【2024年8月】

大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

359 9
|
SQL 存储 关系型数据库
|

Hologres SQL 查询优化技巧

【9月更文第1天】随着大数据处理的需求日益增长,如何高效地进行数据查询和分析变得尤为重要。Hologres 是阿里云推出的一款实时数仓产品,它基于 PostgreSQL 构建,并针对在线分析处理(OLAP)场景进行了优化,支持实时数据写入与查询,能够实现毫秒级的查询响应。本文将探讨在使用 Hologres 时如何编写高效的 SQL 查询,并介绍一些特定于 Hologres 的优化技巧。

1008 2
|
存储 设计模式 安全
|

C++一分钟之-并发编程基础:线程与std::thread

【6月更文挑战第26天】C++11的`std::thread`简化了多线程编程,允许并发执行任务以提升效率。文中介绍了创建线程的基本方法,包括使用函数和lambda表达式,并强调了数据竞争、线程生命周期管理及异常安全等关键问题。通过示例展示了如何用互斥锁避免数据竞争,还提及了线程属性定制、线程局部存储和同步工具。理解并发编程的挑战与解决方案是提升程序性能的关键。

549 3
|
缓存 Linux 编译器
|

Linux(CentOS7.5) 安装部署 Python3.6(超详细!包含 Yum 源配置!)

该指南介绍了在Linux系统中配置Yum源和安装Python3的步骤。首先,通过`yum install`和`wget`命令更新和备份Yum源,并从阿里云获取CentOS和EPEL的repo文件。接着,清理和更新Yum缓存。然后,下载Python3源代码包,推荐使用阿里云镜像加速。解压后,安装必要的依赖,如gcc。在配置和编译Python3时,可能需要解决缺少C编译器的问题。完成安装后,创建Python3和pip3的软链接,并更新环境变量。最后,验证Python3安装成功,并可选地升级pip和配置pip源以提高包下载速度。

4639 0
|
存储 机器学习/深度学习 算法
|

如何准确的估计llm推理和微调的内存消耗

最近发布的三个大型语言模型——Command-R+ (104B参数), Mixtral-8x22b (141B参数的MoE模型), 和 Llama 3 70b (70.6B参数)——需要巨大的内存资源。推理时,Command-R+需193.72GB GPU RAM,Mixtral-8x22B需262.63GB,Llama 370b需131.5GB。激活的内存消耗根据序列长度、批大小等因素变化。文章详细介绍了计算这些模型内存需求的方法,并探讨了如何通过量化、优化器优化和梯度检查点减少内存使用,以适应微调和推理。

2724 0
|
机器学习/深度学习 关系型数据库 MySQL
|

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

GQA是一种结合MQA和MHA优点的注意力机制,旨在保持MQA的速度并提供MHA的精度。它将查询头分成组,每组共享键和值。通过Pytorch和einops库,可以简洁实现这一概念。GQA在保持高效性的同时接近MHA的性能,是高负载系统优化的有力工具。相关论文和非官方Pytorch实现可进一步探究。

2038 4
|
消息中间件 负载均衡 Kafka
|

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

3347 2
|
人工智能 文字识别 Java
|

AI工具【OCR 01】Java可使用的OCR工具Tess4J使用举例(身份证信息识别核心代码及信息提取方法分享)

【2月更文挑战第1天】Lept4J和Tess4J都是基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,本次介绍Tess4J

2259 0
|
Linux 网络虚拟化
|

Debian系统安装OpenVPN

Debian系统安装OpenVPN

2408 0
|
数据处理 Python
|

Python实现post请求微店商品详情数据接口

Python实现post请求微店商品详情数据接口

324 0
|
机器学习/深度学习 算法 计算机视觉
|

旋转目标检测【1】如何设计深度学习模型

平常的目标检测是平行的矩形框,“方方正正”的;但对于一些特殊场景(遥感),需要倾斜的框,才能更好贴近物体,旋转目标检测来啦~

1770 0

超材料,全球前13强生产商排名及市场份额

据QYResearch调研团队最新报告“全球超材料市场报告2023-2029”显示,预计2029年全球超材料市场规模将达到419.3亿美元,未来几年年复合增长率CAGR为65.0%。

654 0
|
传感器 编解码
|

什么是HDR?HDR与SDR的区别?

HDR(高动态范围)技术是一种近年来变得流行的图像技术,用于拍摄更自然、更真实的影像,尤其在Audio / Visual设备和数码相机等方面得到了广泛应用。在这里,我们将解释HDR技术的具体是什么,HDR与SDR的区别,HDR与4K的关系,以及HDR一般内置在哪些设备中。

4895 0
|
机器学习/深度学习 资源调度 算法
|

推荐系统[四]:精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标,超详细知识指南。

推荐系统[四]:精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标,超详细知识指南。

2291 0
来自: 人工智能平台PAI  版块
|
NoSQL 大数据 Apache
|

Apache Flink 入选 2022 年“科创中国”开源创新榜

Apache Flink 以及 Flink 开源社区重要推动者阿里巴巴,分别入选开源创新榜“开源产品”和“开源机构”。

936 0
来自: 实时计算 Flink  版块
|
JSON 编解码 缓存
|

Search template — Elastic Stack 实战手册

Elasticsearch 允许使用模板语言 mustache 来预设搜索逻辑,在实际搜索时,通过参数中的键值,对来替换模板中的占位符,最终完成搜索

1049 0
|
10小时前
|
并行计算 算法框架/工具 iOS开发
|

TorchRec在macos ARM芯片(Apple Silicon)上无法安装

JaggedTensor等在macOS ARM芯片上无法运行,主因是ARM64与x86_64架构不兼容,且TorchRec深度依赖CUDA——而Apple Silicon仅支持Metal。fbgemm-gpu缺失、Rosetta 2不支持CUDA指令,导致关键操作失败。建议改用MLX框架或标准PyTorch张量替代。

26 3
来自: 智能搜索推荐  版块
|
1月前
|
人工智能 vr&ar 开发工具
|

基于 Rokid 灵珠与 UXR 3.0 的 AR 智能卡路里识别系统实战

本项目为“AR智能卡路里计算器”,基于Rokid灵珠(AR Lite/Studio)与UXR 3.0 SDK开发。用户佩戴眼镜直视食物,系统通过空间计算实时识别并弹出热量数据,支持水果/正餐双模式切换。采用程序化3D建模、零美术资源依赖、多模态交互(键鼠→手柄→手势捏合),实现“空间即看即得”的沉浸式健康饮食辅助体验。(239字)

151 3
|
1月前
|
自然语言处理 PyTorch 算法框架/工具
|

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

404 10
|
3月前
|
SQL 人工智能 安全
|

手把手教你调出“懂你”的AI:大模型微调实战与资源管理

本文深入浅出讲解大模型微调核心知识:用生活化比喻解析学习率、训练轮数、批量大小、截断长度和LoRA秩五大关键参数;提供适配不同显存的实操配置表;分享Liger Kernel、DeepSpeed等省显存技巧;并强调定量、定性与效率三维评估。零基础也能快速上手定制专属AI。

341 11
|
3月前
|
机器学习/深度学习 人工智能 监控
|

从原理到实践:零代码也能搞定的PPO微调全攻略

本文深入浅出解析PPO(近端策略优化)算法——大模型对齐人类偏好的核心技术。通过“温和教练”比喻、四步原理拆解与实操指南,零基础也能理解其剪切机制、优势函数与稳定训练逻辑,并亲手微调出更懂你的AI。(239字)

253 0
|
3月前
|
编解码 并行计算 物联网
|

【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术,解决下载慢、授权难、显存溢出等问题,实现稳定推理。

525 1
|
4月前
|
Java 数据库 微服务
|

微服务服务注册与发现

本文介绍了微服务架构的演进与实践。针对单体架构在团队协作、发布效率、扩展性等方面的局限,微服务通过将系统拆分为多个独立部署、单一职责的小型服务,实现高内聚、低耦合,提升系统的可维护性与伸缩能力。结合Spring Cloud与Spring Cloud Alibaba技术栈,文章以黑马商城项目为例,演示了如何创建微服务工程、进行服务拆分,并使用RestTemplate实现服务间远程调用,帮助开发者掌握微服务核心开发技能。

197 0
|
4月前
|
自然语言处理 关系型数据库 MySQL
|

数据聚合、自动补全、数据同步

本文介绍了Elasticsearch中数据聚合、自动补全与数据同步的核心功能。通过Bucket、Metric、Pipeline三类聚合,可高效实现分组统计与指标计算;结合拼音分词器与Completion Suggester,实现搜索框智能补全;利用MQ或binlog监听,保障MySQL与ES间的数据实时同步,提升搜索体验与系统解耦能力。(238字)

147 3
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

287 0
|
4月前
|
SQL 关系型数据库 Java
|

3.分页

本文介绍了五种分页实现方式:MyBatis自带RowBounds内存分页、PageHelper插件分页、SQL原生分页、数组分页(查全量再subList)及拦截器分页。前两者属逻辑分页,数据量大时易溢出;后三者为物理分页,直接在数据库层分页,适合大数据量场景。总结指出:小数据量可用逻辑分页,推荐优先使用物理分页以提升性能与稳定性。(238字)

137 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

深度ai学术-从全网文献搜索到免费文献AI解析

深度AI学术(scholar.aisciresgo.com)打通科研全流程:全网智能搜索、免费获取文献、AI深度解析与精准翻译,一站式解决“搜不到、下不了、读不完”难题,助力研究者高效创新,开启智能科研新范式。

538 1
来自: 智能搜索推荐  版块
|
4月前
|
运维 持续交付 API
|

具身智能:零基础入门睿尔曼机械臂(四)—— 夹爪无响应?官方例程踩坑与排错实战

本文复盘睿尔曼机械臂夹爪“指令成功但无动作”的故障,揭示官方例程遗漏末端电压配置与通信协议初始化两大隐患。通过“软件—硬件—通信”三步排查,结合万用表测量与示教器配置,最终解决供电缺失与指令失效问题,为末端执行器部署提供可落地的实战方案。

351 6
|
4月前
|
JSON 监控 API
|

淘宝店铺所有商品API接口指南

淘宝店铺商品API支持通过HTTP请求获取指定店铺的全部商品信息,涵盖基础资料、价格库存、销量评价及图片链接,适用于电商分析与竞品监控。需AppKey+AppSecret认证,支持分页与排序查询。

258 0
|
5月前
|
SQL 人工智能 自然语言处理
|

AI 数据分析如何保障准确性?构建可信数据基础成为关键

NoETL 指标语义层的引入,将智能问数从“概率游戏”拉回到“工程科学”

466 1
|
5月前
|
人工智能 搜索推荐 物联网
|

GEO优化:AI时代的流量新密码

生成式引擎优化(GEO)是针对AI驱动的搜索引擎(如ChatGPT、DeepSeek、Perplexity等)进行内容优化的策略,旨在提升品牌在AI生成回答中的可见性。 一、 GEO优化的核心框架:SEO + RAG GEO优化主要围绕两个核心环节展开,因为AI搜索通常分为“检索”和“生成”两步。  1. SEO (S…

546 2
来自: 智能搜索推荐  版块
|
5月前
|
人工智能 安全 算法
|

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

801 15
|
6月前
|
JSON 安全 算法
|

从0到1掌握1688API:商品详情获取技巧与避坑指南

1688商品详情API通过商品ID获取商品标题、价格库存、图片视频、SKU等结构化数据,支持字段定制与批发价查询,适用于电商整合与竞品分析。采用RESTful+JSON,需AppKey/Secret签名认证,保障数据实时安全。

348 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

9
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务