|
SQL 运维 搜索推荐
|

《揭秘,阿里开源自研搜索引擎Havenask的在线检索服务》

Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask的在线检索服务,它具备高可用、高时效、低成本的优势,帮助企业和开发者量身定做适合业务发展的智能搜索服务。

85307 138
来自: 智能搜索推荐  版块
|
数据安全/隐私保护 iOS开发
|

Apple Music中的DRM保护

苹果音乐(Apple Music)是一种流媒体音乐服务,为用户提供了广泛的音乐内容。然而,为了保护音乐版权,Apple Music使用数字版权管理(DRM)技术对其音乐进行保护。DRM保护是一种加密技术,旨在防止用户未经授权地复制、传播或修改受版权保护的音乐。

2559 1
|
机器学习/深度学习 传感器 算法
|

单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法

本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~ 直接回归方法 涉及到模型包括:MonoCon、MonoDLE、MonoFlex、CUPNet、SMOKE等。 基于深度信息的方法 涉及到模型包括:MF3D、MonoGRNet、D4LCN、MonoPSR等。 基于点云信息的方法 涉及到模型包括:Pseudo lidar、DD3D、CaDDN、LPCG等。

3150 2
|
算法 Java Apache
|

运筹优化工具库介绍(二)

运筹优化工具库介绍

2749 0
|
机器学习/深度学习 运维 算法
|

梯度&散度&旋度&峰度&偏度你分得清楚吗?驻点&鞍点你分得清楚吗?曲率&斜率你分得清楚吗?

本文介绍了四种常见的物理量:加速度,速度,位移和力学功。详细介绍了它们的定义、计算以及在物理学和工程学领域中的应用。此外,本文还介绍了四种与物理量相关的概念:向量、标量、质量和密度。 数学,物理,机器学习领域常见概念区分

3719 0
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
|

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

305 6
|
2月前
|
人工智能 自然语言处理 机器人
|

告别机械回复:三步微调AI模型,打造会“读心”的智能客服

本文详解智能客服“需求感知”核心技术:通过BERT微调实现情感识别(感知情绪)、意图分类(理解目的)与实体抽取(提取关键信息),三者协同输出结构化理解。附完整Python实战代码,零基础可上手,并介绍低代码平台方案,助你快速打造有温度的AI客服大脑。(239字)

320 4
|
2月前
|
缓存 负载均衡 安全
|

Nginx 反向代理:原理、优势与配置指南

Nginx反向代理是核心服务器架构技术,可实现请求转发、负载均衡、高可用与安全防护。它隐藏后端服务器,自动剔除故障节点,并支持SSL终止、缓存等高级功能,配置简洁灵活,广泛应用于高性能Web系统。

344 13
|
2月前
|
人工智能 自然语言处理 架构师
|

AI Agent 职业路线全指南:从智能体普及浪潮到分层能力构建

2026年,“AI+”进入产业级落地期,智能体成为数字化转型核心基础设施。全球市场规模达2.3万亿,我国2027年普及率将超70%。人才缺口巨大,教育部已设“智能体技术应用”新专业。本文系统梳理四类职业路径(管理者、架构师、多智能体专家、垂直领域专家)及企业治理框架,助力职场人锚定定位、实战进阶。(239字)

460 1
|
3月前
|
XML JSON API
|

淘宝商品详情API(tb.item_get)

本文详解淘宝开放平台商品详情核心API(如item_get),涵盖对接流程、权限申请、请求规范、参数说明及返回字段,并列举代购集运、选品分析、比价导购等典型应用场景,助力开发者合规高效获取商品数据。(239字)

396 3
|
4月前
|
存储 安全 编译器
|

C++数据类型:

C++基本数据类型包括bool、char、int、float、double等,支持signed、unsigned、short、long修饰。wchar_t用于宽字符,typedef可为类型定义别名,enum定义枚举常量。支持static_cast、dynamic_cast、const_cast和reinterpret_cast四种类型转换,实现安全或强制类型变换。

285 1
|
4月前
|
存储 缓存 JavaScript
|

Vue3 Composition API深度解析:原理、用法与迁移实践

本文深度解析Vue3 Composition API的核心优势、常用API、底层原理与迁移实践,对比Options API的局限性,详解ref、reactive、watch、生命周期钩子等用法,剖析基于Proxy的响应式机制,并提供渐进式迁移策略,助开发者高效掌握Vue3开发范式。

411 0
|
4月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍敏捷开发中工时评估的关键——人日估算方法,涵盖开发、自测、联调、测试及发布各阶段周期参考,并提供常见需求如增删改查、导入导出、跨服务调用等的典型人日参考,助力团队科学规划迭代。

231 0
|
5月前
|
弹性计算 运维 API
|

用错工具比没工具更可怕:Ansible vs Terraform 实战对比,用最接地气的方式讲清楚

用错工具比没工具更可怕:Ansible vs Terraform 实战对比,用最接地气的方式讲清楚

512 22
|
5月前
|
JSON 供应链 数据挖掘
|

1688买家/卖家店铺订单API说明

1688订单API是阿里巴巴B2B平台的核心接口,支持订单全生命周期管理。采用RESTful架构,返回JSON数据,可查询订单状态、商品及物流等50+字段,适用于电商整合与数据分析。支持分页、多条件筛选与状态更新,助力自动化运营。

522 1
|
5月前
|
JSON 监控 数据挖掘
|

从零到一:淘宝店铺订单API接入全流程指南

淘宝订单API通过订单号获取完整交易数据,支持实时查询买家信息、商品明细及物流状态,适用于订单同步、物流监控与数据分析。采用RESTful设计,JSON格式响应,安全高效,助力电商自动化运营。

684 4
|
6月前
|
存储 前端开发
|

【实战案例】火语言 RPA 采集小说站已完结书名(自动翻页判断),保存到Excel 全流程(附完整脚本)

自动采集起点中文网完本小说书名,支持翻页检测与数据存储。脚本逐页抓取小说名并保存至Excel,最多采集50页,智能判断翻页逻辑,确保数据完整,适用于批量获取完结书籍信息。

406 5
|
6月前
|
算法 搜索推荐 大数据
|

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

644 8
|
7月前
|
数据采集 存储 缓存
|

LLM + 抓取:让学术文献检索更聪明

结合爬虫与大模型,打造懂语义的学术检索助手:自动抓取最新NLP+爬虫论文,经清洗、向量化与RAG增强,由LLM提炼贡献,告别关键词匹配,实现精准智能问答。

795 0
|
8月前
|
消息中间件 Java 数据库
|

Java 基于 DDD 分层架构实战从基础到精通最新实操全流程指南

本文详解基于Java的领域驱动设计(DDD)分层架构实战,结合Spring Boot 3.x、Spring Data JPA 3.x等最新技术栈,通过电商订单系统案例展示如何构建清晰、可维护的微服务架构。内容涵盖项目结构设计、各层实现细节及关键技术点,助力开发者掌握DDD在复杂业务系统中的应用。

1492 0
|
8月前
|
定位技术 数据处理 API
|

手把手教你怎么做人口密度热力图

本文介绍了使用Python和ArcGIS绘制人口密度地图的方法。Python部分包括地图数据获取、格式转换、数据整合及可视化;ArcGIS部分涵盖地图投影、数据连接、人口密度计算与图例设置。同时提供了C++代码用于数据分割,并介绍了如何利用高德API获取地址经纬度,实现地图标注。

1179 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。

2029 7
来自: 人工智能平台PAI  版块
|
12月前
|
机器学习/深度学习 人工智能 算法
|

零训练成本优化LLM: 11种LLM权重合并策略原理与MergeKit实战配置

随着大语言模型快速发展,如何优化性能同时降低计算成本成为关键问题。本文系统介绍了11种零训练成本的LLM权重合并策略,涵盖线性权重平均(Model Soup)、球面插值(SLERP)、任务算术、TIES-Merging等方法,通过MergeKit工具提供实战配置示例。无论研究者还是开发者,都能从中找到高效优化方案,在有限资源下实现模型性能显著提升。

699 10
|
自然语言处理 资源调度 并行计算
|

从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比

本文深入探讨了十种主流的大语言模型(LLM)服务引擎和工具,涵盖从轻量级本地部署到高性能企业级解决方案,详细分析了它们的技术特点、优势及局限性,旨在为研究人员和工程团队提供适合不同应用场景的技术方案。内容涉及WebLLM、LM Studio、Ollama、vLLM、LightLLM、OpenLLM、HuggingFace TGI、GPT4ALL、llama.cpp及Triton Inference Server与TensorRT-LLM等。

2159 7
|
API 数据安全/隐私保护 开发者
|

实时获取小红书详情 API 数据

小红书详情API数据获取指南:注册开发者账号,创建应用并申请接口权限,构建请求获取笔记详情,使用Python等语言处理响应数据。需遵守使用规则,注意调用频率和数据安全。

1619 6
|
缓存 安全 网络安全
|

静态代理IP访问失败的问题解释?

本文介绍了在浏览器中使用静态代理IP访问失败的多种可能原因,包括代理设置错误、代理服务器问题、站点策略限制、网络连接问题、浏览器设置问题、代理类型不支持及认证问题等,并提供了相应的解决建议。

759 1
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 并行计算 PyTorch
|

ONNX 优化技巧:加速模型推理

【8月更文第27天】ONNX (Open Neural Network Exchange) 是一个开放格式,用于表示机器学习模型,使模型能够在多种框架之间进行转换。ONNX Runtime (ORT) 是一个高效的推理引擎,旨在加速模型的部署。本文将介绍如何使用 ONNX Runtime 和相关工具来优化模型的推理速度和资源消耗。

7602 4
|
机器学习/深度学习 人工智能 供应链
|

AI在各行业的具体应用与未来展望

人工智能(Artificial Intelligence, AI)作为一项颠覆性技术,正在逐步改变我们的生活和工作方式。从语音助手到自动驾驶汽车,AI的应用已经深入到各个领域。本文将详细探讨AI在不同行业中的具体应用,以及未来可能的发展方向。

4397 6
|
存储 数据可视化 前端开发
|

数仓常用分层与维度建模

本文介绍了数据仓库的分层结构和维度建模。数仓通常分为ODS、DIM、DWD、DWS和ADS五层,各层负责不同的数据处理阶段。维度建模是数据组织方法,包括星型和雪花模型。星型模型简单直观,查询性能高,适合简单查询;雪花模型则通过规范化减少冗余,提高数据一致性和结构复杂性,但可能影响查询效率。选择模型需根据业务需求和数据复杂性来定。

3529 0
|
SQL 缓存 分布式计算
|

手把手教你解决 Hive 的数据倾斜

数据倾斜是 Hive 中影响任务执行效率的现象,表现为某些任务处理的数据量或耗时远超其他任务。根本原因是 Shuffle 后 Key 分布不均,导致部分 Reduce 负载过高。常见场景包括空值聚合、不可拆分大文件、数值膨胀、不同数据类型 Join、Count(distinct) 计算以及表 Join 操作。解决方法包括过滤空值、转换数据类型、调整聚合策略、使用 MapJoin 等。通过合理优化,如设置 `hive.groupby.skewindata` 和 `hive.map.aggr` 参数,可以有效缓解数据倾斜问题。

2697 2
|
SQL NoSQL Java
|

Flink SQL 问题之执行报错如何解决

Flink SQL报错通常指在使用Apache Flink的SQL接口执行数据处理任务时遇到的问题;本合集将收集常见的Flink SQL报错情况及其解决方法,帮助用户迅速恢复数据处理流程。

1322 2
来自: 实时计算 Flink  版块
|
机器学习/深度学习 PyTorch 算法框架/工具
|

为什么大型语言模型都在使用 SwiGLU 作为激活函数?

SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对他进行详细的介绍。

2027 9
|
机器学习/深度学习 算法 计算机视觉
|

多目标跟踪 | 评测指标

多目标跟踪器的性能需要某些指标来进行度量,目前使用比较广泛的评测指标主要有 Bernardin 等人定义的 CLEAR MOT 指标、Ristani 等人定义的 ID scores 指标以及最新的 Luiten 等人定义的HOTA 指标。

3559 2
|
机器学习/深度学习 开发工具 git
|

开发专题 | 1 :下载 huggingface 上模型的正确姿势

本文主要介绍如何以正确的方式下载 huggingface 上的模型

15307 4
|
11天前
|
数据采集 传感器 人工智能
|

AI质检+MES如何重构智能制造质量闭环

AI质检与MES深-度融合,构建“感知-分析-决策-执行”质量闭环:实现100%全检、自动拦截、一物一档、工艺自优化及缺-陷预-测;通过OPC UA/MQTT/边缘网关打通设备数据,支撑全流程精-准质量追溯。

115 4
|
2月前
|
数据采集 供应链 物联网
|

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

309 4
|
2月前
|
机器学习/深度学习 数据采集 算法
|

Scikit-learn 入门指南

scikit-learn 是 Python 最主流的机器学习库,提供统一、简洁的 API,覆盖数据预处理、模型训练到评估部署全流程。专注传统算法,轻量高效,无缝集成 NumPy/Pandas,是教学、原型开发与生产部署的首选工具。(239字)

574 15
|
3月前
|
人工智能 API
|

智能体来了从 0 到 1:为什么一开始必须划清智能体的任务边界?

智能体开发切忌“全能幻想”!本文指出:任务边界(输入范围、工具权限、决策规则)是智能体从Demo走向落地的生命线——它不设限能力,而是将LLM的概率输出转化为可控、稳定、可评估的工程系统。边界清晰,方能降幻觉、控成本、提准确率。

228 6
|
4月前
|
自然语言处理 fastjson Java
|

FastJson:大面积故障规避案例

本文记录了一次由Kotlin与Java混编工程中误用`{}`赋值引发的FastJson反序列化崩溃问题。因将空对象误写为lambda表达式,导致FastJson内部静态标记位`kotlin_error`被置为true且无法恢复,进而使整个应用反序列化链路瘫痪。问题隐蔽性强,排查耗时两天,最终通过源码分析定位。文章反思了多语言混编下的语法混淆风险、框架信任边界及灰度发布的重要性,强调Bug是成长的阶梯。

178 0
|
4月前
|
关系型数据库 应用服务中间件 nginx
|

容器引擎Docker

Docker是一种轻量级容器化技术,通过镜像打包应用及依赖,实现跨环境一致部署。它利用容器隔离运行,解决开发、测试、生产环境差异问题,相比虚拟机更高效便捷,提升交付效率与系统资源利用率。

204 0
|
4月前
|
消息中间件 存储 数据挖掘
|

应用架构图

本文介绍应用架构图的设计原理,涵盖单体与分布式架构。从展现层、业务层、数据层到基础层,阐述各层职责及技术选型逻辑,并通过调用关系明确系统边界,支撑业务落地。

194 0
|
4月前
|
安全 Java 数据安全/隐私保护
|

2.OAuth2.0实战案例

本文介绍基于Spring Boot与Spring Cloud的OAuth2安全认证实现,涵盖父工程搭建、资源服务与授权服务配置,并演示授权码、简化、密码及客户端四种模式的全流程测试,实现安全的分布式系统权限控制。

192 0
|
4月前
|
SQL Java 数据库连接
|

MyBatis-Plus 超详细教程:从入门到实战,一站式掌握

MyBatis-Plus 是 MyBatis 的增强工具,简化单表 CRUD 操作,无需编写 XML,支持条件构造器、分页插件、逻辑删除、枚举与 JSON 处理,提升开发效率,兼顾灵活性与便捷性,助力从入门到实战一站式掌握。

325 0
|
4月前
|
SQL 存储 Apache
|

三、Hive DDL数据库操作

Hive 中的数据库(Schema)是构建数据仓库的基础单位。这次我们来了解 Hive 中创建、查看、切换、修改与删除数据库的 DDL 操作语法与用法,涵盖 COMMENT、LOCATION、DBPROPERTIES 等常用参数,辅以丰富示例与练习,助你扎实掌握 Hive 数据库管理核心能力。

275 11
|
4月前
|
机器学习/深度学习 人工智能 监控
|

构建AI智能体:六十五、模型智能训练控制:早停机制在深度学习中的应用解析

文章摘要:早停机制是深度学习中防止过拟合的关键技术,通过在验证集性能停止改善时终止训练,自动平衡模型复杂度和泛化能力。其核心价值包括自动防过拟合、提升训练效率(节省30-80%计算资源)、简化调参过程。关键参数设置涉及patience(容忍轮次)、min_delta(最小改善阈值)和restore_best_weights(恢复最佳权重)。实现流程包括训练轮次监控、验证集评估和性能改善判断,通过U型曲线分析可直观理解其工作原理。

544 20
|
4月前
|
前端开发 安全 JavaScript
|

网站代码 网站源代码 网页源代码 网页代码网站

本文深入解析网站源代码与网页源代码的核心概念及区别,阐述其作为互联网技术基石的关键作用。通过剖析PageAdmin等典型源码案例,揭示源代码在技术学习、网站优化、安全维护等方面的核心价值,并探讨如何高效利用代码网站资源进行创新开发。文章强调在尊重版权的前提下,开发者可借助源码资源提升能力,推动网页技术持续发展。

1405 10
来自: 大数据计算 MaxCompute  版块
|
4月前
|
数据挖掘 BI API
|

微店店铺所有商品API接口指南

微店商品API支持通过店铺ID获取全部商品信息,提供分页、状态筛选与多维度排序功能,适用于商品管理、数据统计及跨平台同步。返回商品ID、标题、价格、库存、主图等详细信息,助力高效运营。

207 2
|
5月前
|
机器学习/深度学习 JSON 搜索推荐
|

1688图片搜索API技术文档

1688图片搜索API(拍立淘)是阿里巴巴官方图像搜货工具,支持通过图片URL或Base64编码查找1688平台同款或相似商品。基于深度学习技术,精准匹配商品ID、标题、价格、销量、供应商等全维度信息,命中率超85%,单次响应≤1秒,支持批量调用与分页排序,适用于电商比价、选品采购等场景。

618 0
|
7月前
|
存储 编解码 监控
|

针对3-15分钟视频的抽帧策略:让Qwen2.5 VL 32B理解视频内容

针对3-15分钟视频,提出高效抽帧策略:通过每5-10秒定间隔或关键帧检测方法,提取30-100帧关键图像,结合时间均匀采样与运动变化捕捉,降低冗余,提升Qwen2.5 VL 32B对视频内容的理解效率与准确性。

1405 2
|
7月前
|
JavaScript NoSQL 前端开发
|

搭建实时足球比分系统从零到一的实战指南

构建实时足球比分系统需聚焦数据流架构:从API/爬虫获取数据,经后端处理存储,通过REST/WebSocket提供接口,前端展示。推荐使用专业API保障稳定性,结合Python/Node.js、PostgreSQL/MongoDB、Redis缓存与WebSocket实现实时推送。优先考虑法律合规与高并发应对,建议逐步迭代开发,亦可借助现成插件或服务快速上线。(238字)

796 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69319
内容
128
活动
439806
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务