|
11月前
|
并行计算 PyTorch 算法框架/工具
|

阿里云PAI-部署Qwen2-VL-72B

阿里云PAI-部署Qwen2-VL-72B踩坑实录

4750 1
来自: 人工智能平台PAI  版块
|
存储 编解码 iOS开发
|

视频文件格式:MOV与MP4格式的区别是什么?

视频文件有多种格式,很多人在下载时不知道该选择哪种文件格式。不同格式有不同特点,各自有优缺点。本文将详细介绍常见的MOV和MP4的特点与区别,以供读者了解及选择。

8815 2
|
6天前
|
缓存 安全 搜索推荐
|

网页模板源码-网站源码建设方式

本文聚焦免费开源企业网站源码模板,解析其低成本、高灵活等优势,推荐 PageAdmin CMS、Joomla、帝国 CMS 等主流模板并说明适配场景,阐述选择方法与二次开发优化要点,为企业低成本高效搭建网站提供实用指引。

87 2
来自: 人工智能平台PAI  版块
|
16天前
|
人工智能 运维 自然语言处理
|

3 个真实 GEO 成功案例 + 3 步关键词排名秘籍!开发者 / 企业快速落地 GEO,流量 & 转化双提升

本文聚焦 GEO 真实获客案例与实操技巧,通过教培机构、工业设备商、小众茶叶品牌三个实测案例,展现 GEO 落地成效:教培机构靠升学数据咨询量暴增 210%,工业设备商盯准技术痛点让单笔订单翻 5 倍,茶叶品牌借产地溯源实现客单价从 200 元飙至 500 元。核心分享三步零门槛关键词法:列客户痛点、加场景限定、数据筛词,还拆解了不同平台关键词偏好。提醒效果需 1-3 个月积累,内容需真实且持续优化。新手可直接对照案例思路,结合自身行业调整,快速抢占搜索流量,精准获客。

319 1
|
存储 分布式计算 OLAP
|

Apache Paimon统一大数据湖存储底座

Apache Paimon,始于Flink Table Store,发展为独立的Apache顶级项目,专注流式数据湖存储。它提供统一存储底座,支持流、批、OLAP,优化了CDC入湖、流式链路构建和极速OLAP查询。Paimon社区快速增长,集成Flink、Spark等计算引擎,阿里巴巴在内部广泛应用,旨在打造统一湖存储,打通Serverless Flink、MaxCompute等,欢迎大家扫码参与体验阿里云上的 Flink+Paimon 的流批一体服务。

19905 8
来自: 实时计算 Flink  版块
|
SQL 存储 Java
|

Hive 特殊的数据类型 Array、Map、Struct

在Hive中,`Array`、`Map`和`Struct`是三种特殊的数据类型。`Array`用于存储相同类型的列表,如`select array(1, "1", 2, 3, 4, 5)`会产生一个整数数组。`Map`是键值对集合,键值类型需一致,如`select map(1, 2, 3, "4")`会产生一个整数到整数的映射。`Struct`表示结构体,有固定数量和类型的字段,如`select struct(1, 2, 3, 4)`创建一个无名结构体。这些类型支持嵌套使用,允许更复杂的结构数据存储。例如,可以创建一个包含用户结构体的数组来存储多用户信息

2824 0
|
4月前
|
人工智能 JSON 监控
|

从零开始构建AI Agent评估体系:12种LangSmith评估方法详解

AI Agent的评估需覆盖其整个生命周期,从开发到部署,综合考量事实准确性、推理路径、工具选择、结构化输出、多轮对话及实时性能等维度。LangSmith作为主流评估平台,提供了一套全面的评估框架,支持12种评估技术,包括基于标准答案、程序性分析及观察性评估。这些技术可有效监控Agent各组件表现,确保其在真实场景中的稳定性和可靠性。

2029 0
|
人工智能 JSON 自然语言处理
|

基于阿里云通义千问的AI模型应用开发指南

阿里云通义千问是阿里巴巴集团推出的多模态大语言模型平台,提供了丰富的API和接口,支持多种AI应用场景,如文本生成、图像生成和对话交互等。本文将详细介绍阿里云通义千问的产品功能,并展示如何使用其API来构建一个简单的AI应用,包括程序代码和具体操作流程,以帮助开发者快速上手。

3141 3
|
机器学习/深度学习 人工智能 自然语言处理
|

前端大模型入门(三):编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

本文介绍了大规模语言模型(LLM)中的两个核心概念:Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID,而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法,帮助读者理解其基本原理和应用场景。

4057 1
|
9月前
|
机器学习/深度学习 人工智能 数据可视化
|

生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较

本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据,类比为沙堡的侵蚀与重建;Flow Matching构建分布间连续路径的速度场,如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣:扩散模型适合复杂数据,Flow Matching采样效率更高。文章结合实例解析两者的差异与联系,并探讨其在图像、音频等领域的实际应用,为生成建模提供了全面视角。

1670 1
|
传感器 编解码
|

什么是HDR?HDR与SDR的区别?

HDR(高动态范围)技术是一种近年来变得流行的图像技术,用于拍摄更自然、更真实的影像,尤其在Audio / Visual设备和数码相机等方面得到了广泛应用。在这里,我们将解释HDR技术的具体是什么,HDR与SDR的区别,HDR与4K的关系,以及HDR一般内置在哪些设备中。

4248 0
|
存储 JSON Oracle
|

【最佳实践】esrally:Elasticsearch 官方压测工具及运用详解

由于 Elasticsearch(后文简称 es) 的简单易用及其在大数据处理方面的良好性能,越来越多的公司选用 es 作为自己的业务解决方案。然而在引入新的解决方案前,不免要做一番调研和测试,本文便是介绍官方的一个 es 压测工具 esrally,希望能为大家带来帮助。

20060 0
|
6天前
|
C++
|

报错解决:Selenium报错“Message: session not created: probably user data directory is already in use” 等

本文详解Selenium操作Edge浏览器时常见的“版本不匹配”和“进程冲突”问题,分析报错根源,并提供手动替换驱动与webdriver-manager自动管理两种解决方案,助你高效稳定实现浏览器自动化。

84 6
|
6月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

959 4
|
数据采集 机器学习/深度学习 编解码
|

数字孪生核心技术揭秘(三):倾斜摄影

对真实世界的自动化三维重建一直是CG/CV行业前赴后继不断尝试解决的难题;目前业内的进展,对于微型场景如单个饮料瓶等物体,结合AI已经可以实现语义化切割的自动三维重建,媲美人工建模。但是对于室外大场景的自动三维重建,从算法到采集硬件等等,都还未能做到类似微型场景的理想水平。 目前,倾斜摄影虽然在模型语义化分割、模型精度等方面不太完美,但是在贴近真实世界、过程自动化、实施成本、整体技术链成熟度等方面,已经是市面上最理想的低成本大规模三维重建技术方案。 随着国家政策的鼓励和“全景中国”的推进,预计倾斜摄影将会成为数字孪生项目的主流三维模型来源之一。

10863 2
来自: 数据可视化DataV  版块
|
数据格式 JSON 流计算
|

Delta元数据解析

本文介绍Delta的元数据管理相关内容,包括文件夹结构,元数据类型以及元数据产生流程等

2333 0
|
7月前
|
存储 JSON 数据可视化
|

从零构建知识图谱:使用大语言模型处理复杂数据的11步实践指南

本文将基于相关理论知识和方法构建一个完整的端到端项目,系统展示如何利用知识图谱方法对大规模数据进行处理和分析。

1536 7
|
9月前
|
机器学习/深度学习 算法
|

广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术

广义优势估计(GAE)由Schulman等人于2016年提出,是近端策略优化(PPO)算法的核心理论基础。它通过平衡偏差与方差,解决了强化学习中的信用分配问题,即如何准确判定历史动作对延迟奖励的贡献。GAE基于资格迹和TD-λ思想,采用n步优势的指数加权平均方法,将优势函数有效集成到损失函数中,为策略优化提供稳定梯度信号。相比TD-λ,GAE更适用于现代策略梯度方法,推动了高效强化学习算法的发展。

1422 3
|
2月前
|
数据采集 机器学习/深度学习 人工智能
|

反爬虫机制深度解析:从基础防御到高级对抗的完整技术实战

本文系统阐述了反爬虫技术的演进与实践,涵盖基础IP限制、User-Agent检测,到验证码、行为分析及AI智能识别等多层防御体系,结合代码实例与架构图,全面解析爬虫攻防博弈,并展望智能化、合规化的发展趋势。

797 0
|
6月前
|
安全 Linux Android开发
|

如何将Kindle电子书下载到电脑:技术流程与操作解析

随着数字阅读兴起,Kindle成为主流电子书平台。然而,Amazon的封闭生态和DRM限制,使用户难以灵活管理书籍。本文从技术角度出发,讲解如何合法下载Kindle电子书至电脑,包括使用Kindle for PC、USB导出及进阶方案(如Android模拟器、WINE环境)。同时介绍文件格式处理、自动化备份与阅读体验优化方法,并强调版权合规的重要性,助您构建个人数字图书馆。

2314 3
|
7月前
|
定位技术 API
|

HarmonyOS实战:高德地图定位功能完整流程详解

本文详细介绍了在鸿蒙系统中使用高德地图实现完整定位功能的流程。首先分析需求,包括权限申请、检查GPS状态、单次或多次定位选择以及定位失败处理。接着通过代码实现具体步骤:添加定位权限、申请用户权限、检查GPS开关状态、启动定位服务,并处理定位成功或失败的情况。若定位失败,可尝试获取历史定位信息或使用默认位置。最后总结指出,虽然定位功能基础简单,但完整的流程与细节处理才是关键。建议读者动手实践,掌握高德地图定位功能的使用。

906 15
|
自然语言处理 算法 搜索推荐
|

NLTK模块使用详解

NLTK(Natural Language Toolkit)是基于Python的自然语言处理工具集,提供了丰富的功能和语料库。本文详细介绍了NLTK的安装、基本功能、语料库加载、词频统计、停用词去除、分词分句、词干提取、词形还原、词性标注以及WordNet的使用方法。通过示例代码,帮助读者快速掌握NLTK的核心功能。

2636 1
|
编译器 API 定位技术
|

API和SDK的区别

API 和 SDK 的区别在于:API 是一组定义了软件组件之间交互规范的接口,用于实现不同软件组件之间的通信;而 SDK 是一个全面的工具集合,包含 API、编译器、调试器、文档等,用于特定平台的应用程序开发。SDK 范围更广,内容更丰富,更具体和具象化,适合复杂的开发需求;API 则更加抽象,侧重于功能的定义和调用方式。

1306 2
|
5天前
|
机器学习/深度学习 数据采集 算法
|

Python | K折交叉验证的参数优化的GradientBoost及SHAP可解释性分析回归预测算法

本教程介绍基于Python的GradientBoost回归预测算法,结合K折交叉验证与贝叶斯/随机/网格搜索进行超参数优化,并引入SHAP实现模型可解释性分析。涵盖数据预处理、模型训练、多维度评估及可视化,适用于地球科学、医学、工程、经济等多个领域的连续变量预测任务,代码与数据齐全,适合科研与实际应用。

80 2
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
|

从零构建短视频推荐系统:双塔算法架构解析与代码实现

短视频推荐看似“读心”,实则依赖双塔推荐系统:用户塔与物品塔分别将行为与内容编码为向量,通过相似度匹配实现精准推送。本文解析其架构原理、技术实现与工程挑战,揭秘抖音等平台如何用AI抓住你的注意力。

845 7
|
10月前
|
人工智能 安全 数据库
|

AiCodeAudit-基于Ai大模型的自动代码审计工具

本文介绍了基于OpenAI大模型的自动化代码安全审计工具AiCodeAudit,通过图结构构建项目依赖关系,提高代码审计准确性。文章涵盖概要、整体架构流程、技术名词解释及效果演示,详细说明了工具的工作原理和使用方法。未来,AI大模型有望成为代码审计的重要工具,助力软件安全。项目地址:[GitHub](https://github.com/xy200303/AiCodeAudit)。

4018 9
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

人工智能与情感计算:AI如何理解人类情感

人工智能与情感计算:AI如何理解人类情感

2005 20
|
12月前
|
存储 监控 数据可视化
|

常见的分布式定时任务调度框架

分布式定时任务调度框架用于在分布式系统中管理和调度定时任务,确保任务按预定时间和频率执行。其核心概念包括Job(任务)、Trigger(触发器)、Executor(执行器)和Scheduler(调度器)。这类框架应具备任务管理、任务监控、良好的可扩展性和高可用性等功能。常用的Java生态中的分布式任务调度框架有Quartz Scheduler、ElasticJob和XXL-JOB。

4454 66
|
API Apache 数据库
|

Flink CDC 3.0 正式发布,详细解读新一代实时数据集成框架

Flink CDC 于 2023 年 12 月 7 日重磅推出了其全新的 3.0 版本 ~

109921 8
来自: 实时计算 Flink  版块
|
5天前
|
运维 监控 数据挖掘
|

运维数据分析:别再只会翻日志了,真正的价值在“洞察”

运维数据分析:别再只会翻日志了,真正的价值在“洞察”

79 16
|
人工智能 数据可视化 数据处理
|

推荐2款免费开源的标注工具,支持大模型对话标注

【LabelLLM】一款开源免费的大模型对话标注平台,专为优化大型语言模型的数据标注过程设计。支持灵活配置与多模态数据(音频、图像、视频),具备全面任务管理和AI辅助标注功能,大幅提升标注效率与准确性。了解更多请前往https://github.com/opendatalab/LabelLLM 【LabelU】一款轻量级开源标注工具,支持图像、视频、音频的高效标注。特色功能包括多功能图像处理、视频和音频分析等,简易灵活,支持多种数据格式输出。了解更多请前往https://github.com/opendatalab/labelU

3797 11
|
存储 Python
|

数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例

数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例

5636 2

【免费资料】IEEE33节点系统参数及拓扑图visio

初学者入门配电网可参考经典的IEEE 33节点系统,此系统在文献中广泛应用。资源包括节点和支路参数的Excel表格及Visio的网络拓扑图,可免费下载。配电网以闭环设计增强灵活性和可靠性,故障恢复涉及网络拓扑约束。提供的MATLAB相关链接探讨了孤岛、重构及故障恢复策略。

3563 0
|
存储 Ubuntu 关系型数据库
|

Ubuntu 20.04 卸载与安装 MySQL 5.7 详细教程

该文档提供了在Ubuntu上卸载和安装MySQL 5.7的步骤。首先,通过`apt`命令卸载所有MySQL相关软件包及配置。然后,下载特定版本(5.7.32)的MySQL安装包,解压并安装所需依赖。接着,按照特定顺序安装解压后的deb包,并在安装过程中设置root用户的密码。安装完成后,启动MySQL服务,连接数据库并验证。最后,提到了开启GTID和二进制日志的配置方法。

4662 5
|
9月前
|
关系型数据库 MySQL 数据库
|

基于Flink CDC 开发,支持Web-UI的实时KingBase 连接器,三大模式无缝切换,效率翻倍!

TIS 是一款基于Web-UI的开源大数据集成工具,通过与人大金仓Kingbase的深度整合,提供高效、灵活的实时数据集成方案。它支持增量数据监听和实时写入,兼容MySQL、PostgreSQL和Oracle模式,无需编写复杂脚本,操作简单直观,特别适合非专业开发人员使用。TIS率先实现了Kingbase CDC连接器的整合,成为业界首个开箱即用的Kingbase CDC数据同步解决方案,助力企业数字化转型。

2032 5
|
机器学习/深度学习 传感器 编解码
|

【多传感器融合】BEVFusion: 激光雷达和摄像头融合框架 NeurIPS 2022

BEVFusion提出一个融合多摄像头和激光雷达数据的框架,可用于3D检测。在自动驾驶领域,通过独立处理并融合摄像头和激光雷达数据,可以显著提升3D对象检测的准确性和稳健性,尤其是在激光雷达可能出现故障的真实场景中。

4131 57
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型:人工智能发展的引擎

大模型:人工智能发展的引擎

1186 0
|
大数据
|

欢迎加入飞天大数据平台交流群

欢迎加入飞天大数据平台交流群,了解最新的产品资讯与最佳实践

2617 0
|
人工智能 JSON 运维
|

AI大模型运维开发探索第三篇:深入浅出运维智能体

大模型出现伊始,我们就在SREWorks开源社区征集相关的实验案例。玦离同学提供了面向大数据HDFS集群的智能体案例,非常好地完成了运维诊断的目标。于是基于这一系列的实验和探索。本文详细介绍智能体在运维诊断中的应用探索。

4139 3
来自: 大数据运维SREWorks  版块
|
传感器 机器学习/深度学习 编解码
|

智能驾驶--语义分割 公开数据集 汇总

本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。

2506 0
|
自然语言处理 并行计算 算法
|

cp-sat求解器介绍及使用案例

cp-sat求解器介绍及使用案例 更多文章欢迎关注我的微信公众号:Python学习杂记

3169 1
|
Windows
|

【电脑控制手机屏幕】windows11、10自带投屏功能,三步解决

想用电脑控制手机,但是下载第三方软件好麻烦,只需三步骤即可使用windows系统自带投屏插件实现投屏功能

2829 0
|
7天前
|
运维 监控 Cloud Native
|

不是监控不行,是你观测得不够:聊聊新一代可观测性(Observability)的真相

不是监控不行,是你观测得不够:聊聊新一代可观测性(Observability)的真相

85 7
|
19天前
|
Python Windows
|

Miniconda 安装与环境配置全流程图解(2025 最新版)

Miniconda 可以看作是 Anaconda 的“轻装版”,只自带 conda 包管理器与基础的 Python 运行时。它体积小、部署速度快,特别适合按需创建与管理虚拟环境的用户。与 Anaconda 相比,Miniconda 不会预先安装一大堆科学计算库,你可以根据项目需求再单独选择、安装需要的包,因此整体更轻巧、更灵活。 本文将手把手演示在 Windows 下安装 Miniconda 的全过程:从下载安装器、完成向导配置、设置环境变量,到最后的基础验证与简单示例,帮助你迅速把 Miniconda 用起来。

341 11
来自: 人工智能平台PAI  版块
|
9月前
|
存储 机器学习/深度学习 数据建模
|

数据建模入门指南:从懵懂小白到高手的第一步

数据建模入门指南:从懵懂小白到高手的第一步

1554 15
|
机器学习/深度学习 算法
|

概率分布深度解析:PMF、PDF和CDF的技术指南

本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。

1579 15
|
Linux 开发工具 git
|

pip的常用命令和常见问题的解决

当使用pip命令安装Python包时,有时候可以通过使用镜像地址来加速下载速度或解决访问限制的问题。以下是一些常用的pip命令和常见的镜像地址:

1869 3
|
2月前
|
机器学习/深度学习 算法 前端开发
|

别再用均值填充了!MICE算法教你正确处理缺失数据

MICE是一种基于迭代链式方程的缺失值插补方法,通过构建后验分布并生成多个完整数据集,有效量化不确定性。相比简单填补,MICE利用变量间复杂关系,提升插补准确性,适用于多变量关联、缺失率高的场景。本文结合PMM与线性回归,详解其机制并对比效果,验证其在统计推断中的优势。

1090 11
|
7月前
|
存储 机器学习/深度学习 人工智能
|

多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本

本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。

2029 0
|
8月前
|
机器学习/深度学习 存储 算法
|

18个常用的强化学习算法整理:从基础方法到高级模型的理论技术与代码实现

本文系统讲解从基本强化学习方法到高级技术(如PPO、A3C、PlaNet等)的实现原理与编码过程,旨在通过理论结合代码的方式,构建对强化学习算法的全面理解。

2147 10

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67713
内容
128
活动
439500
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务