|
2月前
|
数据挖掘 C++ 计算机视觉
|

Python:ImportError:DLL loadfailed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败 报错解决

在进行文件夹内人脸识别与对比聚类时,遇到onnxruntime库报错,通常因版本不兼容或环境冲突导致。本文整理了五种解决方案:降级onnxruntime至1.14.1、重装库、区分GPU/CPU版本、安装Visual C++运行库、创建Python虚拟环境。通过版本匹配与环境隔离,有效解决DLL初始化失败等问题,提升项目稳定性。

1034 8
|
11月前
|
数据安全/隐私保护 UED 异构计算
|

【大模型私有化部署要花多少钱?】一张图看懂你的钱用在哪

本文探讨了高性价比实现DeepSeek大模型私有化部署的方法,分为两部分: 一是定义大模型性能指标,包括系统级(吞吐量、并发数)与用户体验级(首token生成时间、单token生成时间)指标,并通过roofline模型分析性能瓶颈; 二是评估私有化部署成本,对比不同硬件(如H20和4090)及模型选择,结合业务需求优化资源配置。适合关注数据安全与成本效益的企业参考。

2843 1
|
自然语言处理 并行计算 算法
|

cp-sat求解器介绍及使用案例

cp-sat求解器介绍及使用案例 更多文章欢迎关注我的微信公众号:Python学习杂记

3916 1
|
9天前
|
人工智能 自然语言处理 运维
|

GEO推广服务深度解读:AI搜索时代的企业流量新范式

生成式AI重塑搜索生态,“关键词搜索”正被“自然语言提问+AI生成答案”取代。GEO(生成式引擎优化)应运而生——它不追求页面排名,而致力于让企业内容成为AI回答中的权威引用源。本文系统解析GEO的技术原理、核心价值、落地路径与未来趋势,助力企业抢占AI搜索时代增长先机。(239字)

107 0
|
18天前
|
SQL 存储 分布式计算
|

【赵渝强老师】基于Hudi的大数据湖仓一体架构

Apache Hudi(Hadoop Upserts Delete and Incremental)是开源的流式数据湖平台,支持事务、高效upsert/delete、增量处理、多引擎SQL读写(Spark/Flink/Trino等),自动管理小文件与压缩,兼容云存储,助力构建湖仓一体架构。

223 3
|
26天前
|
数据采集 存储 监控
|

显存不够?16G显卡驾驭13B模型的计算与优化全指南

显存不够也能玩转大模型!本文详解如何用16G显卡成功微调13B参数模型,从显存精准计算、INT8量化、LoRA低秩适配到激活检查点优化,手把手教你规避OOM风险。结合实战代码与监控技巧,显存占用压至14.5GB内,效果显著优于7B模型。低成本实现高效大模型微调,个人开发者和小团队必备指南!

254 0
|
移动开发 小程序 前端开发
|

uniap开发微信小程序如何在线预览pdf文件

这是一段关于在线预览和处理PDF的多方案说明,包括使用JavaScript库PDF.js(如`pdfh5.js`)实现H5页面预览,提供QQ群和技术博客链接以获取帮助和支持。还介绍了两个适用于Uni-app的插件,一个用于H5、小程序和App中的PDF预览和下载,另一个专门解决手机端PDF预览问题。此外,还详细描述了在Uni-app中使用微信小程序API`wx.openDocument`显示PDF的步骤,包括上传文件、配置权限和编写代码。

3691 0
|
5天前
|
数据库 C++
|

向量维度、距离函数,如何影响召回结果

本文揭示向量检索效果不佳的根源常被误判:问题不在embedding模型本身,而在于被忽视的底层选择——向量维度与距离函数。二者共同定义了“相似性”的本质,而非仅调节精度。维度决定语义表达自由度与错误类型,距离函数(L2/Cosine/Dot)则确立“何为相近”的世界观。二者强耦合,直接塑造召回空间。调参前,先问:你更怕漏召,还是误召?

60 6
|
8天前
|
存储 人工智能 JSON
|

从入门到实践:不懂代码也能微调大模型,普通人AI进阶指南

本文详解大模型微调:为何需要(让AI更懂你)、原理何在(参数微调如“专项特训”)、如何实操(四步完成数据准备→云端训练→参数配置→效果评估),并指出工具平民化正使个性化AI触手可及。(239字)

102 4
|
机器学习/深度学习 人工智能 自然语言处理
|

前端大模型入门(三):编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

本文介绍了大规模语言模型(LLM)中的两个核心概念:Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID,而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法,帮助读者理解其基本原理和应用场景。

4734 1
|
自然语言处理 搜索推荐 机器人
|

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型,预训练于多样化数据集,支持18亿至720亿参数规模。在多模态英文任务中表现出色,且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互,提供智能体验。然而,模型在逻辑题和指令理解上存在不足,需在特定领域进行优化。

5256 1
|
数据采集 机器学习/深度学习 编解码
|

数字孪生核心技术揭秘(三):倾斜摄影

对真实世界的自动化三维重建一直是CG/CV行业前赴后继不断尝试解决的难题;目前业内的进展,对于微型场景如单个饮料瓶等物体,结合AI已经可以实现语义化切割的自动三维重建,媲美人工建模。但是对于室外大场景的自动三维重建,从算法到采集硬件等等,都还未能做到类似微型场景的理想水平。 目前,倾斜摄影虽然在模型语义化分割、模型精度等方面不太完美,但是在贴近真实世界、过程自动化、实施成本、整体技术链成熟度等方面,已经是市面上最理想的低成本大规模三维重建技术方案。 随着国家政策的鼓励和“全景中国”的推进,预计倾斜摄影将会成为数字孪生项目的主流三维模型来源之一。

11338 2
来自: 数据可视化DataV  版块
|
4天前
|
存储 人工智能 弹性计算
|

一文读懂云服务器:工作原理与核心作用

云服务器通过虚拟化与分布式技术,将物理服务器集群转化为按需分配的弹性计算资源,解决资源浪费、降低部署门槛。支撑个人开发、企业运维及AI、直播、政务等千行百业,是数字经济的核心基础设施。

59 8
|
存储 JSON Oracle
|

【最佳实践】esrally:Elasticsearch 官方压测工具及运用详解

由于 Elasticsearch(后文简称 es) 的简单易用及其在大数据处理方面的良好性能,越来越多的公司选用 es 作为自己的业务解决方案。然而在引入新的解决方案前,不免要做一番调研和测试,本文便是介绍官方的一个 es 压测工具 esrally,希望能为大家带来帮助。

20616 0
|
7天前
|
数据采集 存储 前端开发
|

Scrapy框架入门指南

Scrapy是Python高性能工业级爬虫框架,基于Twisted异步架构,支持高并发、自动去重、重试与反爬。内置Spider、Item、Pipeline等模块,实现请求调度、数据提取到存储的标准化流程,大幅提升开发效率与系统稳定性。(239字)

84 0
|
5月前
|
人工智能 Ubuntu 前端开发
|

Dify部署全栈指南:AI从Ubuntu配置到HTTPS自动化的10倍秘籍

本文档介绍如何部署Dify后端服务及前端界面,涵盖系统环境要求、依赖安装、代码拉取、环境变量配置、服务启动、数据库管理及常见问题解决方案,适用于开发与生产环境部署。

1232 1
|
6月前
|
JSON API 开发者
|

闲鱼商品详情API数据解析(附代码)

闲鱼商品详情API(goodfish.item_get)支持通过商品ID获取标题、价格、描述等信息,适用于比价、推荐系统及市场分析。接口支持GET/POST请求,返回JSON格式数据,并提供Python调用示例,便于开发者快速集成。

679 0
|
Python
|

使用ARIMA预测股票未来走势

Python实现使用ARIMA预测股票未来走势

1834 1
|
3天前
|
数据采集 JSON 监控
|

京东宝贝评论数据采集指南

京东商品评论API提供结构化评论数据,涵盖评分、晒单、追评、商家回复等20+字段,支持多维筛选与排序,适用于舆情监控、竞品分析、用户画像等场景,需认证后合规调用。(239字)

57 11
|
4月前
|
算法 搜索推荐 大数据
|

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

351 8
|
7月前
|
存储 缓存 NoSQL
|

Redis核心数据结构与分布式锁实现详解

Redis 是高性能键值数据库,支持多种数据结构,如字符串、列表、集合、哈希、有序集合等,广泛用于缓存、消息队列和实时数据处理。本文详解其核心数据结构及分布式锁实现,帮助开发者提升系统性能与并发控制能力。

506 0
|
存储 监控 数据可视化
|

常见的分布式定时任务调度框架

分布式定时任务调度框架用于在分布式系统中管理和调度定时任务,确保任务按预定时间和频率执行。其核心概念包括Job(任务)、Trigger(触发器)、Executor(执行器)和Scheduler(调度器)。这类框架应具备任务管理、任务监控、良好的可扩展性和高可用性等功能。常用的Java生态中的分布式任务调度框架有Quartz Scheduler、ElasticJob和XXL-JOB。

4976 66
|
25天前
|
存储 自然语言处理 监控
|

10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑

本文分享10万级文档RAG系统从Demo到生产的实战经验,剖析检索慢、召回率低、部署复杂三大痛点,涵盖文档切分、Embedding选型、向量库优化、重排序与生成约束等关键步骤,并提供可落地的工程方案与评估方法,助力构建高效、稳定的企业级RAG系统。

306 3
|
6月前
|
SQL 关系型数据库 Apache
|

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现,并结合 Flink CDC 详细介绍了整库同步的解决方案,助力构建更加高效、稳定的实时数据处理体系。

2657 0
来自: 实时计算 Flink  版块
|
6月前
|
人工智能 JSON 监控
|

从零开始构建AI Agent评估体系:12种LangSmith评估方法详解

AI Agent的评估需覆盖其整个生命周期,从开发到部署,综合考量事实准确性、推理路径、工具选择、结构化输出、多轮对话及实时性能等维度。LangSmith作为主流评估平台,提供了一套全面的评估框架,支持12种评估技术,包括基于标准答案、程序性分析及观察性评估。这些技术可有效监控Agent各组件表现,确保其在真实场景中的稳定性和可靠性。

2814 0
|
Serverless SQL 容灾
|

实时数仓Hologres V2.2发布,Serverless Computing降本20%

实时数仓Hologres V2.2发布,Serverless Computing降本20%

59177 66
来自: 实时数仓 Hologres  版块
|
SQL 分布式计算 Oracle
|

数据同步工具DataX的安装

数据同步工具DataX的安装

3924 0
|
机器学习/深度学习 人工智能 自然语言处理
|

视觉 注意力机制——通道注意力、空间注意力、自注意力

本文介绍注意力机制的概念和基本原理,并站在计算机视觉CV角度,进一步介绍通道注意力、空间注意力、混合注意力、自注意力等。

14252 58
|
3天前
|
数据采集 人工智能 数据可视化
|

从群发文案到私人定制:手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语:拆解人情世故为6个可量化要素,人工打磨3000条高质量种子数据,30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板,而是带共同记忆、有温度的真挚表达——技术不止提效,更可传递心意。(239字)

55 8
|
4天前
|
JSON 监控 供应链
|

亚马逊商品详情数据获取实战:从商品链接提取 ID 到解析详情

亚马逊商品详情API(PA-API v5与SP-API)是官方合规数据接口,分别面向第三方开发者与入驻卖家,支持获取ASIN/关键词对应的商品标题、价格、图片、评价等核心信息,广泛用于比价、选品、竞品分析及Listing优化。接入稳定、数据权威。(239字)

55 0
|
5天前
|
数据采集 XML 前端开发
|

BeautifulSoup:Python网页解析的优雅利器

BeautifulSoup是Python最易用的HTML/XML解析库,以超强容错性与人性化API著称。它能将混乱网页转为结构化树,支持CSS选择器、多种解析器(推荐lxml),无需正则即可快速提取数据,是中小型爬虫、教学及原型开发首选工具。(239字)

55 1
|
6天前
|
数据采集 人工智能 自然语言处理
|

大模型微调后,如何判断它是不是“变聪明”了?这套评估方法论请收好。

本文系统阐述大模型微调效果评估的核心价值与实践方法:强调评估是检验泛化能力的“试金石”,须坚持人工主观评估(重业务适配性)与自动化客观评估(重量化指标)双轨并行;详解测试集构建、指标选择、基线对比等关键步骤,助力从0到1建立科学、可信、可迭代的评估体系。(239字)

55 3
|
3月前
|
存储 NoSQL Go
|

英伟达谷歌都在用的(开源特征存储平台Feast)-架构学习指南

欢迎来到Feast的世界!这是一个开源的生产级机器学习特征存储系统,专为解决特征数据高效管理与服务而设计。本指南将带你从零掌握其架构、核心概念与实战技巧,助你像架构师一样思考,像工匠一样编码,轻松应对训练与推理的一致性挑战。

592 2
|
3天前
|
存储 算法 数据处理
|

向量数据库从零搭建:文本语义检索实战与工程要点

本文记录作者从零搭建向量数据库的实践历程:始于“只想用现成方案”,却因检索抖动、参数敏感、延迟飙升等真实问题,被迫深入理解其工程本质。全文以构建最小可用文本语义检索系统为目标,清晰拆解八大关键环节——embedding选型、向量存储与压缩、暴力检索的局限、ANN近似搜索的必要性、索引取舍、查询路径设计、元数据融合及性能瓶颈识别。强调:搭建不是为了替代成熟产品,而是为了真正掌握向量数据库的底层逻辑与工程权衡。

54 4
|
5天前
|
安全 算法 测试技术
|

PPO / DPO 对安全边界的影响:压制还是迁移风险

本文揭示对齐训练(PPO/DPO)的深层误区:它不降低风险总量,而是迁移风险形态——压制显性违规,却强化灰区输出的稳定性与隐蔽性。风险未被消除,只是从“直白越界”变为“委婉越界”,更难检测、评估与拦截。安全不能只靠对齐,需模型、系统、策略三层协同。

54 4
|
10月前
|
网络协议 网络安全 网络架构
|

开发者急盼!Cisco Packet Tracer超详细下载安装教程,附中文版插件使用步骤!

Cisco Packet Tracer是思科推出的专业路由器模拟器,适用于学习IOS配置、故障排查及网络拓扑构建。支持多种协议(STP、OSPF等),含无线功能与安全设备。本文提供下载链接、安装教程及高级功能介绍,如复杂网络仿真、可视化调试、自动化脚本和行业场景模拟等,助你高效学习网络技术并启用中文语言包。

6385 17
|
10月前
|
数据采集 SQL 人工智能
|

长文详解|DataWorks Data+AI一体化开发实战图谱

DataWorks是一站式智能大数据开发治理平台,内置阿里巴巴15年大数据建设方法论,深度适配阿里云MaxCompute、EMR、Hologres、Flink、PAI 等数十种大数据和AI计算服务,为数仓、数据湖、OpenLake湖仓一体数据架构提供智能化ETL开发、数据分析与主动式数据资产治理服务,助力“Data+AI”全生命周期的数据管理。

1633 5
|
机器学习/深度学习 算法 PyTorch
|

深度强化学习中SAC算法:数学原理、网络架构及其PyTorch实现

软演员-评论家算法(Soft Actor-Critic, SAC)是深度强化学习领域的重要进展,基于最大熵框架优化策略,在探索与利用之间实现动态平衡。SAC通过双Q网络设计和自适应温度参数,提升了训练稳定性和样本效率。本文详细解析了SAC的数学原理、网络架构及PyTorch实现,涵盖演员网络的动作采样与对数概率计算、评论家网络的Q值估计及其损失函数,并介绍了完整的SAC智能体实现流程。SAC在连续动作空间中表现出色,具有高样本效率和稳定的训练过程,适合实际应用场景。

4560 7
|
存储 Ubuntu 关系型数据库
|

Ubuntu 20.04 卸载与安装 MySQL 5.7 详细教程

该文档提供了在Ubuntu上卸载和安装MySQL 5.7的步骤。首先,通过`apt`命令卸载所有MySQL相关软件包及配置。然后,下载特定版本(5.7.32)的MySQL安装包,解压并安装所需依赖。接着,按照特定顺序安装解压后的deb包,并在安装过程中设置root用户的密码。安装完成后,启动MySQL服务,连接数据库并验证。最后,提到了开启GTID和二进制日志的配置方法。

5156 5
|
7天前
|
安全
|

任务比例设置,如何影响模型的行为偏好

多任务微调中,任务比例绝非简单数据配比,而是塑造模型行为偏好的核心杠杆:它决定模型“更愿成为谁”——影响主任务吸附、风险偏好、风格迁移与隐性遗忘。平均分配最危险,后期微调即“性格旋钮”。比例即价值选择。

76 0
|
17天前
|
数据采集 人工智能 自然语言处理
|

Agentic Search: AI驱动的下一代企业搜索

Agentic Search是阿里云OpenSearch推出的AI搜索新范式,以智能体(Agent)为核心,融合深度检索、多步推理、工具调用与多模态理解,实现从“被动响应”到“主动执行”的跃迁。支持对话、规划、自适应三模式,覆盖问答、研究、客服、报告生成等全场景,助力企业知识库升级为动态业务引擎。

184 2
|
1月前
|
人工智能 自然语言处理 算法
|

最近比较火的GEO适合哪些行业的推广?

GEO(生成式引擎优化)正重塑营销格局,通过优化内容结构与语义逻辑,抢占AI问答场景的引用权。据IDC与中国信通院数据,2025年全球市场规模超120亿美元,中国占55.4%。其在本地生活、跨境电商、文旅、房地产、教育、B2B制造及金融医疗等行业广泛应用,助力企业实现精准获客、提升转化率并构建长期数字资产,成为AI时代营销新基建。

401 3
|
3月前
|
缓存 关系型数据库 MySQL
|

网站源码二次开发基础:环境搭建与简单修改步骤

本文围绕 PageAdmin(PA)开源 CMS 展开,聚焦新手二次开发核心:先明确 PHP、MySQL 等环境需求,以 PHPStudy 为例详解安装配置、源码部署、数据库创建及系统安装步骤;再阐述后台登录、基础信息修改、栏目与内容管理、简单模板调整及缓存清理等实操流程,为新手提供清晰易懂的入门指南。

536 11
来自: 人工智能平台PAI  版块
|
6月前
|
人工智能 分布式计算 自然语言处理
|

多智能体系统设计:5种编排模式解决复杂AI任务

本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。

1256 10
|
存储 人工智能 搜索推荐
|

RAG系统的7个检索指标:信息检索任务准确性评估指南

大型语言模型(LLMs)在生成式AI领域备受关注,但其知识局限性和幻觉问题仍具挑战。检索增强生成(RAG)通过引入外部知识和上下文,有效解决了这些问题,并成为2024年最具影响力的AI技术之一。RAG评估需超越简单的实现方式,建立有效的性能度量标准。本文重点讨论了七个核心检索指标,包括准确率、精确率、召回率、F1分数、平均倒数排名(MRR)、平均精确率均值(MAP)和归一化折损累积增益(nDCG),为评估和优化RAG系统提供了重要依据。这些指标不仅在RAG中发挥作用,还广泛应用于搜索引擎、电子商务、推荐系统等领域。

7349 2
|
1天前
|
算法 数据可视化 数据安全/隐私保护
|

Python图像处理利器:Pillow (PIL)入门指南

本教程系统讲解Python图像处理库Pillow:从环境搭建、核心概念(Image对象、模式、坐标系)到实战项目(批量图片处理+水印+缩略图),涵盖最佳实践、常见陷阱及NumPy/OpenCV集成等进阶内容,助你高效掌握图像处理全栈技能。(239字)

52 2
|
5天前
|
人工智能 算法 数据挖掘
|

硬核认可!Aloudata 荣膺数智技术系列榜单三项大奖

以 NoETL 数据语义编织技术体系,助力平滑落地以 Data Agent 为代表的 AI 应用,实现数据普惠

52 2
|
6天前
|
人工智能 编解码 监控
|

告别“爆显存”:LoRA技术如何用1%的参数,解锁大模型微调自由?

本文深入浅出解析LoRA(低秩自适应)技术:它通过冻结大模型主干、仅训练两个小矩阵(B·A),实现显存节省99%+、性能保留95%+,让RTX 4090等消费卡也能高效微调大模型。含原理、QLoRA量化、六步实操与效果评估,助你零基础打造法律/医疗等垂直领域专属AI。(239字)

82 5
|
20天前
|
机器学习/深度学习 移动开发 人工智能
|

大模型应用:庖丁解牛:QKV机制详解,大模型的注意力之眼.4

QKV机制是Transformer注意力的核心:Query(提问)、Key(标识)、Value(信息)三者通过点积计算相似度,Softmax归一化后加权融合Value,实现动态上下文感知。它能捕捉长程依赖,解决代词消解、一词多义等问题,支撑大模型强大语言理解能力。

262 7
|
2月前
|
人工智能 智能设计 算法
|

2026 GEO生成搜索优化技术白皮书:章节详解与案例深度分析

周有贵,GEO专家,深耕AI时代流量入口变革,倡导从SEO到GEO(生成式引擎优化)的认知重构,聚焦“被发现-被理解-被推荐”三层框架,推动企业通过结构化内容、信任资产与平台适配,实现AI信源卡位。

540 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务