|
11月前
|
人工智能 数据库
|

智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错

本文介绍如何基于RAG实现知识库问答系统的输入内容纠错功能。通过加载本地知识库、构建向量数据库,结合大语言模型对输入文本进行检索比对与纠错优化,提升问答准确性。

791 1
|
11月前
|
人工智能
|

接入通义千问3后,B站618期间商单成交效率提升5倍+

B站引入通义千问Qwen3、Qwen-VL等模型打造智能体InsightAgent,助力商业平台“花火”与“必达”提效。花火AI选人功能实现商单成交效率提升5倍以上,必达平台数据洞察效率提升3倍以上,大幅优化品牌合作流程。

318 1
|
11月前
|
人工智能
|

通义大模型千问3助力B站,在618期间,商单成交效率提升5倍+

B站接入通义千问Qwen3等模型打造智能体InsightAgent,提升商业平台“花火”和“必达”的效率。花火实现商单成交效率提升5倍以上,必达数据洞察效率提升3倍以上,推动分钟级投放决策。

379 1
|
11月前
|
人工智能 安全 架构师
|

[架构思考] 咱们写Prompt的姿势,是不是该换换了?

本文想聊聊现在 Prompt 工程里的“内卷”怪象,并扔出一个可能的新玩法。我会把现在主流的 Prompt 写法,跟咱们码农都懂的“过程式编程”做个类比,扒一扒它在搞复杂 Agent 时的局限。然后,我会介绍一种基于“状态驱动”的“涌现式 Prompt”思路,并用一个叫《自衍体》的开源项目当例子,拆解一下它的技术实现。目的很简单,就是给想搞高级 AI Agent 的兄弟们,提供一个新思路。

202 1
|
11月前
|
数据采集 自然语言处理 调度
|

优化通义大模型推理性能:企业级场景下的延迟与成本削减策略

本文基于金融、电商、医疗等领域的实战经验,深入探讨通义千问等大模型的推理优化技术栈。从计算图优化、批处理策略、量化压缩到系统架构四个维度展开,结合Python代码示例与压力测试数据,提供企业级解决方案。针对延迟敏感、高吞吐及成本敏感场景,分析性能瓶颈并提出算子融合、动态批处理、混合精度量化等方法,同时设计分布式推理架构与冷启动优化策略。通过案例展示,如电商大促场景优化,实现峰值QPS提升6.5倍、P99延迟降低53%、月度成本下降62%。文章还提供优化实施路线图,助力企业分阶段落地技术方案。

1369 5
|
11月前
|
缓存 监控 安全
|

通义大模型与现有企业系统集成实战《CRM案例分析与安全最佳实践》

本文档详细介绍了基于通义大模型的CRM系统集成架构设计与优化实践。涵盖混合部署架构演进(新增向量缓存、双通道同步)、性能基准测试对比、客户意图分析模块、商机预测系统等核心功能实现。同时,深入探讨了安全防护体系、三级缓存架构、请求批处理优化及故障处理机制,并展示了实时客户画像生成和动态提示词工程。通过实施,显著提升客服响应速度(425%)、商机识别准确率(37%)及客户满意度(15%)。最后,规划了技术演进路线图,从单点集成迈向自主优化阶段,推动业务效率与价值持续增长。

569 8
|
11月前
|
数据采集 机器学习/深度学习 搜索推荐
|

利用通义大模型构建个性化推荐系统——从数据预处理到实时API部署

本文详细介绍了基于通义大模型构建个性化推荐系统的全流程,涵盖数据预处理、模型微调、实时部署及效果优化。通过采用Qwen-72B结合LoRA技术,实现电商场景下CTR提升58%,GMV增长12.7%。文章分析了特征工程、多任务学习和性能调优的关键步骤,并探讨内存优化与蒸馏实践。最后总结了大模型在推荐系统中的适用场景与局限性,提出未来向MoE架构和因果推断方向演进的建议。

1684 11
|
11月前
|
存储 文字识别 自然语言处理
|

通义大模型在文档自动化处理中的高效部署指南(OCR集成与批量处理优化)

本文深入探讨了通义大模型在文档自动化处理中的应用,重点解决传统OCR识别精度低、效率瓶颈等问题。通过多模态编码与跨模态融合技术,通义大模型实现了高精度的文本检测与版面分析。文章详细介绍了OCR集成流程、批量处理优化策略及实战案例,展示了动态批处理和分布式架构带来的性能提升。实验结果表明,优化后系统处理速度可达210页/分钟,准确率达96.8%,单文档延迟降至0.3秒,为文档处理领域提供了高效解决方案。

1055 1
|
11月前
|
人工智能 自然语言处理 搜索推荐
|

Qwen 家族再上新!

Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,可将离散符号转化为连续向量,捕捉语义关系。结合 Qwen3 Reranker 模型,通过“初筛+精排”流程提升搜索与推荐系统的相关性排序能力。该系列模型支持多语言、提供灵活架构(0.6B-8B 参数规模),并在 MTEB 多语言榜单中排名第一。用户可通过 Hugging Face、ModelScope 和 GitHub 快速体验模型服务。

1305 3
|
11月前
|
SQL 人工智能 自然语言处理
|

别让你的大模型被忽悠了,聊聊prompt注入攻击

本文探讨了Prompt工程中的隐私与安全问题,重点分析了“奶奶漏洞”及更广泛的Prompt攻击现象,特别是Prompt注入的原理与防御手段。Prompt注入通过构造恶意输入突破模型限制,使LLM执行非预期操作。文章介绍了直接注入和间接注入类型,并提供了多种防御方案,如输入过滤、强化系统指令、接入第三方校验库及多模型协作防御。此外,还讨论了Prompt逆向工程及其正负影响,以及恶意MCP服务投毒的实际案例,如GitHub Copilot漏洞。最后提出了动态权限控制和持续安全监测等解决策略。

4931 1
|
11月前
|
人工智能 Cloud Native 数据可视化
|

微医控股与阿里云达成战略合作,双方将携手基于通义千问大模型联合打造医疗全场景智能体,共同构建医疗垂类大模型

2025年6月17日,微医控股与阿里云达成战略合作,共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型,升级微医“5+1”智能体,并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云,助力AI+医疗基础设施建设,共同制定行业标准并推广城市级AI数字健共体。目前,微医AI服务已连接全国1.2万家医院和30万名医生,健康管理会员超100万。

2187 2
|
11月前
|

TortoiseSVN使用-TortoiseSVN更换或重置登录用户

TortoiseSVN使用-TortoiseSVN更换或重置登录用户

864 5
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

视觉感知RAG×多模态推理×强化学习=VRAG-RL

通义实验室自然语言智能团队发布并开源了VRAG-RL,一种视觉感知驱动的多模态RAG推理框架。它能像人一样“边看边想”,通过粗到细的视觉仿生感知机制,逐步聚焦关键区域,精准提取信息。VRAG-RL结合强化学习与多专家采样策略,优化检索与推理路径,在多个视觉语言基准数据集上表现出色,显著提升准确性和效率。项目已发布技术方案并开源代码,支持快速部署和二次开发。

869 11
|
11月前
|
人工智能 自然语言处理 JavaScript
|

【开源项目】MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统

MaxKB4J是一款基于Java开发的开源LLM工作流应用与RAG知识库问答系统,结合MaxKB和FastGPT优势,支持智能客服、企业知识库等场景。它开箱即用,可直接上传/爬取文档,支持多种大模型(如Qwen、通义千问等),具备灵活的工作流编排能力,并无缝嵌入第三方系统。技术栈包括Vue.js、Springboot3、PostgreSQL等,提供稳定高效的智能问答解决方案。访问地址:`http://localhost:8080/ui/login`,项目详情见[Gitee](https://gitee.com/taisan/MaxKB4j)。

1745 1
|
11月前
|
存储 分布式计算 API
|

基于PAI-FeatureStore的LLM embedding功能,结合通义千问大模型,可通过以下链路实现对物品标题、内容字段的离线和在线特征管理。

本文介绍了基于PAI-FeatureStore和通义千问大模型的LLM embedding功能,实现物品标题、内容字段的离线与在线特征管理。核心内容包括:1) 离线特征生产(MaxCompute批处理),通过API生成Embedding并存储;2) 在线特征同步,实时接入数据并更新Embedding至在线存储;3) Python SDK代码示例解析;4) 关键步骤说明,如客户端初始化、参数配置等;5) 最佳实践,涵盖性能优化、数据一致性及异常处理;6) 应用场景示例,如推荐系统和搜索排序。该方案支持端到端文本特征管理,满足多种语义理解需求。

361 1
|
11月前
|
监控 数据可视化 关系型数据库
|

Aipy实战:使用Deepseek-V3生成多协议弱口令爆破调度工具

Aipy多协议弱口令爆破调度系统针对传统单协议工具碎片化、管理低效等问题,集成HTTP、SSH、MySQL等协议支持,提供图形化统一操作界面。其核心特性包括:动态资源分配的任务调度、实时可视化进度监控、智能账户锁定识别及HTML结果导出。通过上传自定义字典、配置并发数等功能,实现高效爆破,解决了多协议切换中断、人工追踪进度等痛点,为渗透测试提供自动化解决方案。

312 5
|
11月前
|
JSON 数据格式
|

本地部署的qwen3-8b模型和百炼上的qwen3-8b模型效果不一致

我在使用Function Call时发现,百炼平台上的Qwen3-8B模型与本地部署的Qwen3-8B模型效果存在差异,主要体现在函数参数生成上,本地模型常出现漏参或JSON格式错误,而百炼模型表现正常。想确认百炼平台的Qwen3-8B是否为更高版本?

1836 1
|
11月前
|
人工智能 API 开发者
|

智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果

LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。

2435 1
|
11月前
|
搜索推荐 前端开发 JavaScript
|

通义灵码深度测评报告

通义灵码是阿里云推出的智能编程平台,基于Qwen3大模型与MCP服务生态,重新定义现代软件开发范式。本文测评聚焦其四大核心功能:编程智能体(自主决策开发)、MCP工具生态(加速开发流程)、记忆感知(个性化体验)及深度开发能力(智能推荐与解释)。实测数据显示,相比传统开发,效率显著提升,如API开发提速300%。展望应用场景包括低代码开发、DevOps自动化及教育领域等。总结建议增强多语言支持、优化复杂逻辑并建立开发者社区知识库。

482 1
|
11月前
|

TortoiseSVN使用-合并分支代码

TortoiseSVN使用-合并分支代码

1937 1
|
11月前
|

TortoiseSVN使用-权限配置

TortoiseSVN使用-权限配置

402 2
|
11月前
|
机器学习/深度学习 数据采集 人工智能
|

建模世界偏好:偏好建模中的Scaling Laws

本文探讨了人类偏好建模的可扩展性,揭示其遵循Scaling Law。通过大规模训练(1.5B-72B参数)Qwen 2.5模型,使用1500万对论坛偏好数据,发现测试损失随规模指数增长而线性下降。研究提出WorldPM(Modeling World Preference),作为统一的人类偏好表征方法,在客观与主观评估中展现优势。实验表明,WorldPM可显著提升样本效率和多维度性能,成为高效的人类偏好微调基座。同时,文章反思主观评估复杂性,建议放弃简单预设,让模型自主发现人类偏好的深层规律,推动AI对齐新方向。论文与代码已开源。

337 24
|
11月前
|
自然语言处理 并行计算 机器人
|

ParScale:一种全新的大模型Scaling Law

ParScale是一种新的模型扩展路线,通过并行计算增强模型能力,无需增加参数量。它引入多个并行流处理输入,动态聚合输出,显著提升性能,尤其在数学和编程任务中表现突出。相比传统方法,ParScale仅增加1/22的内存和1/6的延迟,适合边缘设备。研究还提出两阶段训练策略,降低训练成本。未来将探索更多模型架构和大数据场景下的应用潜力。

494 1
|
11月前
|
自然语言处理 数据可视化 API
|

解锁 Qwen3 的Agent能力,CookBook来咯!

Qwen3系列模型具备强大Agent能力,但从模型到Agent仍存技术难题。为此,我们推出基于Qwen-Agent框架的3个CookBook示例,展示如何让Qwen3丝滑调用MCP Server全过程。不论是本地部署还是API调用模型,开发者均可通过Qwen-Agent完成复杂任务。CookBook包括自然语言驱动数据库操作、云端高德API地理服务及文档转思维导图等功能。Qwen-Agent封装了工具调用模板和解析器,原生支持MCP协议,大幅降低开发成本。欢迎体验并反馈。

1210 1
|
11月前
|
传感器 人工智能 自然语言处理
|

比亚迪座舱接入通义大模型,未来将联合打造更多AI智能座舱场景

比亚迪与阿里云深度合作,将通义大模型应用于智能座舱和营销服务。通过通义万相,腾势推出“AI壁纸”功能;借助通义星尘,实现“心理伴聊”等情感陪伴场景。阿里云Mobile-Agent智能体落地比亚迪座舱,支持复杂语音操作,如查询淘宝物流、订火车票等。该方案基于全视觉解决技术,具有强泛化能力,未来双方将持续拓展更多AI应用。

1446 9
|
11月前
|
定位技术
|

AiPy:国内版开源版Manus助力高考梦校情况了解

高考后择校如同相亲,需深入了解学校是否契合个人发展。本文以四川大学为例,通过AiPy助手生成可爱风格的详细介绍,涵盖地理位置、食宿环境、校园与学术氛围,以及周末旅游攻略。从望江校区的古朴到江安校区的现代化,再到周边春熙路、锦里等景点推荐,内容详实生动。虽然学术条件部分略简略,但仍为考生提供全面参考,助力做出明智选择!

255 1
|
11月前
|
机器学习/深度学习 自然语言处理 测试技术
|

Qwen3技术报告首次全公开!“混合推理模型”是这样炼成的

近日,通义千问Qwen3系列模型已开源,其技术报告也正式发布。Qwen3系列包含密集模型和混合专家(MoE)模型,参数规模从0.6B到235B不等。该模型引入了“思考模式”与“非思考模式”的动态切换机制,并采用思考预算机制优化推理性能。Qwen3支持119种语言及方言,较前代显著提升多语言能力,在多个基准测试中表现领先。此外,通过强到弱蒸馏技术,轻量级模型性能优异,且计算资源需求更低。所有Qwen3模型均采用Apache 2.0协议开源,便于社区开发与应用。

7660 30
|
11月前
|
监控 安全 网络协议
|

恶意软件无处逃!国内版“Manus”AiPy开发Windows沙箱工具,进程行为+网络传输层级监控! 头像 豪气的

NImplant.exe 是一款后渗透测试工具,可实现远程管理与持久化控制。其优点包括无文件技术、加密通信和插件扩展,但也存在被检测风险及配置复杂等问题。为深入分析其行为,我们基于 aipy 开发了 Windows 沙箱工具,针对桌面上的 NImplant.exe 进行多维度分析,涵盖进程行为、网络连接(如 TCP 请求、目标 IP/域名)、文件控制等,并生成传输层监控报告与沙箱截图。结果显示,aipy 工具响应迅速,报告清晰易读,满足分析需求。

342 1
|
11月前
|
人工智能 自然语言处理 算法
|

AI企业必看:最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布,AI企业需快速掌握政策要求以确保合规运营。该办法明确指出,利用AI生成的内容(如文本、图片、音频、视频等)需通过显性标识(如“AI生成”字样)或隐性标识(如元数据、数字水印)进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外,应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言,合规已成为必修课,需重点关注标识的规范性和溯源能力,以应对即将到来的监管要求。

2386 1
|
11月前
|
机器学习/深度学习 编解码 缓存
|

通义万相首尾帧图模型一键生成特效视频!

本文介绍了阿里通义发布的Wan2.1系列模型及其首尾帧生视频功能。该模型采用先进的DiT架构,通过高效的VAE模型降低运算成本,同时利用Full Attention机制确保生成视频的时间与空间一致性。模型训练分为三个阶段,逐步优化首尾帧生成能力及细节复刻效果。此外,文章展示了具体案例,并详细说明了训练和推理优化方法。目前,该模型已开源。

1558 9
|
11月前
|

TortoiseSVN使用-合并深度介绍

TortoiseSVN使用-合并深度介绍

201 1
|
11月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

1655 63
|
11月前
|
Java Linux 开发工具
|

Linux下版本控制器(SVN) -命令行客户端

Linux下版本控制器(SVN) -命令行客户端

370 4
|
11月前
|
人工智能 自然语言处理 搜索推荐
|

Spark-TTS: AI语音合成的"变声大师"

Spark-TTS 是一款革命性的语音合成模型,被誉为“变声大师”。它通过创新的 BiCodec 技术将语音分解为语义和全局两种 Token,实现对音色、性别、语速等属性的精细控制。结合统一的 LLM 架构,Spark-TTS 简化了传统 TTS 的复杂流程,同时提供了前所未有的灵活性。此外,团队还发布了 VoxBox 开源数据集,为行业提供标准评估基准。尽管在零样本场景下仍存改进空间,但 Spark-TTS 已经开启了语音合成新时代,让个性化、可控的 AI 语音成为可能。

1076 5
|
11月前
|
缓存 安全 Java
|

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

903 7

AiPy实战 :心情&收支日记本

展示了aipy是如何设计记录心情&收支的日记本的过程

198 2
|
12月前
|
前端开发 JavaScript
|

AJax(XHR+Get和Post+AJax的封装)

AJax(XHR+Get和Post+AJax的封装)

313 15
|
12月前
|
前端开发
|

前端使用正则表达式提取经纬度 度分秒值

前端使用正则表达式提取经纬度 度分秒值

300 14
|
12月前
|
人工智能 数据可视化 JavaScript
|

颠覆开发效率!国内首个微服务编排框架Juggle开源啦!

Juggle是国内首个开源的微服务编排框架,专注于解决企业微服务进程中接口重复开发、系统对接复杂等问题。它提供零代码、低代码和AI增强功能,通过可视化拖拽快速组装简单API为复杂接口,支持多协议、多语言脚本和流程多版本管理。相比国外框架如Conductor,Juggle更贴合国内需求,具备高效开发、企业级可靠性及信创适配等优势,助力企业实现敏捷创新与数字化转型。

1047 0
|
12月前
|
人工智能 安全 Android开发
|

手机也能跑通义Qwen3大模型,手把手教你部署!

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通!借助MNN支持,适配Android、iOS及桌面端,实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

5605 11
|
12月前
|
机器学习/深度学习 人工智能 关系型数据库
|

通义 CoGenAV 大模型音画同步感知,重新定义语音理解边界

CoGenAV 是一种创新的多模态语音理解模型,核心理念是实现“音画同步”的深度理解。通过学习 audio-visual-text 的时序对齐关系,构建更鲁棒、更通用的语音表征框架。它在视觉语音识别(VSR)、音视频语音识别(AVSR)、语音增强与分离(AVSE/AVSS)及主动说话人检测(ASD)等任务中表现出色,尤其在嘈杂环境下性能显著提升。仅需 223 小时数据训练即可媲美传统数千小时数据的效果,大幅降低训练成本。CoGenAV 支持主流平台如 GitHub、HuggingFace 和 ModelScope,助力多场景应用开发。

1436 10
|
12月前
|
JSON 前端开发 JavaScript
|

前端工具方法整理

前端工具方法整理

258 8
|
12月前
|
弹性计算 自然语言处理 Ubuntu
|

从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人

本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。

892 4
|
12月前
|
存储 人工智能 关系型数据库
|

向量数据库和嵌入模型

本文介绍了向量数据库和嵌入模型的概念及应用,重点探讨了两者在AI技术栈中的协作关系。向量数据库是一种用于存储高维向量数据的解决方案,支持相似性搜索而非传统的关系型数据库精确匹配。文中通过实例展示了如何使用阿里百炼的文本嵌入模型(text-embedding-v3)将文本向量化,并结合Qdrant向量数据库进行存储与检索。代码示例部分详细说明了从文本嵌入到向量存储及查询的完整流程,为开发者提供了实践参考。

1999 15
|
12月前
|
前端开发
|

前端使用正则表达式检查是否为十六进制字符串

前端使用正则表达式检查是否为十六进制字符串

287 6
|
12月前
|
Java Linux
|

自定义linux脚本用于快速jar包启动、停止、重启

自定义linux脚本用于快速jar包启动、停止、重启

465 29
|
12月前
|
数据可视化 数据挖掘 Python
|

Aipy实战:分析潜在的糖尿病患者

Aipy是一款本地部署、隐私性强的垂直型Agent,结合LLM与Python能力,可操控局域网设备、调用任意模型且成本低廉。本文介绍其通过分析“训练数据集.csv”学习糖尿病特征,判断“病人数据集.csv”中的潜在患者,并标记风险。过程中,Aipy快速拆解任务,在表格中新增“糖尿病风险”和“概率”列,以0/1直观展示结果,最终生成预测文件,整个流程仅耗时5分钟,高效且实用。

295 11
|
12月前
|
数据采集 人工智能 算法
|

深度合成算法备案全知道:不同角色审核的重点是什么?

深度合成技术正深刻改变生活,其算法备案对保障技术安全至关重要。目前已有3445款算法通过备案,其中服务提供者占76.78%。本文详解服务提供者与技术支持者的角色差异、审核重点及文件要求,强调两者不可混用且需独立备案。只有严格遵循备案流程,才能让深度合成技术真正造福大众,推动行业健康发展。

502 0

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

3
今日
1956
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼