|
机器学习/深度学习 人工智能 达摩院
|

魔搭中文开源模型社区:模型即服务-达摩院通义视觉生成大模型(上)

魔搭中文开源模型社区:模型即服务-

1788 0
|
17天前
|
机器学习/深度学习 数据采集 人工智能
|

大模型应用:大模型参数调优:结合本地模型对比多种组合探索差异.7

本文系统解析大模型核心生成参数(如temperature、top_p、top_k、repetition_penalty等)的原理、作用机制与实践影响,结合Qwen1.5-1.8B本地模型实测,通过创意写作、技术问答、代码生成三类任务对比分析参数组合效果,并提供分场景调优建议与黄金配置方案,助力从“调参新手”进阶为“生成质量掌控者”。

140 21
|
9月前
|
弹性计算 Docker 容器
|

构建dify

本教程介绍如何在ECS服务器上使用Docker构建Dify。首先拉取最新镜像`langgenius/dify-web:latest`,然后通过命令运行该镜像,映射端口并设置环境变量。需在安全组中添加入方向规则,放行指定端口(如3000)。完成后保存规则,初始化安装Dify,并登录Web界面验证部署是否成功。

1063 17
|
10月前
|
人工智能 Java 开发者
|

通义灵码:当AI成为你的编程搭档,效率革命已经到来

本文介绍了通义灵码作为AI编程伙伴的革命性意义及其技术特点。基于阿里云通义代码大模型CodeQwen1.5,它具备多模态代码理解、意图推理和跨语言知识融合能力,可重构开发者工作流,从智能编码到Debug预警再到文档自动化全面提升效率。数据显示,其能将常规开发时间缩短60%,错误率下降43%,新技术上手速度提升2倍。未来,通义灵码将推动需求-代码双向翻译、架构自演进等全新编程形态,助力开发者聚焦更高价值领域,开启人机共生的编程新时代。

589 10
|
18天前
|
人工智能 JSON 前端开发
|

智能体来了:从 0 到 1:企业级 LLM Agent 的工程化落地实践

本文作者Agentcometoo分享企业级AI Agent工程化落地实践,直击通用框架在真实业务中的四大痛点:多工具协同不可控、高并发状态难追踪、异常缺乏工程兜底、Debug成本高。提出轻量可控的ReAct架构,强调“可预测、可追踪、可兜底”,通过工具基类约束、主循环结构化输出、步数限制与日志追踪等工程手段,实现LLM Agent稳定上线。

166 8
|
5月前
|
消息中间件 Ubuntu Java
|

SpringBoot整合MQTT实战:基于EMQX实现双向设备通信

本教程指导在Ubuntu上部署EMQX 5.9.0并集成Spring Boot实现MQTT双向通信,涵盖服务器搭建、客户端配置及生产实践,助您快速构建企业级物联网消息系统。

2143 1
|
7月前
|
存储 缓存 资源调度
|

# Qwen3-8B 的 TTFT 性能分析:16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型,支持最长 32,768 token 上下文,适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术,提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms,32K 输入下约 250-300ms,适用于文档摘要与长对话交互。

2122 8
|
9月前
|
Arthas 存储 监控
|

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

707 8
|
编解码 Cloud Native 算法
|

通义万相:视觉生成大模型再进化

通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。

6495 5
|
存储 自然语言处理 关系型数据库
|

基于阿里云通义千问开发智能客服与问答系统

在企业的数字化转型过程中,智能客服系统已成为提高客户满意度和降低运营成本的重要手段。阿里云的通义千问作为一款强大的大语言模型,具有自然语言理解、对话生成、知识检索等能力,非常适合用来开发智能客服与问答系统。 通过本博客,我们将演示如何基于阿里云的通义千问模型,结合阿里云相关产品如函数计算(FC)、API网关、RDS等,搭建一个功能齐全的智能客服系统。

1733 5

昇腾910A部署Qwen2-7B教程

Qwen2-7BS适配昇腾910A教程。

2623 0

通义大模型使用指南之通义听悟

本文介绍了阿里云通义平台的注册和使用,主要包括两个部分:注册和功能介绍。用户可以通过访问网址 <https://tongyi.aliyun.com/> 进行注册。在功能介绍中,重点讲解了通义听悟的功能,它提供实时语音转文字、音视频文件转文字、智能总结和中英互译服务。用户可以体验实时录音并标记重点、问题和代办事项,方便会议记录和整理。此外,通义听悟还支持上传音视频文件转写和播客链接转写,以及浏览器插件用于处理网页、手机和微信上的语音内容。

2952 0
|
8月前
|
人工智能 自然语言处理 算法
|

AI企业必看:最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布,AI企业需快速掌握政策要求以确保合规运营。该办法明确指出,利用AI生成的内容(如文本、图片、音频、视频等)需通过显性标识(如“AI生成”字样)或隐性标识(如元数据、数字水印)进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外,应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言,合规已成为必修课,需重点关注标识的规范性和溯源能力,以应对即将到来的监管要求。

1678 1
|
9月前
|
JSON 缓存 并行计算
|

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

阿里巴巴近期开源了通义千问Qwen3大语言模型(LLM),包含两款混合专家模型(MoE)235B-A22B与30B-A3B,以及六款稠密模型(Dense)从0.6B到32B不等。开发者可基于NVIDIA GPU使用TensorRT-LLM、Ollama、SGLang、vLLM等框架高效部署Qwen3系列模型,实现快速词元生成和生产级应用开发。

2109 8
|
10月前
|
人工智能 自然语言处理 供应链
|

为什么一定要做Agent智能体?

作者通过深入分析、理解、归纳,最后解答了“为什么一定要做Agent”这个问题。

1788 41
|
10月前
|
Arthas 监控 Java
|

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

1634 10
|
11月前
|
数据采集 编解码 缓存
|

通义万相,开源!

通义万相,开源!

1962 2
|
机器学习/深度学习 数据采集 人工智能
|

基于Qwen 2.5的世界科学智能大赛冠军方案

本方案基于通义千问模型,采用多阶段的Easy-to-Hard数据合成方法,模拟人类学习的由简单到困难的思路,逐阶段构造多样化的训练数据。数据生成阶段,训练数据的标签,引入了“Chain-of-Thought”思维链模式,生成多样化的推理路径,逐步对齐推理Scaling Law。训练阶段,采用了LoRA对通义千问32B模型在合成数据集上进行参数高效微调。推理阶段,使用了4bit低精度量化,并结合vLLM框架进行推理加速,最终达到准确性、效率和显存利用率的统一。

921 2
|
机器学习/深度学习 算法 物联网
|

大模型进阶微调篇(一):以定制化3B模型为例,各种微调方法对比-选LoRA还是PPO,所需显存内存资源为多少?

本文介绍了两种大模型微调方法——LoRA(低秩适应)和PPO(近端策略优化)。LoRA通过引入低秩矩阵微调部分权重,适合资源受限环境,具有资源节省和训练速度快的优势,适用于监督学习和简单交互场景。PPO基于策略优化,适合需要用户交互反馈的场景,能够适应复杂反馈并动态调整策略,适用于强化学习和复杂用户交互。文章还对比了两者的资源消耗和适用数据规模,帮助读者根据具体需求选择最合适的微调策略。

4453 5
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问开源模型——改变自然语言处理的未来

众所周知,自然语言处理是人工智能领域的一个重要分支,也是近年来备受瞩目的领域之一。而通义千问开源模型作为自然语言处理领域的重要成就之一,近年来也引起了广泛的关注和讨论,那么接下来就来简单聊聊通义千问开源模型。

2031 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十一、信息论完全指南:从基础概念到在大模型中的实际应用

摘要: 信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念: 信息量:衡量事件意外程度,公式为I(x)=-log₂P(x) 信息熵:评估系统不确定性,H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵:分析多变量关系及条件不确定性 互信息:量化变量间共享信息量 KL散度:衡量概率分布差异 交叉熵:模型训练的核心损失函数 在大语言模型中,这些概念被广泛应用于: 训练阶段:交叉熵优化预测,KL散度防止过拟合 推理阶段:温度参数调节生成文本的创造性(高熵增加多样性)

402 2
|
4月前
|
人工智能 搜索推荐 程序员
|

从程序员到UP主:一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令,结构化拆解内容创作流程。输入主题、类型等信息,结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案,提升创作效率与视频质量。

661 2
|
弹性计算 并行计算 Shell
|

在云上搭建CosyVoice环境-保姆级教程

发现个好玩的模型,阿里最近开源的,可以便捷的复刻人声,本文提供全套安装过程。仓库地址:https://github.com/FunAudioLLM/CosyVoice。

6344 1
|
26天前
|
SQL 数据可视化 JavaScript
|

构建AI智能体:九十九、大模型性能评估技巧:Qwen1.5的完整测试框架与可视化分析

本文介绍了Qwen1.5-1.8B-Chat轻量级大模型的本地部署与评估框架。针对硬件资源有限的个人开发者,该模型仅需4GB内存即可在CPU环境流畅运行。通过构建完整的评估体系,文章详细测试了推理速度(4.09 tokens/s)、内存占用(7GB参数内存+2.4GB推理内存)等基础性能指标,并评估了中文理解(0.75/1.0)、知识准确性(0.67)、多轮对话连贯性(1.0/1.0)、创造性(0.78/1.0)和代码生成能力(0.9/1.0)。测试结果显示该模型在创意生成和中文理解方面表现突出

261 10
|
5月前
|
机器学习/深度学习 缓存 人工智能
|

MoE模型加速秘籍:vLLM混合KV缓存管理解析​

vLLM是高效分布式大模型推理引擎,采用分页注意力、连续批处理等技术实现高吞吐与低延迟。本文详解其架构设计与关键技术,包括KV缓存管理、调度机制、推测解码与分布式扩展等,助你深入理解性能优化原理。

1061 1
|
6月前
|
存储 人工智能 自然语言处理
|

大模型备案攻略—2025全网最新最详细解读版

随着AI技术的发展,大模型备案成为行业热点。本文详解备案所需具体条件与注意事项,涵盖模型功能、适用场景、研制情况、安全评估及备案材料等核心内容,帮助企业全面了解备案流程,规避合规风险,顺利推进产品上线。

1659 2
|
9月前
|
人工智能 自然语言处理 安全
|

中央网信办部署开展“清朗·整治AI技术滥用”专项行动

中央网信办近日印发通知,启动为期3个月的“清朗·整治AI技术滥用”专项行动,旨在规范AI服务与应用,促进行业健康发展,保障公民权益。行动分两个阶段:第一阶段聚焦源头治理,包括清理违规AI程序、加强生成内容标识管理等;第二阶段集中整治利用AI制作谣言、不实信息、色情低俗内容及侵权行为等问题。此次行动将强化平台责任,提升技术检测能力,推动AI技术合法合规使用,维护网络环境清朗。

466 1
|
人工智能
|

基于qwen2和qwenvl的自动批改作业应用!

针对作业批改中常见的问题,如低质量作业、大量简单作业耗时、需初筛异常作业等,开发了一款自动批改作业的应用。该应用通过备份作业文件、获取文档内容、利用AI生成评语,并保存关键信息与日志,简化了教师的工作流程,提高了效率。应用设计简洁,易于扩展,支持图片转文字处理,适合教育场景使用。

4005 1
|
Java 编译器 测试技术
|

全面理解Maven Compiler Plugin-Maven编译插件

【10月更文挑战第16天】

3595 1
|
数据可视化 物联网 PyTorch
|

通义千问7B模型开源,魔搭最佳实践来了

通义千问开源!阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B-Base和对话模型Qwen-7B-Chat,两款模型均已上线ModelScope魔搭社区,开源、免费、可商用,欢迎大家来体验。

49112 59
|
19天前
|
数据采集 自然语言处理 监控
|

大模型应用:情感分析模型微调深度分析:从基础预测到性能优化.6

本文系统讲解中文情感分析模型微调后的深度评估方法,涵盖微调流程、预测置信度分析、混淆矩阵可视化、错误模式挖掘及系统性偏差诊断,强调超越准确率的可解释性分析,助力构建可靠、鲁棒的AI系统。

176 13
|
28天前
|
机器学习/深度学习 人工智能 安全
|

数据安全智能体:AI驱动的新一代企业数据安全防护范式

随着大语言模型(LLM)技术的快速演进,以及企业数字化转型的深入推进,传统的被动式数据安全防护体系已难以满足现代威胁的防御需求。国内首款数据安全智能体通过将生成式AI、自适应防护机制、多智能体协作等前沿技术融为一体,实现了从”人工堆砌”向”智能主动”的范式转变。

217 6
|
6月前
|
人工智能 自然语言处理 安全
|

大模型备案要点一次过【附材料清单详解】

广东省最新公布一批大模型备案名单,新增14款备案模型、6款登记模型,累计达80款备案、23款登记。文章详解大模型备案流程、周期(5-10个月)、要求(主体资质、数据合规、内容安全、模型完成度)、所需材料(备案表、安全评估报告、服务协议、语料标注规则等)及完整备案流程(初审、自测、提交、整改、终审、公示)。为大模型企业备案提供全面指导。

1459 2
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|

视觉感知RAG×多模态推理×强化学习=VRAG-RL

通义实验室自然语言智能团队发布并开源了VRAG-RL,一种视觉感知驱动的多模态RAG推理框架。它能像人一样“边看边想”,通过粗到细的视觉仿生感知机制,逐步聚焦关键区域,精准提取信息。VRAG-RL结合强化学习与多专家采样策略,优化检索与推理路径,在多个视觉语言基准数据集上表现出色,显著提升准确性和效率。项目已发布技术方案并开源代码,支持快速部署和二次开发。

650 11
|
8月前
|
人工智能 API 开发者
|

智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果

LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。

1940 1
|
8月前
|
Java Linux 开发工具
|

Linux下版本控制器(SVN) -命令行客户端

Linux下版本控制器(SVN) -命令行客户端

273 4
|
JSON 文字识别 数据可视化
|

Qwen2-VL微调实战:LaTex公式OCR识别任务(完整代码)

《SwanLab机器学习实战教程》推出了一项基于Qwen2-VL大语言模型的LaTeX OCR任务,通过指令微调实现多模态LLM的应用。本教程详述了环境配置、数据集准备、模型加载、SwanLab集成及微调训练等步骤,旨在帮助开发者轻松上手视觉大模型的微调实践。

3077 4
|
人工智能 前端开发 JavaScript
|

拿下奇怪的前端报错(一):报错信息是一个看不懂的数字数组Buffer(475) [Uint8Array],让AI大模型帮忙解析

本文介绍了前端开发中遇到的奇怪报错问题,特别是当错误信息不明确时的处理方法。作者分享了自己通过还原代码、试错等方式解决问题的经验,并以一个Vue3+TypeScript项目的构建失败为例,详细解析了如何从错误信息中定位问题,最终通过解读错误信息中的ASCII码找到了具体的错误文件。文章强调了基础知识的重要性,并鼓励读者遇到类似问题时不要慌张,耐心分析。

482 5
|
人工智能 自然语言处理 测试技术
|

通义灵码多维度体验分享

一文带你多维度了解通义灵码

897 4
|
机器学习/深度学习
|

大模型训练loss突刺原因和解决办法

【1月更文挑战第19天】大模型训练loss突刺原因和解决办法

2282 1
|
24天前
|
人工智能 算法 Java
|

Java+AI 核心指南:大模型丝滑接入与多模型统一范式

在AI深入企业应用的背景下,Java凭借稳定的工程化能力、成熟生态和存量系统兼容性,成为AI落地的关键。本文探讨Java如何高效集成AI,强调“用模型”而非“造模型”,聚焦复用现有技术栈、工程化落地与多模型统一管理,助力企业实现智能化升级。

173 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

基于通义千问:全AI自动驱动合同审查系统的技术解构与实践

“律杏法务云+通义千问”实现合同审查智能化跃迁,融合法律知识图谱与大模型技术,构建生成、审查、交互、进化闭环。支持智能清单生成、风险识别、条款补漏与AI对话,审查效率提升10倍,漏检率低于0.3%,推动法律科技进入AI新范式。

901 1
|
3月前
|
人工智能 自然语言处理 开发者
|

周报不是流水账,这个AI指令帮你写出让老板点赞的工作汇报

一个帮助技术人快速生成专业工作周报的AI指令,通过结构化输入和价值导向表达,让你的周报从流水账变成让老板点赞的高质量汇报,15分钟搞定原本需要1小时的周报撰写。

1119 80
|
4月前
|
文字识别 自然语言处理 API
|

同时斩获两个开源第一,超火的通义Qwen3-VL CookBook来了

Qwen3-VL开源发布后广受认可,登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务,现推出详细Cookbook助力开发者高效应用。

1473 3
|
4月前
|
Go API 数据库
|

腾讯WeKnora 架构学习指南

《WeKnora架构学习指南》系统解析了这一腾讯开源的智能知识库项目,涵盖核心架构、技术栈、代码结构与学习路径。通过生活化类比和深度流程图解,帮助开发者从零掌握Go后端、Vue前端、RAG原理及微服务协同,提供四阶段进阶路线与实战建议,助力快速上手并参与贡献。

948 3
|
5月前
|
人工智能 运维 API
|

高级RAG优化手册:3招解决检索不准和查询模糊

本文深入解析RAG(检索增强生成)技术的核心优化方法,涵盖背景、架构与实践。RAG通过整合外部知识库,弥补大语言模型在实时性、准确性和专业性上的不足,广泛应用于企业场景。文章系统讲解RAG如何解决知识静态、生成幻觉与专业深度不足等问题,并剖析其离线索引与在线生成的闭环流程。此外,还介绍了高级优化策略,如查询重写、混合检索与结果重排序,助力突破RAG应用瓶颈。

1138 1
|
6月前
|
人工智能 JSON 前端开发
|

告别无效调参!ReAct代理设计:让LLM精准执行复杂任务的终极方案

ReAct模式通过“推理+行动”循环,使大语言模型能自主调用工具、获取实时信息并执行多步骤任务,有效突破LLM固有局限,提升任务准确性和智能化水平。

1036 0
|
7月前
|
人工智能 自然语言处理 vr&ar
|

通义首个音频生成模型 ThinkSound 开源,你的专业音效师

通义实验室推出首个音频生成模型ThinkSound,突破传统视频到音频生成技术局限,首次将思维链(CoT)应用于音频生成领域,实现高保真、强同步的空间音频生成。基于自研AudioCoT数据集,结合多模态大语言模型与统一音频生成模型,支持交互式编辑,显著提升音画匹配度与时序一致性。代码已开源,助力游戏、VR、AR等场景创新应用。

1735 4
|
16天前
|
人工智能 弹性计算 监控
|

让 AI 为你打工:只需半小时,用轻量应用服务器部署 24 小时在线的 Moltbot(Clawdbot

阿里云Moltbot(Clawdbot)是一款7×24小时在线AI员工,支持邮件处理、资料整理、文件监控、口语陪练等功能。搭配轻量应用服务器,30分钟即可快速部署,现支持钉钉、QQ、飞书三端接入。

297 1
|
1月前
|
人工智能 数据中心
|

从技术热度到产品心智,豆包为何全面反超 DeepSeek?

AIWW数据显示,2025年12月起,豆包全网关注度稳定超越DeepSeek,且领先优势持续扩大。相较DeepSeek的技术驱动路径,豆包依托字节流量、多模态升级和任务执行能力,实现产品化突破,反映用户心智与行业格局的深层变迁。

328 1

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1739
内容
8
活动
1159
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼