|
12天前
|
Java Nacos 微服务
|

基于 Spring Cloud Alibaba 的微服务毕设架构设计与云原生部署实践

本文为计算机专业毕设提供轻量级云原生实践方案:基于Spring Cloud Alibaba构建“3+1”微服务架构(Gateway+user/biz/base三服务),集成Nacos注册中心、Gateway鉴权路由、OpenFeign调用及Docker Compose一键部署,兼顾架构深度与毕设周期(2–3周可落地),适配答辩评审对分布式思维与云原生能力的隐性要求。

175 1
|
15天前
|
人工智能 JSON 自然语言处理
|

大模型应用:贝叶斯推理赋能大模型:构建带置信度的可信智能问答系统.108

本文提出“大模型+贝叶斯推理”协同方案,直击大模型幻觉痛点:让大模型专注语言理解与生成,贝叶斯模块基于先验知识与用户证据(如症状)动态计算各结论的置信概率,输出“结论+概率+依据”,显著提升医疗、法律等高可信场景的可靠性与可解释性。

152 5
|
2月前
|
存储 缓存 自然语言处理
|

大模型应用:大模型运行全流程解析:从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程:从硬盘加载权重、CPU内存预处理、GPU显存计算,到自回归生成与自然语言解码。涵盖硬件协同(硬盘→内存→GPU)、软件步骤(分词、注意力、采样、后处理)及资源调度优化,揭示其软硬协同的本质。

513 3
|
JSON 测试技术 API
|

大模型工程师基础之学会使用openai

本系列教程涵盖OpenAI API基础到高级应用,包括文本生成、图像处理、语音交互、会话管理、流式响应、文件输入、推理模型及性能评估等十大核心功能。适合新手入门与工程师实践,助您掌握大模型开发关键技术。从简单Prompt设计到复杂多模态任务,逐步深入,结合实例代码与最佳实践,提升实际开发能力。希望这些内容对您有帮助!

2063 11

vllm+vllm-ascend本地部署QwQ-32B

本指南介绍如何下载、安装和启动基于Ascend的vLLM模型。首先,可通过华为镜像或Hugging Face下载预训练模型;其次,安装vllm-ascend,支持通过基础镜像(如`quay.io/ascend/vllm-ascend:v0.7.3-dev`)或源码编译方式完成;最后,使用OpenAI兼容接口启动模型,例如运行`vllm serve`命令,设置模型路径、并行规模等参数。适用于大模型推理场景,需注意显存需求(如QwQ-32B需70G以上)。

4874 17
|
1月前
|
消息中间件 运维 安全
|

非得显卡?小模型跑在CPU上也照样快

Aether项目聚焦边缘/无GPU/私有化场景,用≤9B小模型构建高可用智能运维Agent:融合RAG知识库、分级意图路由、SOP式Skill编排与LoRA微调,兼顾数据安全、低资源消耗与强领域专业性。(238字)

393 2
|
1月前
|
弹性计算 人工智能 API
|

阿里云ECS云服务器快速部署OpenClaw实战|千问大模型Qwen3.6-Plus一站式配置教程

随着AI智能体技术不断成熟,OpenClaw(曾用名Clawdbot)已经成为轻量化、可扩展、高稳定性的开源AI执行框架代表。它能够将自然语言指令转化为真实可执行的系统操作、文件处理、信息检索、流程自动化任务,真正实现从“对话”到“执行”的落地。

799 29
|
6月前
|
人工智能 自然语言处理 安全
|

直播带货效率提升300%:这个AI指令让技术人也能写出专业话术

技术人写直播话术太难?逻辑思维 vs 情感营销冲突大,学得慢、改得累。本文分享一套结构化AI指令,将专业带货方法论转化为可执行模板,支持多品类定制,30分钟生成高转化话术,助力开发者高效应对朋友求助或产品推广,轻松玩转直播文案。

1455 5
|
7月前
|
测试技术
|

哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦

Qwen-Image-Edit基于20B Qwen-Image模型,融合视觉语义与外观控制,支持中英文文字精准编辑、风格迁移、IP创作等多重功能,具备SOTA性能,助力低门槛、高精度图像编辑。

3781 23
|
11月前
|
人工智能 Cloud Native 数据可视化
|

微医控股与阿里云达成战略合作,双方将携手基于通义千问大模型联合打造医疗全场景智能体,共同构建医疗垂类大模型

2025年6月17日,微医控股与阿里云达成战略合作,共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型,升级微医“5+1”智能体,并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云,助力AI+医疗基础设施建设,共同制定行业标准并推广城市级AI数字健共体。目前,微医AI服务已连接全国1.2万家医院和30万名医生,健康管理会员超100万。

2187 2
|
人工智能 索引
|

几个好玩又实用的智能工具网站非常nice[搜嗖工具箱]

纪妖网汇集了2200多个妖怪,包括妖、怪、神、魔等,可以让人了解古今中外不同的文化知识。诗三百是一个人工智能写诗平台,支持AI作诗、藏头诗生成等功能。Mikutools是一个工具集合网站,支持夜间模式,兼容全平台。知微事见是互联网社会热点聚合平台,可以帮助用户捕捉网络热点。哄哄模拟器是一款娱乐类AI应用,旨在帮助用户练习和提高与伴侣沟通的技巧。

1155 3
|
1月前
|
编解码 人工智能 自然语言处理
|

#阿里云千问视觉模型实战:电商商品多视角图生成全流程解析

本文是阿里云千问视觉模型在电商商品图生成中的实战指南,详解其如何以0.1元/张、5秒生成的高效低成本,替代万元级传统拍摄,解决成本高、周期长、创意弱三大痛点,并附可运行代码与ROI分析。(239字)

468 5
|
9月前
|
人工智能 数据可视化 开发者
|

深度解析基于LangGraph的Agent系统架构设计与工程实践

LangGraph作为Agent 生态中非常热门的框架,今天我将借助 LangGraph,更高效、更优雅的方式构建复杂智能体系统。

2320 2
|
机器学习/深度学习 人工智能 安全
|

AI大模型安全风险和应对方案

AI大模型面临核心安全问题,包括模型内在风险(如欺骗性对齐、不可解释性和模型幻觉)、外部攻击面扩大(如API漏洞、数据泄露和对抗性攻击)及生成内容滥用(如深度伪造和虚假信息)。应对方案涵盖技术防御与优化、全生命周期管理、治理与行业协同及用户教育。未来需关注动态风险适应、跨领域协同和量子安全预研,构建“技术+管理+法律”三位一体的防护体系,推动AI安全发展。

3864 1
|
15天前
|
消息中间件 人工智能 安全
|

民生银行基于规格驱动开发(SDD)的CodeAgent私域研发探索与实践

民生银行科技团队基于CloudIDE+民生Code CLI+阿里云通义千问,探索了规格驱动开发(SDD)在金融私域研发中的应用,解决了AI生成代码偏离规范、质量难控等问题。实践表明,SDD模式能有效提升代码规范性与研发效率,推动AI能力融入企业研发体系。

221 1
|
4月前
|
机器学习/深度学习 人工智能 算法
|

给大模型“上上价值”:用PPO算法让AI更懂你的心

本文深入浅出讲解PPO算法——大模型“价值观对齐”的核心引擎。以教育孩子为喻,解析其“剪切更新”“优势估计”“KL约束”等机制,涵盖原理、实战(数据准备→奖励建模→五步微调)、避坑指南及DPO等前沿方向,助你让AI既聪明又懂你。(239字)

531 7
|
11月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

1654 63
|
12月前
|
人工智能 安全 Android开发
|

手机也能跑通义Qwen3大模型,手把手教你部署!

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通!借助MNN支持,适配Android、iOS及桌面端,实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

5601 11
|
人工智能 算法 搜索推荐
|

算法备案全流程攻略:保姆级教程

在AI热潮下,算法成为互联网服务的核心驱动力,但也带来了大数据杀熟、算法歧视等问题。为规范行业发展,算法备案制度应运而生。该制度涵盖网站、APP等多种产品形式,要求企业在2个月内完成备案,依据《互联网信息服务算法推荐管理规定》等法规。未备案企业可能面临无法上线、罚款甚至刑罚的后果。备案流程包括注册、主体备案、信息填报及审核,确保算法合规运营。通过悬挂备案号、标识AI生成内容和定期自查,企业需持续维护算法安全与合规。

2171 14
|
Web App开发 人工智能 达摩院
|

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

3461 0
|
23小时前
|
人工智能 开发工具 开发者
|

学习AI Agent编程-第一天-MCP基础

本文精炼解析MCP(Model Context Protocol):它不是新模型,而是让AI Agent运行时动态增删工具的协议。通过MCP Server(工具实现)、Client(SDK封装)与Host(Agent应用)三组件协作,解决传统`bind_tools`静态绑定的局限。附完整可运行示例,助你快速掌握80%核心用法。(239字)

50 1
|
1月前
|
人工智能 自然语言处理 监控
|

阿里云JVS Claw是什么?JVS Claw“养虾”功能与优势,免费体验版和最新包年包月优惠

阿里云JVS Claw是“云上养虾神器”,可简化大模型使用流程,支持零门槛创建、管理和优化AI智能体。其核心功能包括一键接入OpenClaw、多端协同操作、提供安全隔离环境及自进化技能体系,满足企业及个人智能化需求。新用户可享7天免费体验,首月39元起,且提供包月包年优惠。此外,用户也可选用轻量云服务器部署OpenClaw,有多个规格的云服务器可供选择。

550 1
|
3月前
|
人工智能 Cloud Native 语音技术
|

实战分享 | 抛弃本地Whisper,我用“通义千问+Paraformer”构建了一套B站收藏视频RAG知识库

本文分享如何用阿里云DashScope“全家桶”(Paraformer语音转写+Qwen-Max推理+Text-Embedding-v4向量化)替代本地Whisper,构建轻量、高效、高精度的B站视频RAG知识库,解决显存不足、转写慢、中英识别差等痛点,实测速度提升20倍以上。

1691 6
|
6月前
|
人工智能 弹性计算 自然语言处理
|

史上首次!万卡AI集群支撑双11,通义千问大规模落地

2025年双11,阿里云提供超千万核ECS算力及万卡灵骏智算集群,支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地,Qwen-MT单日调用超14亿次,助力商品出海、客服与经营分析,全面赋能双11智能化升级。

994 0
|
6月前
|
人工智能 固态存储 Linux
|

树莓派这种“玩具级”设备,真能跑大模型吗?

本期教程带你用树莓派5部署Qwen3模型,打造完全离线、自带屏幕与键盘的“AI小终端”。基于C语言实现,不依赖Python或llama.cpp,支持多尺寸Qwen3模型,实现本地化私有推理。跟随步骤,轻松搭建属于你的端侧AI助手。

2168 168
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

《生成式引擎优化(GEO)服务商选择指南》:让AI大模型主动推荐你

GEO(生成式引擎优化)是针对AI生成式搜索引擎的优化策略,旨在让企业信息在AI回答中优先呈现,实现“无点击曝光”。与传统SEO不同,GEO强调语义理解、权威内容和结构化数据,提升品牌在AI推荐中的可见性与可信度。企业需关注GEO服务商的技术实力、行业匹配度、服务流程完整性等维度,确保优化效果。

2588 1
|
9月前
|
人工智能 自然语言处理 安全
|

大模型备案材料—《安全评估报告》撰写指南

本文详解大模型备案中的关键材料——《安全评估报告》的撰写要点,涵盖报告框架、必备内容、注意事项及基础信息,助你高效通过备案。

1306 6
|
11月前
|
人工智能 自然语言处理 JavaScript
|

【开源项目】MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统

MaxKB4J是一款基于Java开发的开源LLM工作流应用与RAG知识库问答系统,结合MaxKB和FastGPT优势,支持智能客服、企业知识库等场景。它开箱即用,可直接上传/爬取文档,支持多种大模型(如Qwen、通义千问等),具备灵活的工作流编排能力,并无缝嵌入第三方系统。技术栈包括Vue.js、Springboot3、PostgreSQL等,提供稳定高效的智能问答解决方案。访问地址:`http://localhost:8080/ui/login`,项目详情见[Gitee](https://gitee.com/taisan/MaxKB4j)。

1744 1
|
人工智能 前端开发 API
|

基于agentscope的多智能体游戏场景-骗子酒馆

骗子酒馆是一款基于多智能体系统的在线社交推理游戏,玩家通过掷骰子和扑克牌进行智力和心理博弈,结合大语言模型技术,每个游戏角色由AI扮演,具备独特的性格和决策逻辑,提供高度沉浸式的体验。游戏采用黑板通信模式,确保信息高效交换,支持多种角色如胆小鬼、占卜师等,每个角色拥有特定的技能和行为模式,增强游戏的策略深度和互动性。游戏界面简洁,操作流畅,适合喜欢心理战和策略游戏的玩家。文章末尾有源码和体验地址。

2563 13
|
人工智能 自然语言处理 并行计算
|

探索大模型部署:基于 VLLM 和 ModelScope 与 Qwen2.5 在双 32G VGPU 上的实践之旅

本文介绍了使用 `VLLM` 和 `ModelScope` 部署 `Qwen2.5` 大模型的实践过程,包括环境搭建、模型下载和在双 32G VGPU 上的成功部署,展现了高性能计算与大模型结合的强大力量。

3930 3
|
XML 搜索推荐 API
|

通义千问API:让大模型使用各种工具

本章我们将通过一个简单的例子,揭示基于LangChain的Agent开发的秘密,从而了解如何扩展大模型的能力。

80496 193
|
1月前
|
人工智能 监控 前端开发
|

大模型应用:基于安诊儿AntAngelMed模型+FastAPI构建慢病管理AI助手.86

本项目基于安诊儿AntAngelMed医疗大模型(临床一致率达88.9%),结合FastAPI后端与轻量前端,构建7×24小时慢病AI助手。支持糖尿病、高血压等居家咨询,提供专业、可读、结构化建议,并实时统计Token消耗,兼顾实用性与成本可控性。

354 2
|
5月前
|
人工智能 安全 网络安全
|

首批!通义千问、通义万相通过生成式AI安全国标符合性验证

喜报~

2105 12
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI Compass前沿速览:Gemini 3、Grok 4.1、GPT-5.1、千问、Lumine-3D开世界AI智能体

AI Compass前沿速览:Gemini 3、Grok 4.1、GPT-5.1、千问、Lumine-3D开世界AI智能体

1286 1
|
数据采集 编解码 缓存
|

通义万相,开源!

通义万相,开源!

2641 2
|
搜索推荐 物联网 PyTorch
|

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

14265 34
|
人工智能 自然语言处理 API
|

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

3452 5
|
3月前
|
JavaScript Linux 开发者
|

Node.js 快速上手:核心特点 + 安装指南

Node.js是Claude Code、OpenAI Codex等AI编程工具的必备运行环境。本文详解其JavaScript全栈、非阻塞I/O、跨平台等核心特性,覆盖Windows/macOS/Linux三端LTS版一键安装方法及常见问题排查,助开发者快速配置本地开发环境。(239字)

1221 9
|
4月前
|
人工智能 JSON 前端开发
|

智能体来了:从 0 到 1:企业级 LLM Agent 的工程化落地实践

本文作者Agentcometoo分享企业级AI Agent工程化落地实践,直击通用框架在真实业务中的四大痛点:多工具协同不可控、高并发状态难追踪、异常缺乏工程兜底、Debug成本高。提出轻量可控的ReAct架构,强调“可预测、可追踪、可兜底”,通过工具基类约束、主循环结构化输出、步数限制与日志追踪等工程手段,实现LLM Agent稳定上线。

609 8
|
8月前
|
缓存 监控 Java
|

SpringBoot @Scheduled 注解详解

使用`@Scheduled`注解实现方法周期性执行,支持固定间隔、延迟或Cron表达式触发,基于Spring Task,适用于日志清理、数据同步等定时任务场景。需启用`@EnableScheduling`,注意线程阻塞与分布式重复问题,推荐结合`@Async`异步处理,提升任务调度效率。

1314 128
|
25天前
|
人工智能 搜索推荐 新能源
|

阿里云开发者社区:AKSGEO 驱动的 GEO 优化,让品牌赢在 AI 搜索入口

AI搜索重塑本地获客逻辑,GEO优化成企业必答题。AKSGEO方案由正和盟与秦云亿家联合打造,融合E-E-A-T权威信源建设与地理信息精准优化,助力品牌被AI“看见”、被用户信任,已在餐饮、制造等多行业验证显著增长效果。

279 1
|
2月前
|
分布式计算 小程序 Java
|

Java入门学习指南:从零基础到上手写代码(超详细,新手必看)

很多新手入门就急于下载软件、写代码,结果越学越乱。先花5分钟搞懂这3个问题,能帮你节省大量时间。

709 0
|
7月前
|
人工智能 数据安全/隐私保护 开发者
|

一条AI指令,解决"发朋友圈不知道写啥"的千古难题

技术人发朋友圈总犯难?项目上线怕炫耀,生活瞬间不知如何表达。其实,用AI辅助写作是个妙招。关键在于给出清晰指令:明确场景、风格与需求,让AI生成真实自然、有温度的文案。本文提供一套即拿即用的AI指令模板,覆盖生活、工作、旅行等六大场景,帮你快速生成不“AI味”的朋友圈内容。省下纠结时间,真诚分享生活,才是正解。

998 10
|
人工智能 搜索推荐 云栖大会
|

什么是通义智文?AI阅读助手,用AI帮你读得多、读得快、读得懂

介绍通义智文产品发展历程、使用场景及主要功能。

53593 9
|
1天前
|
缓存 并行计算 测试技术
|

如何在单张 RTX 3090 上让 Qwen3.5-27B token 生成速度提升 6 倍

本文系 trycua 团队的工程实践分享,Cua 是由该团队打造的一个面向 macOS 设计的开源 AI Agent 框架。下文采用第一视角来讲述他们在 RTX 3090 上的提速实践。

46 3
|
1月前
|
人工智能 芯片
|

万相2.7,模型使用指南

万相2.7,拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从“演”迈向“导” 。

503 11
|
8月前
|
存储 机器学习/深度学习 算法
|

​​LLM推理效率的范式转移:FlashAttention与PagedAttention正在重塑AI部署的未来​

本文深度解析FlashAttention与PagedAttention两大LLM推理优化技术:前者通过分块计算提升注意力效率,后者借助分页管理降低KV Cache内存开销。二者分别从计算与内存维度突破性能瓶颈,显著提升大模型推理速度与吞吐量,是当前高效LLM系统的核心基石。建议收藏细读。

1648 125
|
存储 自然语言处理 前端开发
|

2025年大模型发展脉络:深入分析与技术细节

本文深入剖析2025年大模型发展脉络,涵盖裸模型与手工指令工程、向量检索、文本处理与知识图谱构建、自动化提示生成、ReAct多步推理及AI Agent崛起六大模块。从技术细节到未来趋势,结合最新进展探讨核心算法、工具栈与挑战,强调模块化、自动化、多模态等关键方向,同时指出计算资源、数据质量和安全伦理等问题。适合关注大模型前沿动态的技术从业者与研究者。

3790 9
|
自然语言处理 前端开发 Serverless
|

基于阿里云通义千问开发编程辅助与代码生成工具

随着软件开发需求的增加,编程辅助与代码生成工具成为开发者提高效率的利器。这类工具能够根据用户描述生成代码片段、协助调试、生成自动化脚本等,大大减少重复性劳动。阿里云通义千问作为一款先进的大语言模型,具备强大的自然语言处理和代码生成能力,非常适合用于开发这样的工具。

3382 3
|
1月前
|
机器学习/深度学习 自然语言处理 供应链
|

大模型应用:销量预测升级:Qwen大模型让时序分析从算数值到给建议.82

本文提出“会说话的时序分析系统”,融合ARIMA、Prophet等专业预测算法与大模型,实现从冰冷数值到自然语言洞察的跃迁:算法精准算未来,大模型解读原因、生成可落地建议,让时序数据真正成为懂业务、会决策的智能助手。

412 3

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1954
内容
8
活动
1407
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼