|
11月前
|
SQL 人工智能 自然语言处理
|

别让你的大模型被忽悠了,聊聊prompt注入攻击

本文探讨了Prompt工程中的隐私与安全问题,重点分析了“奶奶漏洞”及更广泛的Prompt攻击现象,特别是Prompt注入的原理与防御手段。Prompt注入通过构造恶意输入突破模型限制,使LLM执行非预期操作。文章介绍了直接注入和间接注入类型,并提供了多种防御方案,如输入过滤、强化系统指令、接入第三方校验库及多模型协作防御。此外,还讨论了Prompt逆向工程及其正负影响,以及恶意MCP服务投毒的实际案例,如GitHub Copilot漏洞。最后提出了动态权限控制和持续安全监测等解决策略。

4928 1
|
数据采集 人工智能 自然语言处理
|

Qwen模型角色扮演最佳实践

角色扮演大模型通过模拟特定角色的行为、语言风格和情感表达,实现高度拟人化和定制化的互动体验。与传统通用模型相比,角色扮演模型在语言风格、性格特征和情绪反应上更加细腻,提供更真实的交互体验。本文介绍了如何通过system prompt、few-shot学习和微调等技术实现大模型的拟人化,包括使用阿里云百炼平台进行角色扮演测试,以及如何通过合成数据和Lora微调提高模型的表演效果。最终,展示了如何通过优化数据质量和训练策略,显著提升角色扮演模型的表现。

7169 28
|
9月前
|
存储 人工智能 算法
|

​​向量数据库终极指南:AI开发者的进阶手册​

本文深入解析向量数据库的原理与实战应用,涵盖其在AI系统中的核心作用、关键技术(如HNSW、PQ、LSH)、相似性搜索、元数据过滤及无服务器架构优势。适合开发者和AI从业者学习提升。

3194 1
|
10月前
|
存储 缓存 资源调度
|

# Qwen3-8B 的 TTFT 性能分析:16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型,支持最长 32,768 token 上下文,适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术,提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms,32K 输入下约 250-300ms,适用于文档摘要与长对话交互。

2894 8
|
1天前
|
人工智能 搜索推荐 API
|

Hermes Agent的部署以及API集成教程

Hermes Agent 是 Nous Research 推出的开源自我进化型AI智能体,支持持久记忆、技能自动沉淀与多工具集成;需通过 WSL2 在 Windows 部署,兼容 OpenAI 标准 API。

70 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87

超紧凑视觉语言模型(如Qwen2-VL-2B)以仅20亿参数、约4GB体积,实现本地化图文理解与生成,支持CPU/入门GPU实时推理,兼顾精度与轻量部署,推动多模态AI走向终端、离线与普惠应用。

559 2
|
3月前
|
JSON 自然语言处理 数据格式
|

大模型应用:结构化思维:Schema在大模型信息抽取中的认知引导作用.14

本文介绍大模型+Schema结构化信息抽取技术,涵盖核心原理(Schema引导、大模型语义理解、格式校验)、三大范式(Zero-shot/少样本/思维链)及完整执行流程,并提供多类型抽取示例(单字段、嵌套、数组、关系等),支持CPU环境本地部署与后处理校验。

808 15
|
11月前
|
人工智能 自然语言处理 算法
|

AI企业必看:最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布,AI企业需快速掌握政策要求以确保合规运营。该办法明确指出,利用AI生成的内容(如文本、图片、音频、视频等)需通过显性标识(如“AI生成”字样)或隐性标识(如元数据、数字水印)进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外,应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言,合规已成为必修课,需重点关注标识的规范性和溯源能力,以应对即将到来的监管要求。

2386 1
|
自然语言处理 IDE Java
|

通义灵码真好用!

通义灵码小白体验手把手教程,真的很好用呢!

3793 4
|
26天前
|
人工智能
|

HappyHorse 1.0 系列模型使用指南

HappyHorse 1.0 是一款基于原生多模态架构的新一代 AI 视频生成模型,支持音视频协同生成;产品深度适配广告营销、电商展示、短剧制作与社交媒体创意等内容生产场景。

337 6
|
2天前
|
人工智能 自然语言处理 搜索推荐
|

罗兰艺境GEO技术架构深度解析:从RAG机理到全栈自研的技术路线

生成式引擎优化(GEO)通过干预RAG架构的重排序阶段,提升企业内容在AI答案中的引用率。本文剖析RAG四阶段熵增点,指出重排序阶段的核心变量为语义匹配度、证据密度与信源权威等级,据此推导DSS原则(语义深度、数据支持、权威来源)及三层工程架构,并给出五级量化评分标准(≥75分入库)。文章综述FeatGEO、MAGEO、AgenticGEO等前沿研究,展望GraphRAG、多智能体协同、跨模态适配等六大趋势,为技术团队提供工程化参考。

67 1
|
15天前
|
运维 Shell 网络安全
|

OpenClaw 微信通道部署指南 私域运营与自动化客服落地方案

OpenClaw是轻量级开源框架,专为企业微信私域运营与自动化客服设计。支持本地、云端、命令行三模式一键部署,兼容多环境,降低接入门槛;内置安全通信、长连接保活与故障自愈能力,开箱即用,助力中小企业快速落地私域运营。(239字)

225 0
|
6月前
|
人工智能 文字识别 自然语言处理
|

通义千问大模型驱动的法律智能体创新实践

律杏法务云是基于阿里云通义千问大模型构建的新一代法律人工智能平台,通过深度融合OCR、NLP、知识图谱技术与千亿参数级语言模型,在企业法务管理领域实现了从信息抽取、文书生成到风险预警的全流程智能化。本文将深入剖析其技术架构与五大核心模块,揭示大模型如何重塑现代法务工作范式。

1814 2
|
15天前
|
人工智能 运维 安全
|

OpenClaw 对接钉钉企业机器人 内部应用 Stream 模式接入全流程

本文详解OpenClaw接入钉钉企业内部机器人的全流程:依托钉钉Channels能力,采用无需公网域名的Stream长连接模式,降低内网部署门槛;涵盖应用创建、机器人开通、图文配置、凭证获取及网关对接等关键步骤,操作清晰、即学即用,助力团队高效协同。(239字)

208 0
|
1月前
|
人工智能 安全 JavaScript
|

Windows11 部署 OpenClaw 小龙虾 零代码快速上手

专为 Windows 11 系统优化,针对性解决 Win11 权限、Defender、中文路径、SmartScreen 等部署常见问题,双击即可一键安装,10 分钟就能上手使用!

2044 124
|
2月前
|
存储 数据采集 机器学习/深度学习
|

大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51

本文揭示大模型“参数量越大效果越好”的误区,详解边际效益递减规律:小模型(1B→7B)提升显著,中等模型(7B→13B)仍具性价比,而超大模型(70B→175B)效果几无增长却大幅增加算力与存储成本。通过控制变量、量化指标与曲线分析,指导读者科学选型——找到效果与成本平衡的最优参数阈值。

752 14
|
4月前
|
机器学习/深度学习 存储 人工智能
|

大模型部署算力账本:手把手教你算清GPU显存这笔账

本文详解大模型部署中GPU显存计算的关键:以Llama 70B为例,拆解模型权重、KV Cache、其他开销三大部分,揭示高并发下显存需求超1TB的真相,并提供量化、并行优化等降本策略,助你精准规划硬件投入,避免资源浪费或服务崩溃。

1810 2
|
7月前
|
人工智能 搜索推荐 算法
|

用AI提示词搞定基金定投:技术人的理财工具实践

本文将AI提示词工程应用于基金定投,为技术人打造一套系统化、可执行的理财方案。通过结构化指令,AI可生成个性化定投策略,覆盖目标设定、资产配置、风险控制与动态调整,帮助用户降低决策门槛,规避情绪干扰,实现科学理财。

2649 13
|
人工智能 Java 开发者
|

通义灵码:当AI成为你的编程搭档,效率革命已经到来

本文介绍了通义灵码作为AI编程伙伴的革命性意义及其技术特点。基于阿里云通义代码大模型CodeQwen1.5,它具备多模态代码理解、意图推理和跨语言知识融合能力,可重构开发者工作流,从智能编码到Debug预警再到文档自动化全面提升效率。数据显示,其能将常规开发时间缩短60%,错误率下降43%,新技术上手速度提升2倍。未来,通义灵码将推动需求-代码双向翻译、架构自演进等全新编程形态,助力开发者聚焦更高价值领域,开启人机共生的编程新时代。

1304 10
|
2月前
|
机器学习/深度学习 算法 数据可视化
|

大模型应用:上下文理解极限:Context Window 与注意力跨度的数学边界.57

本文深入解析大模型长文本处理的三大核心概念:上下文窗口(输入长度上限)、注意力跨度(有效关注范围)与数学边界(算力/显存制约)。三者共同决定模型真实能力,而非仅看“128K”等宣传数字。理解它们是合理选型、优化提示、评估性能的关键。

782 10
|
2月前
|
人工智能 监控 数据可视化
|

2026年的企业级 AI 应用:工作流的边界,与 Coding 的回归

2026年,企业级AI应用进入新分水岭:工作流解决启动快,代码承载长期复杂性。Dify、n8n等平台正补工程能力,LangGraph等框架则增强编排性。核心命题已非“二选一”,而是——**Workflow管编排,Code管核心**:低风险场景用可视化,高可靠需求回归代码优先。(239字)

702 6
|
8月前
|
消息中间件 Ubuntu Java
|

SpringBoot整合MQTT实战:基于EMQX实现双向设备通信

本教程指导在Ubuntu上部署EMQX 5.9.0并集成Spring Boot实现MQTT双向通信,涵盖服务器搭建、客户端配置及生产实践,助您快速构建企业级物联网消息系统。

2833 1
|
人工智能 架构师 搜索推荐
|

通义大模型使用指南之通义千问

本文介绍了如何注册并使用通义大模型,该平台提供了通义千问、通义万相和通义听悟三大功能。通义千问包含对话和百宝箱两个子功能。在对话中,用户需按照特定格式提问,如设定角色、背景等,但实际体验中,回复可能不够理想。百宝箱提供不同场景的应用,如健身教练和办公助理。通过示例展示了健身计划的生成,但与专业教练相比仍有差距。对于职场问题,通义千问的回答显得较为通用,难以满足个性化需求。

6609 0
|
2月前
|
人工智能 弹性计算 自然语言处理
|

阿里云AI产品活动:千问焕新计划企业新客专享万亿Tokens扶持,1728元优惠券免费领

阿里云AI焕新季活动丰富,免费赠送1728元礼包,含个人与企业满减券。活动提供低价部署OpenClaw、阿里云百炼大模型服务节省计划低至4.5折、全模型通享4.5折,企业新客享万亿Tokens,云服务器38元起,还有组合购优惠。千问大模型适配多场景AI落地,具备多种模型能力。千问焕新计划提供最高2000元优惠券及多项权益。还提供低价云服务器、精选组合购,新迁入云享5亿补贴,助力企业AI转型。

811 4
|
8月前
|
测试技术 数据库 uml
|

软考中级软件设计师专项-UML图篇

UML(统一建模语言)是一种用于软件系统建模的标准化语言,能够清晰表达系统的静态结构与动态行为。其核心包括三类构造块:事物、关系和图。事物分为结构事物、行为事物、分组事物和注释事物;关系包括依赖、关联、泛化和实现;图则涵盖了类图、对象图、用例图、序列图、通信图、状态图、活动图、构件图和部署图等,分别用于静态建模、动态建模和物理建模。

858 1
|
8月前
|
人工智能 运维 API
|

高级RAG优化手册:3招解决检索不准和查询模糊

本文深入解析RAG(检索增强生成)技术的核心优化方法,涵盖背景、架构与实践。RAG通过整合外部知识库,弥补大语言模型在实时性、准确性和专业性上的不足,广泛应用于企业场景。文章系统讲解RAG如何解决知识静态、生成幻觉与专业深度不足等问题,并剖析其离线索引与在线生成的闭环流程。此外,还介绍了高级优化策略,如查询重写、混合检索与结果重排序,助力突破RAG应用瓶颈。

1883 1

通义大模型使用指南之通义听悟

本文介绍了阿里云通义平台的注册和使用,主要包括两个部分:注册和功能介绍。用户可以通过访问网址 <https://tongyi.aliyun.com/> 进行注册。在功能介绍中,重点讲解了通义听悟的功能,它提供实时语音转文字、音视频文件转文字、智能总结和中英互译服务。用户可以体验实时录音并标记重点、问题和代办事项,方便会议记录和整理。此外,通义听悟还支持上传音视频文件转写和播客链接转写,以及浏览器插件用于处理网页、手机和微信上的语音内容。

3696 0
|
人工智能 自然语言处理 测试技术
|

什么是通义灵码?

什么是通义灵码?

2233 0
|
人工智能 API
|

通过API调用通义千问时出现DataInspectionFailed的解决办法(玄学版)

在使用qwen-plus API进行长文本翻译时,遇到了DataInspectionFailed错误,提示输入数据可能包含不当内容。尽管确认文本无敏感内容,但误判依然发生。通过将每个分段的字符数从1000降低到700,问题得以解决。建议在处理长文本时,减少每次请求的字符数以避免误判。

6322 6
|
15天前
|
数据采集 人工智能 运维
|

OpenClaw 小龙虾技能全解 五大场景高频实用插件清单

OpenClaw(小龙虾)核心优势在于Skill技能扩展体系,支持AI直接操控电脑执行实操任务。本文精选15大高频实用Skill,覆盖文件管理、办公自动化、浏览器操作、系统运维、内容处理五大场景,一键部署、即装即用,大幅提升日常办公与电脑使用效率。(239字)

248 1
|
3月前
|
机器学习/深度学习 自然语言处理 并行计算
|

大模型应用:混合专家模型(MoE):大模型性能提升的关键技术拆解.37

MoE(混合专家模型)是一种高效大模型架构,通过“智能调度+稀疏激活”机制,让多个专业化子网络(专家)按需协作。它兼顾性能与效率:参数规模大但推理仅激活2-4个专家,显著降本提速;既保持通用能力,又在医疗、法律等细分领域更专精,是当前大模型落地的关键技术。

1084 17
|
4月前
|
人工智能 安全 机器人
|

📘 2026 AI Agent 职业路线图:从研发范式到商业闭环

📘2026 AI Agent职业路线图:AI进入“大航海时代”,从LLM迈向自主智能体。涵盖核心技术栈、四大热门赛道(架构师、具身智能、安全专家、行业产品经理)、实战构建与职业发展路径,助你掌握Agent时代核心竞争力,实现职业跃迁。

1497 6
|
5月前
|
人工智能 自然语言处理 算法
|

6步走I 大模型备案《通关手册》

本文依据《生成式人工智能服务管理暂行办法》,梳理企业上线大模型服务所需的备案流程、材料及注意事项,涵盖“是否需备案”“六步备案法”“安全评估重点”“特殊行业提示”等内容,助力企业合规落地。

1296 0
|
6月前
|
人工智能 UED 开发者
|

别把问卷做成"审讯录":用AI重构与用户的每一次对话

95%的用户调研问卷因为"审讯式提问"而被无视。本文提供一套基于认知心理学的AI指令,将枯燥的填表转化为有温度的对话,帮助开发者和产品经理设计出高完成率、高信度的调研问卷,打破"幸存者偏差",获取真实用户洞察。

790 9
|
1月前
|
机器学习/深度学习 存储 缓存
|

大模型架构算力对比:Decoder-only、Encoder-Decoder、MoE深度解析.71

本文深入解析三大主流大模型架构(Decoder-only、Encoder-Decoder、MoE)的算力消耗差异,聚焦注意力机制复杂度、参数量与计算密度三大维度。通过公式推导、代码模拟与可视化图表,揭示MoE稀疏激活的显著节算优势及瓶颈,剖析长文本场景下的“平方级算力黑洞”成因,并提供面向不同场景的架构选型建议。

638 20
|
7月前
|
人工智能 搜索推荐 程序员
|

从程序员到UP主:一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令,结构化拆解内容创作流程。输入主题、类型等信息,结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案,提升创作效率与视频质量。

1138 2
|
7月前
|
存储 人工智能 前端开发
|

超越问答:深入理解并构建自主决策的AI智能体(Agent)

如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。

1567 6
|
人工智能 API 开发者
|

用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。

3722 41
|
弹性计算 Serverless 数据安全/隐私保护
|

针对【图像生成 - ComfyUI】使用的深度评测

ComfyUI 是一款支持自定义工作流的图像生成工具,适用于创意设计、游戏开发和电商等多个行业。它能根据项目需求灵活调整图像生成流程,提高创意实现效率,同时具备成本效益和弹性伸缩能力,适应业务量变化。尽管如此,ComfyUI 在技术门槛和数据安全方面仍存在挑战,需注意非专业用户的学习曲线和敏感数据保护。

2036 8
|
Java Maven
|

maven配置阿里云镜像源

maven配置阿里云镜像源

44048 1
|
5月前
|
机器学习/深度学习 安全 API
|

MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。

3463 7
|
9月前
|
人工智能 自然语言处理 安全
|

大模型备案要点一次过【附材料清单详解】

广东省最新公布一批大模型备案名单,新增14款备案模型、6款登记模型,累计达80款备案、23款登记。文章详解大模型备案流程、周期(5-10个月)、要求(主体资质、数据合规、内容安全、模型完成度)、所需材料(备案表、安全评估报告、服务协议、语料标注规则等)及完整备案流程(初审、自测、提交、整改、终审、公示)。为大模型企业备案提供全面指导。

2004 2
|
JSON 缓存 并行计算
|

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

阿里巴巴近期开源了通义千问Qwen3大语言模型(LLM),包含两款混合专家模型(MoE)235B-A22B与30B-A3B,以及六款稠密模型(Dense)从0.6B到32B不等。开发者可基于NVIDIA GPU使用TensorRT-LLM、Ollama、SGLang、vLLM等框架高效部署Qwen3系列模型,实现快速词元生成和生产级应用开发。

2668 8
|
机器学习/深度学习 人工智能 编解码
|

AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。

2980 9
|
7月前
|
JavaScript 前端开发 API
|

n8n - 架构学习指南

欢迎来到 n8n 学习之旅!本指南带你深入解析这一强大开源工作流自动化工具的架构设计与技术实现。从项目结构、核心模块到代码质量,结合实战路径与贡献指导,助你由浅入深掌握 n8n,实现从使用者到贡献者的跃迁。

1743 28
|
7月前
|
人工智能
|

一个帮运营写产品详情页的AI指令

分享一套实用的电商详情页AI生成指令模板,涵盖标题、卖点、场景、参数、保障等核心模块,帮助运营、产品经理等快速产出80分初稿,大幅提升效率。适配主流AI工具,结合人工优化,轻松应对多平台需求。

2180 7
|
8月前
|
XML 存储 算法
|

5大实战技巧:优化RAG召回质量,避免“召回不足”灾难!

本文分享了团队在金融风控系统开发中优化RAG系统的实战经验,涵盖文档处理、召回策略与生成优化三大环节,解决召回不准、数据噪声等问题,助力构建高效精准的RAG系统。

1840 1
|
缓存 自然语言处理 并行计算
|

基于NVIDIA A30 加速卡推理部署通义千问-72B-Chat测试过程

本文介绍了基于阿里云通义千问72B大模型(Qwen-72B-Chat)的性能基准测试,包括测试环境准备、模型部署、API测试等内容。测试环境配置为32核128G内存的ECS云主机,配备8块NVIDIA A30 GPU加速卡。软件环境包括Ubuntu 22.04、CUDA 12.4.0、PyTorch 2.4.0等。详细介绍了模型下载、部署命令及常见问题解决方法,并展示了API测试结果和性能分析。

6819 1
|
12天前
|
Java Nacos 微服务
|

基于 Spring Cloud Alibaba 的微服务毕设架构设计与云原生部署实践

本文为计算机专业毕设提供轻量级云原生实践方案:基于Spring Cloud Alibaba构建“3+1”微服务架构(Gateway+user/biz/base三服务),集成Nacos注册中心、Gateway鉴权路由、OpenFeign调用及Docker Compose一键部署,兼顾架构深度与毕设周期(2–3周可落地),适配答辩评审对分布式思维与云原生能力的隐性要求。

175 1
|
15天前
|
人工智能 JSON 自然语言处理
|

大模型应用:贝叶斯推理赋能大模型:构建带置信度的可信智能问答系统.108

本文提出“大模型+贝叶斯推理”协同方案,直击大模型幻觉痛点:让大模型专注语言理解与生成,贝叶斯模块基于先验知识与用户证据(如症状)动态计算各结论的置信概率,输出“结论+概率+依据”,显著提升医疗、法律等高可信场景的可靠性与可解释性。

152 5

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1954
内容
8
活动
1407
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼