带你读《阿里云安全白皮书》（二十四）——云上安全建设最佳实践（2）

2024-11-14 102

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

Web应用防火墙 3.0，每月20元额度 3个月

内容审核增强版开发者实践包，10万次资源包1年有效

云安全中心免费版，不限时长

简介： 本文介绍了阿里云在AI大模型云上安全方面的最佳实践，涵盖数据安全、模型安全、内容安全和合规性四大关键挑战。阿里云通过数据加密、私有链接传输、机密计算等技术手段，确保数据和模型的安全性；同时，提供内容安全检测、Prompt问答护栏等功能，保障生成内容的合法合规。此外，阿里云还帮助企业完成算法及模型备案，助力客户在AI大模型时代安全、合规地发展。

点击链接下载查看完整版内容👉：《阿里云安全白皮书（2024版）》

点击链接下载查看上文👉：带你读《阿里云安全白皮书》（二十三）——云上安全建设最佳实践

迎接未来：AI 大模型云上安全最佳实践

ChatGPT 的问世和成功引领生成式人工智能的蓬勃发展，各类 AI 大模型产品如雨后春笋般涌现，正在各行各业积极探索应用落地场景。其中不乏 Perplexity 这样挑战 Google 搜索地位的新星、妙鸭相机这样的爆火应用。

在 AI 大模型产品快速发展的前提下，如何保护各方数据安全与主权，并有效地帮助客户应对由这些技术带来的算法安全和内容安全风险，已成为 AI 大模型时代云平台面临的关键命题，也是对数智化基础设施的重大挑战。

1 AI 大模型关键安全风险

阿里云同时拥有领先的云计算业务与先进的大模型技术，基于自身 AI 大模型的安全建设实践，阿里云希望能将这一未来重点领域的安全风险洞察、解决方案分享给社会。

一款 AI 大模型产品需经历数据准备、模型训练与微调、模型部署、模型运行阶段，在这些阶段过程中，面临着众多威胁与挑战，其中四项关键挑战为：

- 数据安全挑战：

为了使通用模型在特定领域实现更好的智能，企业需要对其自身业务数据进行提炼，并通过微调等技术将这些数据融入到模型中。鉴于这类数据对企业至关重要，在数据的收集、清洗、分析及存储过程中，都需要有完善的安全机制进行保障。

模型在线上运行服务期间，用户的 Prompt 输入及其返回的内容可能涉及用户的隐私。因此，如何保障用户隐私不被侵犯成为 AI 大模型类产品的核心挑战之一。

- 模型安全挑战：

模型承载了对数据的“记忆”，因此模型一旦泄露，等同于训练数据的泄露。而模型在研发、部署阶段，大量的一线员工具备模型的访问权限，同时生产环境也面临着与传统信息系统一样的外部入侵威胁。一旦系统存在可被入侵的漏洞，就可能导致模型被外部攻击者窃取，从而间接导致参与训练的敏感数据泄露。

- 内容安全挑战：

生成式人工智能如果训练不当、使用不当，可能造成虚假信息与违法不良信息的传播，甚至成为诈骗分子的非法牟利工具。其输出内容也可能存在违法违规、违背道德伦理、内容失实、偏见歧视等问题。

- 合规性挑战：

在全球监管合规体系逐渐健全的趋势下，AI 大模型应用要遵守各地域各行业的合规要求，由于训练推理过程中需接触大规模数据，其在数据隐私合规领域的挑战尤为明显。除此之外，由于其技术的独特性，全球各国监管仍在积极探索针对 AI 大模型的监管合规政策，AI 大模型需及时响应最新的监管合规要求，在监督下有序发展。

为了帮助客户快速且安全地发展，我们也在关键环节推出了一系列产品功能，以助力企业更好地应对 AI 大模型时代的安全挑战。

2 安全解决方案

2.1 数据安全

数据是实现 AI 大模型应用成功的三要素之一，要开发出强大的大模型应用，就需要将场景相关的数据投喂给 AI 大模型应用来进行训练、对齐、微调。因此，保护这些数据的安全性以及确保数据持有方通过云平台进行模型训练过程中的数据主权就变得尤为重要。

2.1.1 百炼推理链路加密

为实现对数据安全的保护，阿里云基于百炼 MaaS 平台，设计实施了一系列数据安全防护方案，包括专有网络访问通道、Prompt 加密、数据存储、应用层传输加密、存储加密：

- 私有链接传输

为保障传输过程中网络信道安全问题，防止公网传输数据泄露，用户的推理调用、数据访问使用阿里云 Private Link 在用户自己 VPC 和百炼间创建私有链接，通过专网即可访问用户的存储实例完成训练、微调、推理等任务。且 VPC 提供网络流量监控与接口日志审计能力，可结合网络安全设备监控异常调用、专网攻击等恶意行为，提供专网保护。

- Prompt 加密

针对模型推理服务（纯模型调用、RAG 应用、Agent 应用）提供全链路的加密方案。用户输入提示词 prompt 和模型生成的答案全程不可见。解密只会发生在两个地方：根据用户输入 prompt 进行 RAG 片段召回、大模型用 prompt 生成答案时。百炼保证在客户授权情况下，遵循最小必要原则对 prompt 进行解密和使用，并且该过程只在内存中瞬间存在，不做任何的持久化存储。整体加密过程如右图所示：

- 应用层传输加密

在安全网络协议方面，为防止中间人、嗅探等网络攻击手段获取到用户与大模型服务，阿里云百炼通过支持应用层使用 HTTPS 协议进行安全数据加密传输以及采用传输层安全性 TLS 协议，为云服务和用户之间的数据传输提供保障。TLS 可提供严格的身份验证、消息隐私性和完整性保障，能够有效检测消息篡改、拦截和伪造行为。

- 存储加密

百炼平台模型推理、训练、RAG 应用的用户数据均支持外接存储部署方式，支持外接 OSS、ES、ADB、SLS。数据采集过程支持外接归属于客户的数据库实例，用户对数据 100% 完全自主可控。这些产品支持使用服务密钥和客户自选密钥作为主密钥进行数据加密，满足敏感数据密态存储的需要，可降低数据泄露。

2.2 可信计算与机密计算能力

客户将数据托管到云平台，背后意味着对云平台的信任。阿里云承诺保障客户数据主权，并积极探索从技术角度，根本性保障客户数据主权及机密性的机制。

阿里云具备完整的可信计算、机密计算基础储备，产品技术矩阵如下：

通过利用 IaaS 层级的机密计算能力，可以为大模型服务提供端到端的、覆盖模型数据全生命周期的通用数据保护方案，保护客户运行时的数据机密性。在机密计算能力的保护下，阿里云内部的管控服务、运维人员等也无法看到用户输入的提示词 prompt、RAG 文档、微调后的模型等。

在先进的技术基础上，阿里云还与生态伙伴一起探索更上层的合作伙伴。蚂蚁数科团队基于阿里云 ECS 机密计算、计算巢等基础能力，提供了面向 LLM 的大模型密态计算基座产品 MAPPIC，进一步为 AI 大模型应用安全提供支撑。

2.3 内容安全

目前，AI 大模型技术在自然语言对话场景中得到了广泛的应用。在内容安全方面，需要确保输出内容的社会安全性，包括是否合法合规、是否遵守道德伦理和公序良俗等，具体表现在防止出现违法不良信息、内容失实、偏见歧视以及违反伦理道德等。

阿里云为此建立了完整的大模型内容安全解决方案：

- 训练语料数据去毒

为进一步提升定制用户的模型训练和测试、知识库数据及模型训练微调质量，防止针对模型数据集投毒攻击，除百炼内置阿里绿网提供内容安全能力，支持对用户自有的 OSS 资源中多种违规内容（例如涉黄、暴力、违法等）的实时监控、检测和拦截。

此外，数据安全中心 / 内容安全提供了覆盖图片、视频、语音、文字等多媒体的内容风险检测的能力，帮助用户发现暴恐、色情、涉黄、暴力、惊悚、敏感、禁限、广告、辱骂等风险内容或元素，支持对训练语料进行拦截或清洗。

- Prompt 问答护栏

为了满足更高安全需求的用户，数据安全中心（sddp）/ 内容安全可进一步提升实时提问管控能力，进行风险异常识别，支持意图识别，实时过滤伦理、价值观、个人敏感数据，进行安全问答阻断。可根据用户需求，构建安全知识库与专项知识库，实现数据安全规则灵活自定义与风险决策。

全流程内容安全保障

若企业对于内容安全防护具备更高的定制需求，也可以使用阿里云的大语言模型内容安全解决方案，在自建系统中集成内容安全产品 API，实现覆盖“样本和训练管理”“模型应用”“举报与处置”“审核优化”四大阶段的内容安全整体治理。

2.4 模型安全

保护模型本身的安全，与其它信息系统的基础安全保障类似，需通过一系列流程与解决方案，确保系统漏洞不被外部攻击者恶意利用。

对于云平台，阿里云通过“全流程产品安全流程”与“红蓝对抗”切实保障了云平台本身的安全水位。

对于部署在云上的大模型系统，可使用云上弹性可扩展的安全防护能力，体系化地完成生产网、办公网安全建设。并通过云安全中心等产品，及时发现并治理线上风险。

2.5 合规性

阿里云同时拥有先进的大模型 AI 技术与云平台产品，在合规性建设方面，一方面积极跟进自身合规性建设，另一方面也在帮助云上客户完成大模型服务合规性建设。

为了进一步帮助客户更好满足《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等监管要求，阿里云通过安全产品为客户提供算法及模型备案需要的安全技术能力，同时为客户提供作为服务提供者的互联网信息服务算法备案、生成式人工智能服务备案两项咨询服务，帮助客户更好合法合规开展互联网信息服务业务。

针对用户使用百炼进行微调后的模型，阿里云内容安全产品在模型评测阶段，提供安全性专项测试服务，帮助用户了解大模型对输入、输出内容的风险防控水位。另外可提供内容安全算法备案号，帮助客户简化备案过程。