带你读《阿里云安全白皮书》(二十四)——云上安全建设最佳实践(2)

简介: 本文介绍了阿里云在AI大模型云上安全方面的最佳实践,涵盖数据安全、模型安全、内容安全和合规性四大关键挑战。阿里云通过数据加密、私有链接传输、机密计算等技术手段,确保数据和模型的安全性;同时,提供内容安全检测、Prompt问答护栏等功能,保障生成内容的合法合规。此外,阿里云还帮助企业完成算法及模型备案,助力客户在AI大模型时代安全、合规地发展。

点击链接下载查看完整版内容👉:《阿里云安全白皮书(2024版)》

点击链接下载查看上文👉带你读《阿里云安全白皮书》(二十三)——云上安全建设最佳实践


迎接未来:AI 大模型云上安全最佳实践

ChatGPT 的问世和成功引领生成式人工智能的蓬勃发展,各类 AI 大模型产品如雨后春笋般涌现, 正在各行各业积极探索应用落地场景。其中不乏 Perplexity 这样挑战 Google 搜索地位的新星、  妙鸭相机这样的爆火应用。


在 AI 大模型产品快速发展的前提下,如何保护各方数据安全与主权,并有效地帮助客户应对由这 些技术带来的算法安全和内容安全风险,已成为 AI 大模型时代云平台面临的关键命题,也是对数 智化基础设施的重大挑战。

1 AI 大模型关键安全风险

 

阿里云同时拥有领先的云计算业务与先进的大模型技术,基于自身 AI 大模型的安全建设实践,阿 里云希望能将这一未来重点领域的安全风险洞察、解决方案分享给社会。


一款 AI 大模型产品需经历数据准备、模型训练与微调、模型部署、模型运行阶段,在这些阶段过 程中,面临着众多威胁与挑战,其中四项关键挑战为:


-    数据安全挑战:

为了使通用模型在特定领域实现更好的智能,企业需要对其自身业务数据进行 提炼,并通过微调等技术将这些数据融入到模型中。鉴于这类数据对企业至关 重要,在数据的收集、清洗、分析及存储过程中,都需要有完善的安全机制进 行保障。

模型在线上运行服务期间,用户的 Prompt 输入及其返回的内容可能涉及用 户的隐私。因此,如何保障用户隐私不被侵犯成为 AI 大模型类产品的核心挑 战之一。


-    模型安全挑战:

模型承载了对数据的“记忆”,因此模型一旦泄露,等同于训练数据的泄露。   而模型在研发、部署阶段,大量的一线员工具备模型的访问权限,同时生产环  境也面临着与传统信息系统一样的外部入侵威胁。一旦系统存在可被入侵的漏  洞,就可能导致模型被外部攻击者窃取,从而间接导致参与训练的敏感数据泄露。


-    内容安全挑战:

生成式人工智能如果训练不当、使用不当,可能造成虚假信息与违法不良信息  的传播,甚至成为诈骗分子的非法牟利工具。其输出内容也可能存在违法违规、 违背道德伦理、内容失实、偏见歧视等问题。


-    合规性挑战:

在全球监管合规体系逐渐健全的趋势下,AI 大模型应用要遵守各地域各行业  的合规要求,由于训练推理过程中需接触大规模数据,其在数据隐私合规领域  的挑战尤为明显。除此之外,由于其技术的独特性,全球各国监管仍在积极探  索针对 AI 大模型的监管合规政策,AI 大模型需及时响应最新的监管合规要求, 在监督下有序发展。


为了帮助客户快速且安全地发展,我们也在关键环节推出了一系列产品功能, 以助力企业更好地应对 AI 大模型时代的安全挑战。


2 安全解决方案

 

2.1 数据安全

 

数据是实现 AI 大模型应用成功的三要素之一,要开发出强大的大模型应用,就需要将场景相关的 数据投喂给 AI 大模型应用来进行训练、对齐、微调。因此,  保护这些数据的安全性以及确保数据 持有方通过云平台进行模型训练过程中的数据主权就变得尤为重要。

2.1.1 百炼推理链路加密

为实现对数据安全的保护,阿里云基于百炼 MaaS 平台,设计实施了一系列 数据安全防护方案,包括专有网络访问通道、Prompt 加密、数据存储、应用 层传输加密、存储加密:

 

-    私有链接传输

为保障传输过程中网络信道安全问题,防止公网传输数据泄露,用户的推理调 用、数据访问使用阿里云 Private Link 在用户自己 VPC 和百炼间创建私有 链接,通过专网即可访问用户的存储实例完成训练、微调、推理等任务。且 VPC 提供网络流量监控与接口日志审计能力,可结合网络安全设备监控异常 调用、专网攻击等恶意行为,提供专网保护。

 

-    Prompt 加密

针对模型推理服务(纯模型调用、RAG 应用、Agent 应用)提供全链路的 加密方案。用户输入提示词 prompt 和模型生成的答案全程不可见。解密 只会发生在两个地方:根据用户输入 prompt 进行 RAG 片段召回、大模型 prompt 生成答案时。百炼保证在客户授权情况下,遵循最小必要原则对 prompt 进行解密和使用,并且该过程只在内存中瞬间存在,不做任何的持久 化存储。整体加密过程如右图所示:

image.png

-    应用层传输加密

在安全网络协议方面,为防止中间人、嗅探等网络攻击手段获取到用户与大模 型服务,阿里云百炼通过支持应用层使用 HTTPS 协议进行安全数据加密传 输以及采用传输层安全性 TLS 协议,为云服务和用户之间的数据传输提供保 障。TLS 可提供严格的身份验证、消息隐私性和完整性保障,能够有效检测 消息篡改、拦截和伪造行为。

 

-    存储加密

百炼平台模型推理、训练、RAG 应用的用户数据均支持外接存储部署方式, 支持外接 OSSESADBSLS。数据采集过程支持外接归属于客户的数 据库实例,用户对数据 100% 完全自主可控。这些产品支持使用服务密钥和 客户自选密钥作为主密钥进行数据加密,满足敏感数据密态存储的需要,可降 低数据泄露。

2.2 可信计算与机密计算能力


客户将数据托管到云平台,背后意味着对云平台的信任。阿里云承诺保障客户数据主权,并积极 探索从技术角度,根本性保障客户数据主权及机密性的机制。


阿里云具备完整的可信计算、机密计算基础储备,产品技术矩阵如下:

image.png

通过利用 IaaS 层级的机密计算能力,可以为大模型服务提供端到端的、覆盖 模型数据全生命周期的通用数据保护方案,保护客户运行时的数据机密性。在 机密计算能力的保护下,阿里云内部的管控服务、运维人员等也无法看到用户 输入的提示词 prompt、RAG 文档、微调后的模型等。

image.png

在先进的技术基础上,阿里云还与生态伙伴一起探索更上层的合作伙伴。蚂蚁  数科团队基于阿里云 ECS 机密计算、计算巢等基础能力,提供了面向 LLM  的大模型密态计算基座产品 MAPPIC,进一步为 AI 大模型应用安全提供支撑。

image.png

2.3 内容安全

目前,AI 大模型技术在自然语言对话场景中得到了广泛的应用。在内容安全方面,需要确保输出 内容的社会安全性,包括是否合法合规、是否遵守道德伦理和公序良俗等,具体表现在防止出现 违法不良信息、内容失实、偏见歧视以及违反伦理道德等。

阿里云为此建立了完整的大模型内容安全解决方案:

 

-    训练语料数据去毒

为进一步提升定制用户的模型训练和测试、知识库数据及模型训练微调质量, 防止针对模型数据集投毒攻击,除百炼内置阿里绿网提供内容安全能力,支持 对用户自有的 OSS 资源中多种违规内容(例如涉黄、暴力、违法等)的实时 监控、检测和拦截。

此外,数据安全中心 / 内容安全提供了覆盖图片、视频、语音、文字等多媒体  的内容风险检测的能力,帮助用户发现暴恐、色情、涉黄、暴力、惊悚、敏感、 禁限、广告、辱骂等风险内容或元素,支持对训练语料进行拦截或清洗。

 

-    Prompt 问答护栏

为了满足更高安全需求的用户,数据安全中心(sddp)/ 内容安全可进一步提 升实时提问管控能力,进行风险异常识别,支持意图识别,实时过滤伦理、价 值观、个人敏感数据,进行安全问答阻断。可根据用户需求,构建安全知识库 与专项知识库,实现数据安全规则灵活自定义与风险决策。

image.png

 全流程内容安全保障

若企业对于内容安全防护具备更高的定制需求,也可以使用阿里云的大语言模 型内容安全解决方案,在自建系统中集成内容安全产品 API,实现覆盖“样本 和训练管理”“模型应用”“举报与处置”“审核优化”四大阶段的内容安全 整体治理。


2.4 模型安全

保护模型本身的安全,与其它信息系统的基础安全保障类似,需通过一系列流程与解决方案,确 保系统漏洞不被外部攻击者恶意利用。

对于云平台,阿里云通过“全流程产品安全流程”与“红蓝对抗”切实保障了云平台本身的安全水位。

对于部署在云上的大模型系统,可使用云上弹性可扩展的安全防护能力,体系化地完成生产网、 办公网安全建设。并通过云安全中心等产品,及时发现并治理线上风险。


2.5 合规性

阿里云同时拥有先进的大模型 AI 技术与云平台产品,在合规性建设方面,一方面积极跟进自身合 规性建设,另一方面也在帮助云上客户完成大模型服务合规性建设。


为了进一步帮助客户更好满足《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成 管理规定》《生成式人工智能服务管理暂行办法》等监管要求,阿里云通过安全产品为客户提供 算法及模型备案需要的安全技术能力,同时为客户提供作为服务提供者的互联网信息服务算法备 案、生成式人工智能服务备案两项咨询服务,帮助客户更好合法合规开展互联网信息服务业务。

针对用户使用百炼进行微调后的模型,阿里云内容安全产品在模型评测阶段,提供安全性专项测  试服务,帮助用户了解大模型对输入、输出内容的风险防控水位。另外可提供内容安全算法备案号, 帮助客户简化备案过程。

相关文章
|
3天前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
|
7天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
4天前
|
人工智能 运维 双11
2024阿里云双十一云资源购买指南(纯客观,无广)
2024年双十一,阿里云推出多项重磅优惠,特别针对新迁入云的企业和初创公司提供丰厚补贴。其中,36元一年的轻量应用服务器、1.95元/小时的16核60GB A10卡以及1元购域名等产品尤为值得关注。这些产品不仅价格亲民,还提供了丰富的功能和服务,非常适合个人开发者、学生及中小企业快速上手和部署应用。
|
12天前
|
人工智能 弹性计算 文字识别
基于阿里云文档智能和RAG快速构建企业"第二大脑"
在数字化转型的背景下,企业面临海量文档管理的挑战。传统的文档管理方式效率低下,难以满足业务需求。阿里云推出的文档智能(Document Mind)与检索增强生成(RAG)技术,通过自动化解析和智能检索,极大地提升了文档管理的效率和信息利用的价值。本文介绍了如何利用阿里云的解决方案,快速构建企业专属的“第二大脑”,助力企业在竞争中占据优势。
|
14天前
|
自然语言处理 数据可视化 前端开发
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
合合信息的智能文档处理“百宝箱”涵盖文档解析、向量化模型、测评工具等,解决了复杂文档解析、大模型问答幻觉、文档解析效果评估、知识库搭建、多语言文档翻译等问题。通过可视化解析工具 TextIn ParseX、向量化模型 acge-embedding 和文档解析测评工具 markdown_tester,百宝箱提升了文档处理的效率和精确度,适用于多种文档格式和语言环境,助力企业实现高效的信息管理和业务支持。
3935 2
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
|
3天前
|
算法 安全 网络安全
阿里云SSL证书双11精选,WoSign SSL国产证书优惠
2024阿里云11.11金秋云创季活动火热进行中,活动月期间(2024年11月01日至11月30日)通过折扣、叠加优惠券等多种方式,阿里云WoSign SSL证书实现优惠价格新低,DV SSL证书220元/年起,助力中小企业轻松实现HTTPS加密,保障数据传输安全。
495 3
阿里云SSL证书双11精选,WoSign SSL国产证书优惠
|
10天前
|
安全 数据建模 网络安全
2024阿里云双11,WoSign SSL证书优惠券使用攻略
2024阿里云“11.11金秋云创季”活动主会场,阿里云用户通过完成个人或企业实名认证,可以领取不同额度的满减优惠券,叠加折扣优惠。用户购买WoSign SSL证书,如何叠加才能更加优惠呢?
985 3
|
7天前
|
机器学习/深度学习 存储 人工智能
白话文讲解大模型| Attention is all you need
本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档,我们期望为读者提供一个全面的理解,帮助大家掌握大模型的工作原理,增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。
392 15
白话文讲解大模型| Attention is all you need
|
7天前
|
算法 数据建模 网络安全
阿里云SSL证书2024双11优惠,WoSign DV证书220元/年起
2024阿里云11.11金秋云创季火热进行中,活动月期间(2024年11月01日至11月30日),阿里云SSL证书限时优惠,部分证书产品新老同享75折起;通过优惠折扣、叠加满减优惠券等多种方式,阿里云WoSign SSL证书将实现优惠价格新低,DV SSL证书220元/年起。
559 5
|
3天前
|
安全 网络安全
您有一份网络安全攻略待领取!!!
深入了解如何保护自己的云上资产,领取超酷的安全海报和定制鼠标垫,随时随地提醒你保持警惕!
692 1
您有一份网络安全攻略待领取!!!