从发现到治理:如何高效审计,确保企业云上资源配置持续合规?

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 在企业发展过程中,基于内控外审的要求进行合规审计逐步成为必备基线。保障基线要求持续满足,需要完整的发现→检测→告警→治理方案。

背景

企业为保证经营活动的有序运行,保障IT服务的稳定性和合规性,通常会对IT服务制定相关管控措施并进行监督和审计。常见的管控场景如:法规和行业标准的遵循、云采用架构规范、企业安全管控基线、稳定性配置基线、IT资产运维管理规范等。


企业IT系统上云后,云计算开箱即用为企业构建新的技术能力提供了便捷的支撑,享受弹性和敏捷的同时企业管控层面的保障也愈发重要,如何保障企业的基础设施持续满足基线要求,这是每一个上云企业都将要面临的问题。传统的内控治理采用周期盘点或人工抽查的方式一是效率低下,其次随着业务IT系统逐步发展庞大后,实际的合规率会愈发糟糕。


方案概述

配置审计是一项面向资源配置的审计服务,从资源发现->检测->告警->治理提供了一些列产品能力。同时考虑到企业结合自己业务特性可能会有相对比较特殊的一些治理要求,配置审计也提供了自定义检测和自定义修正的能力,以满足企业个性化的落地诉求,保障基线落地的完整性。

上图为企业内控基线在配置审计的实施和治理过程,下文会进行详细说明。


规则实施

规则运行机制

规则是配置审计原子审计能力,提供了配置变更触发和周期触发两种评估方式。配置变更通常在客户对云产品进行变更后10分钟内会完成规则的最新评估,保证了规则评估的实时性。另一部分规则支持周期评估触发,客户可以自行设置评估周期,最大24小时会完成一次最新评估。


预置能力

配置审计提供了350+的托管规则,客户只需对规则预设的一些信息进行确认并完成参数输入即可创建一条规则,无需任何代码工作。托管规则覆盖38个云产品、70个资源类型,涵盖了客户常用的云产品。功能方面则从标签治理、实例规格、公网暴露、数据加密、资源状态、运维设置、日志存储、身份权限检测等多维度提供了丰富的托管规则,满足大多数治理需要。

同时配置审计提供了法规、安全及稳定性、最佳实践方面的16个合规包模版。客户可以快速启用,也可以对模版中的预置规则进行筛选或自行加入新的规则。下面介绍几个比较通用的合规包模版:

  • CIS网络安全框架检查合规包:参照CIS Alibaba Cloud Foundation Benchmark v1.0.0的建议,提供部分建议的合规性检测。
  • 资源稳定性最佳实践:从高可用基础架构、容量保护、变更管理、监控管理、备份管理、故障隔离六大维度对云上资源的稳定性做检测,有助于提前发现隐患,提升稳定性和运维效率。
  • PCI-DSS数据安全标准合规包:参照PCI DSS v4.0对账号数据保护的基线标准,从云上资源使用和管控方面提供部分建议的合规性检测。
  • 资源开启公网检测最佳实践:检测公网暴露情况,涉及关系型数据库、数据服务类、安全组等云产品。暴露公网会存在较大的安全隐患,建议及时发现并治理。
  • 多可用区架构最佳实践:关系型数据库、NoSQL数据库、负载均衡等产品高可用架构最佳实践,构建可用区级别的容灾能力,保障服务可用性和数据可靠性。
  • 资源空闲检测最佳实践:检测常见的云资源在购买以后是否被闲置,涉及弹性公网IP、共享带宽、VPC、VPN等云产品。资源购买后未启用会导致企业成本的浪费,建议及时发现并治理。
  • 账号权限合规管理最佳实践:基于账号权限的合规最佳实践,对阿里云账号和RAM用户进行全面的合规检查。

更多模版请参考配置审计产品文档或登录控制台进行查看。


自定义规则

尽管配置审计提供了丰富的托管规则和合规包模版,但客户在实际进行基线实施的过程中难免会有少量的比较特殊的治理需求无法通过预置能力来完成,为了保障客户基线实施的完整性,配置审计提供了自定义规则的能力。自定义规则依赖函数计算,原理是配置审计提供配置变更或周期的方式触发客户部署在函数计算上的检测代码,评估完成后回调配置审计将评估结果回写。

自定义规则需要基本的开发能力,但整个过程还是相对简单的,主要是两部分工作:参考示例编写FC函数(只需修改评估逻辑的部分)、创建规则并关联函数。完整的自定义规则实施过程和更多代码示例可参考配置审计产品文档。


监控及治理

设置监控

及时感知合规评估产生的不合规事件以及云上的资源变化,尽早确认和介入处理可有效提升企业对云上生产运营管控的质量。配置审计通过和云产品集成,为客户提供了较多的监控通知的选择。客户可以自行设置投递将资源变更和不合规事件推送至用户自己的数据空间,便于进一步做分析处理和自定义留存,用户投递渠道目前支持SLS、OSS、MNS。同时在用户开通配置审计后,配置审计会自动将新产生的资源变更事件和不合规事件推送至CMS和EB,客户可以直接基于相关渠道进行监控报警设置或程序消费定制化处理。


合规治理

感知到不合规事件最终目标是要通过治理将云上资源或行为提升到符合管控预期,具体的治理方式配置审计提供了自动修正、为规则评估设置过滤或例外等能力,当然客户也可以根据实际情况自行通过相关云产品控制台或API进行治理。

自动修正:为规则设置自动修正后,当配置审计检测到不合规资源时会自动修复为合规状态,这极大提升了治理效率,保障了持续合规。目前配置审计预置提供了标签治理、部分安全功能开启、日志留存等自动修复能力。考虑到不同场景对修复的要求可能不太一样,配置审计也提供了自定义修正能力,以满足企业全面自动化治理的需求。自定义修正的原理同自定义规则基本一致,不同之处主要在于自定义修正场景配置审计只提供触发函数计算的能力,修正成功后无需回调配置审计,资源修正后会伴随资源变更事件或者周期评估在下一次评估时更新合规状态。


规则评估过滤:规则会默认对关联的资源类型进行全量评估,但实际使用中可能会因为资源应用环境不同或项目不同,造成同一个检测规则不同标准下有较多的不合规检出,如部分资源应用于开发或测试环境,规格或配置要求较低被检出不合规。这种情况下可以使用规则的评估生效能力,目前支持资源组、标签、地域、资源ID纬度的生效范围设置能力,可以基于这些维度调整规则的评估范围,避免因要求不一而导致的较多不合规事件产生。


评估结果例外:配置审计同时也提供了对不合规结果忽略的能力,适用于存在少量特权资源或者短时间内没办法治理合规但又不想被频繁的不合规报警干扰的场景。设置忽略时可以选填忽略的原因以及恢复评估的时间,如果设置了恢复时间,到期后系统会自动根据资源的最新状态恢复常态化检测。


自主治理:客户也可以根据资源的使用情况和不合规原因自主通过云产品控制台或API进行治理。


报告及统计

报告下载及解读

配置审计提供了基本的合规报告能力,客户可以登录配置审计控制台通过规则列表页或者合规包详情页进行报告下载。报告包含了资源信息、规则信息、资源的不合规原因等。报告下载一是可以用于企业内部治理推进和确认、其次也可以为审计人员提供基本的合规证据。


统计集成

除了基本的报告能力外,配置审计同样有丰富的公开API包括投递能力可用于客户和内部治理系统进行集成。公开API提供了从服务启用到规则、合规包、投递管理等能力,也包含资源和合规数据的查询及统计能力。


多账号统一管控

伴随企业云上业务规模逐步扩大,通常会采用多账号用云的模式。针对多账号场景,配置审计全面集成了资源目录。客户开通资源目录后,可以在配置审计创建账号组,账号组可以任意组合资源目录中的成员,也可以创建全局账号组,全局账号组会自动和资源目录的成员列表保持实时同步。基于账号组就可以对多账号实施基线管控了,本文提到的产品能力都同样支持账号组,控制台使用过程中注意切换到要管控的账号组视图,API层面同样注意使用账号组相关API即可。


更多内容

如需了解更多配置审计相关使用细节,可查看产品文档:https://help.aliyun.com/document_detail/127388.html


想要了解更多产品细节,也可扫码加入「配置审计客户群」咨询更多~

                                                   群二维码.png

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
21天前
|
SQL 弹性计算 安全
企业云资源端到端安全合规:最佳实践与工具应用
本次课程围绕企业合规的重要性、云上合规框架、阿里云提供的工具及新能力展开。首先,讲解了企业面临的合规挑战,如配置错误导致的数据泄露风险。其次,介绍了合规框架的来源和主动合规的重要性。接着,详细说明了如何通过资源中心、操作审计、管控策略和配置审计等工具实现云资源端到端的合规管理。最后,发布了阿里云在合规方面的最新能力,帮助企业更好地应对合规需求。
|
5月前
|
机器学习/深度学习 人工智能 运维
提升数据中心效率的关键:智能运维策略与实践
【7月更文挑战第39天】 在数字化时代,数据中心作为企业信息系统的心脏,其运行效率直接关系到企业的业务连续性和竞争力。本文将探讨如何通过智能运维(AIOps)策略来优化数据中心的性能,降低运营成本,并提高服务质量。我们将分析当前数据中心面临的挑战,介绍智能运维的基本概念,以及实施智能运维时需要考虑的关键因素。最后,本文将提供一系列实用的智能运维实践案例,帮助读者理解如何将这些策略应用于实际工作中。
|
7月前
|
人工智能 运维 安全
现代网络安全挑战与运维策略
在当今数字化快速发展的环境中,网络安全面临着越来越复杂的挑战。本文探讨了现代网络运维中的关键安全问题,并提出了有效的策略和解决方案,帮助组织有效应对各种安全威胁。
|
8月前
|
机器学习/深度学习 传感器 运维
提升数据中心效能:智能运维策略与实践
【4月更文挑战第6天】在数字化时代,数据中心作为企业信息架构的核心,其稳定性和效率直接影响到业务连续性和客户满意度。随着技术的进步,传统的数据中心运维模式已经不能满足现代高效、智能化的需求。本文将探讨如何通过智能运维(AIOps)策略,结合大数据分析和机器学习技术,实现数据中心的自动化管理、故障预测及快速响应,以提升整体效能并降低运营成本。
|
存储 对象存储
成本管理是云服务使用过程中非常重要的一个方面
成本管理是云服务使用过程中非常重要的一个方面
109 2
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.3 稳定性巡检总结
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.3 稳定性巡检总结
113 0
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.1 什么是稳定性治理
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.1 什么是稳定性治理
120 0
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.3 稳定性治理的思考与拓展
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.3 稳定性治理的思考与拓展
105 0
|
容灾 测试技术 数据中心
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.2 稳定性治理的思想
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.2 稳定性治理的思想
114 0
|
弹性计算 负载均衡 监控
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(1)
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(1)
112 0