200多项分类+5级标准,金融行业数据分类分级最全模板来了

简介: 数据打标是整个数据安全治理工作中的“脏活”“累活”“难活”,同时又是数据价值挖掘和数据保护的必要基础。

数据打标是整个数据安全治理工作中的“脏活”“累活”“难活”,同时又是数据价值挖掘和数据保护的必要基础。只有对杂乱的数据按需打上准确的标签,做好分类分级,数据才有可能成为资产。


尤其对于敏感数据特别多的金融行业来说,数据交换和使用的实际需求在不断增多,而数据保护技术无法真正落地实际应用场景,数据治理工作更加困难重重。


2020年9月中国人民银行发布的《金融数据安全 数据安全分级指南》(JR/T 0197-2020)(以下简称《指南》),给出了金融数据安全分级目标、原则和范围,并根据金融业机构数据安全性遭受破坏后的影响对象和所造成的影响程度,将数据安全级别由高到低划分为五级,同时成为第三方评估机构开展数据安全检查与评估工作的参考。


近日,阿里云数据安全中心依据《指南》具体要求,业界首家推出金融行业数据分类分级模板化能力,内置贴近金融行业数据场景的200多分类子项和5级敏感标准。


客户只需要在数据安全中心控制台一键点击启用模板,系统即可完成对所有云上数据的自动打标,并按照《指南》要求完成分类分级,使敏感数据自动合规,为释放金融数据价值和深度利用奠定基础。

image.png

阿里云数据安全中心内置的

金融行业数据分类分级维度展示(部分)

与传统的人工进行数据分类分级相比,借助数据安全中心模板能力自动分类分级具有以下优势:


以1P(1024T)数据量为例,人工打标至少需要60天,而云上最多只要24小时;


对于一些被恶意隐藏的敏感数据,人工打标可能会出现漏报,而依赖于机器学习算法的自动识别模型能力,可以对每一行每一列数据进行精准识别,避免漏报;


对容易出现误报问题的姓名、员工编号、合同编号等数据内置多维度的校验规则,避免误报,提升准确率。


从业务、客户、经营管理三个维度内置超过200个贴近金融行业场景的分类子项,5级标准,上千条识别规则;



对于新增加的数据,可以近实时的将识别和分类分级结果呈现在报表中;


对于特殊的敏感数据,客户可以基于内置的数百项原子模型通过简单配置,实现自定义分类分级规则。



通过启用分类分级模板,客户可以在一个控制台全局掌握云上敏感数据资产分布:


  1. 数据视角,清晰看到敏感数据分布在哪些云上资产,以便确定最需要保护的地方在哪里;


  1. 云上资产视角,清晰的看到每个资产存储了哪些敏感数据,从而检查一些不安全的环境或者资产是否存放了敏感数据,避免被恶意获取;


  1. 管理视角,可以按照不同的敏感数据类型制定不同的治理及保护策略,以便灵活高效的开展数据安全管理工作。


目前,数据安全中心的自动分类分级能力已经落地数十个头部金融机构。除此之外,数据安全中心还内置阿里巴巴及蚂蚁集团数据安全分类分级模版可供用户选择,该模版参考DSMM模型。未来,数据安全中心还将陆续上线更多贴近行业场景的分类分级模板,助力客户在云上通过简单与智能的方式高效的做好数据保护工作。



 阿里云安全  


国际领先的云安全解决方案提供方,保护全国 40% 的网站,每天抵御 60 亿次攻击。


2020 年,国内唯一云厂商整体安全能力获国际三大机构(Gartner/Forrester/IDC)认可,以安全能力和市场份额的绝对优势占据领导者地位。


阿里云最早提出并定义云原生安全,持续为云上用户提供原生应用、数据、业务、网络、计算的保护能力,和基础设施深度融合推动安全服务化,支持弹性、动态、复杂的行业场景,获得包括政府、金融、互联网等各行业用户认可。


作为亚太区最早布局机密计算、最全合规资质认证和用户隐私保护的先行者,阿里云从硬件级安全可信根、硬件固件安全、系统可信链、可信执行环境和合规资质等方面落地可信计算环境,为用户提供全球最高等级的安全可信云。

相关文章
|
存储 数据采集 算法
数据分类分级-敏感数据识别工程实践
在《数据分类分级-结构化数据识别与分类的算法实践》这篇文章中讲到了结构化数据识别与分类的算法实践,那么这些算法能力如何以标准产品的方式落地,并帮助客户解决在数据分类分级过程中遇到的各种问题呢?本文将站在工程的视角,结合我们的思考和经验,从整体的大框架上介绍用九智汇数据分类分级产品敏感数据识别技术方案和能力,希望对大家有所帮助,想了解细节的,欢迎通过公众号联系进行线下沟通。
701 1
|
数据采集 运维 供应链
数据的分类和分级
数据的分类和分级
1365 0
|
2月前
|
机器学习/深度学习 编解码 自然语言处理
深入BERT内核:用数学解密掩码语言模型的工作原理
BERT通过掩码语言建模(MLM)实现双向语言理解,随机遮蔽15%的词并预测,结合Transformer的自注意力与多头机制,利用上下文信息生成深层语义表示。其数学设计如√d_k缩放、80-10-10掩码策略和交叉熵优化,显著提升模型性能,奠定现代NLP基础。
209 8
|
数据采集 存储 数据处理
数据治理:如何制定数据标准与规范
在当今这个数据驱动的时代,数据已成为企业最宝贵的资产之一。然而,随着数据量的爆炸性增长和数据来源的多样化,如何有效地管理和利用这些数据成为了企业面临的重大挑战。数据治理作为确保数据质量、安全性、合规性和可访问性的关键过程,其核心在于制定并执行一套科学、合理的数据标准与规范。本文将探讨如何制定数据标准与规范,以推动企业的数据治理实践。
2088 3
|
存储 数据采集 算法
数据中台最全详解,一文彻底搞懂!
中台是大型数据架构模式,也是大型架构的必备技能,本篇全面详解数据中台,建议收藏备用。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
数据中台最全详解,一文彻底搞懂!
|
JSON 监控 编译器
|
安全 搜索推荐 数据挖掘
文件解析的终极工具:Apache Tika
文件解析的终极工具:Apache Tika
2198 0
|
数据采集 算法 关系型数据库
数据分类分级实践难点
数据分类分级是开展数据全生命周期管理的基础,企业做好数据分类分级才能更好地去落实合规义务以及进行数据安全管控。今天,我们从数据分类分级落地实践的角度,来阐述企业在开展数据分类分级过程中的难点以及如何“破局”。
849 1
|
存储 数据采集 DataWorks
2万字揭秘阿里巴巴数据治理平台DataWorks建设实践
阿里巴巴一直将数据作为自己的核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续的优酷、高德、菜鸟等板块,DataWorks、MaxCompute、Hologres等产品用一套技术体系来支持不同业务的发展与创新,为企业带来整体的“数据繁荣”。 数据繁荣为我们带来了红利,同时也带动了各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从数据生产规范性治理、数据生产稳定性治理、数据生产质量治理、数据应用提效治理、数据安全管控治理、数据成本治理、数据治理组织架构及文化建设等7个方面为大家揭秘数据治理平台建设实践
32553 15
2万字揭秘阿里巴巴数据治理平台DataWorks建设实践