阿里云安全研究成果入选人工智能顶级会议 IJCAI 2019, 业界首次用AI解决又一难题!

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心漏洞修复资源包免费试用,100次1年
云安全基线管理CSPM免费试用,1000次1年
简介: 阿里云被主论坛收录的论文《Locate Then Detect:Web Attack Detection via Attention-based Deep Neural Networks》,首次解决了深度学习在Web攻击检测领域的结果可解释性问题,具有前所未有的创新意义,证明阿里云在安全AI技术的学术研究和应用方面业界领先。

8月10日至8月16日,国际人工智能组织联合会议IJCAI 2019(International Joint Conference on Artificial Intelligence 2019)在中国澳门召开。阿里云4篇AI研究论文在诸多论文中脱颖而出,其中一篇被主论坛收录,三篇被AIBS Workshop 收录。论文深入解析了AI技术在网络安全、数据安全和内容安全领域研究成果和场景化应用,展示了阿里云安全在智能安全领域的领导性。

自1969年首次在华盛顿特区举办以来,IJCAI已成为人工智能领域最重要的顶级学术会议之一。每年被IJCAI成功收录的论文均是AI领域最前沿的研究成果。今年IJCAI主论坛的论文收录率仅为17.9%,比去年收录率更低。阿里云被主论坛收录的论文《Locate Then Detect:Web Attack Detection via Attention-based Deep Neural Networks》,首次解决了深度学习在Web攻击检测领域的结果可解释性问题,具有前所未有的创新意义,证明阿里云在安全AI技术的学术研究和应用方面业界领先。

《Locate Then Detect:Web Attack Detection via Attention-based Deep Neural Networks》(Tianlong Liu, Yu Qi, Liang Shi, Jianan Yan),即基于注意力机制的深度神经网络在Web攻击检测中的应用。

1

该论文提出了一种全新的两段式Web攻击检测框架,称之为Locate-Then-Detect(LTD)。LTD模型结合了Object Detection和注意力机制的思想,创造性的提出了PLN(Payload Locating Network 攻击载荷靶向定位网络)与PCN(Payload Classification Network 攻击载荷分类网络),通过两个深度神经网络的结合,可以准确的定位恶意攻击所在的位置,并对其类型进行精准识别。PLN用来定位攻击向量的可疑位置,PCN再对识别出的可疑向量进行分类,通过靶位识别网络的提取能力,能够使得检测系统更加关注真正有害的攻击,从而规避掉整个请求内容中正常部分对模型预测结果的影响。

LTD首次解决了深度学习在Web攻击检测领域的结果可解释性问题(通过Payload的靶向定位实现),同时在与其他传统方式的对比中,LTD也表现出超过了基于规则、符号特征和传统机器学习方法的效果。目前,LTD检测框架已通过AI内核的形式实际应用阿里云Web应用防火墙产品当中,通过AI内核的加持,为云上客户提供实时的智能防护,保障云上用户安全。

被AIBS Workshop Paper(Artificial Intelligence for Business Security)收录另外三篇论文主题均聚焦在AI技术在云安全的最新研究成果和应用,分别为《Multi-strategy Integration Architecture for Pornographic Web Site Detection》、《Insider Threat-Data Exfiltration Detection using Node2Vec in Instant Message》、《Webshell Detection with Attention-Based Opcode Sequence Classification》。

《Multi-strategy Integration Architecture for Pornographic Web Site Detection》(Yu Pang),即基于多策略融合的色情风险检测模型。

随着互联网的不断发展,违禁风险内容也不断增加,如暴力、色情、种族歧视等,因此,必须建立一个功能强大的能够识别和屏蔽该类风险的检测模型。该论文针对该问题提出了一个基于多策略融合的色情网站风险检测模型。与其他商业化场景中主要使用的基于网站内容的检测模型(如关键字检测或黑名单检机制等)不同,该方法融合文本特征、结构内容特征和语义特征构造检测模型。实验结果表明,该模型在精度和F1评分上都优于其他风险检测模型。

《Insider Threat-Data Exfiltration Detection using Node2Vec in Instant Message》(Xiaoyu Tang, Jie Chen),即内部威胁检测:基于Node2Vec的数据泄漏检测模型。

数据是很多公司的核心资产,包括但不限于公司的未来规划、交易数据、员工个人信息数据、客户数据等等,内部员工导致数据泄漏是代价最高而且最难以检测的,一方面内部员工本身可能拥有公司的多种权限,能够接触到大量的敏感数据;另一方面由于公司内部,和外部客户的数据交流经常会使用即时通讯工具进行,即时通讯工具可能被一些员工用来做敏感数据备份或者是数据外移的工具。因此,在即时通讯工具层面做数据安全防护是有意义且必要的。传统上在即时通讯工具上进行用户行为异常检测是使用一些统计规则,以及统计数据,这种方式由于需要更多人为经验去进行特征抽取,召回率和准确率都不高。经过分析和调研,本文发现可疑用户在即时通讯工具中传输文件会产生和正常用户不同的文件网络结构,据此,我们提出利用Node2Vec检测异常的文件传输结构的方法,能够完成自动化的进行特征抽取,并且在准确和召回上都有比较好的表现效果。

《Webshell Detection with Attention-Based Opcode Sequence Classification》(Wei He, Yue Xu, Liang Shi),即基于注意力机制Opcode序列的Webshell检测。

近年来,越来越多的Web应用程序迁移到云平台上,它们可能包含严重的Webshell或者由于存在漏洞而被植入了Webshell。但是针对Webshell的检测存在一些挑战,因为Webshell通常在恶意和正常文件之间没有明确的界限。例如,WordPress中的上传插件和管理员维护页面的功能与恶意Webshell非常相似,另一方面,许多Webshell为了绕过各种检测手段模拟成正常脚本的形态。因此,一个可靠的检测器应该以低误报率区分Webshell和普通Web脚本。本文提出了一种基于操作码序列检测的方法,我们建立了一个序列分类模型来预测恶意Webshell的概率。此方法不处理PHP脚本的模糊部分,而是处理执行时的实际机器代码。利用具有注意机制的BiLSTM来学习和识别操作码序列。通过超过30,000个样本的评估,实验结果表明我们的方法达到了F1=98.78%和AUC=99.97%,超过了其他检测模型。由于具有良好的准确性和多功能性,我们的方法可以用作常见的Webshell检测中,而不仅仅是PHP Webshell。

阿里云目前服务中国40%的网站,为上百万客户提供基础安全防御。每天由阿里云成功抵御的大流量DDoS攻击占全国的一半以上。丰富的实践经验为阿里云的学术研究提供了有利条件,最前沿的研究成果反哺产品及攻防实践,为客户提供更加智能的安全产品和服务,以保障千万企业云上安全。

相关文章
|
25天前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
25 1
|
2月前
|
人工智能 运维 安全
阿里云通过ISO42001人工智能管理认证,引领AI治理推动协同共治
9月19日,在杭州云栖大会「AI治理与安全论坛」上,阿里云宣布通过人工智能技术的全生命周期管理ISO42001体系认证。该项认证由国际标准化组织(ISO)和国际电工委员会(IEC)制定,是第一部可认证的人工智能国际管理体系标准。
121 14
|
3天前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
23 12
|
1天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
13天前
|
机器学习/深度学习 人工智能 搜索推荐
人工智能与未来医疗:AI技术如何重塑医疗健康领域###
【10月更文挑战第21天】 一场由AI驱动的医疗革命正在悄然发生,它以前所未有的速度和深度改变着我们对于疾病预防、诊断、治疗及健康管理的认知。本文探讨了AI在医疗领域的多维度应用,包括精准医疗、药物研发加速、远程医疗普及以及患者个性化治疗体验的提升,揭示了这场技术变革背后的深远意义与挑战。 ###
44 6
|
15天前
|
人工智能 自动驾驶 数据安全/隐私保护
人工智能的伦理困境:我们如何确保AI的道德发展?
【10月更文挑战第21天】随着人工智能(AI)技术的飞速发展,其在各行各业的应用日益广泛,从而引发了关于AI伦理和道德问题的讨论。本文将探讨AI伦理的核心问题,分析当前面临的挑战,并提出确保AI道德发展的建议措施。
|
15天前
|
人工智能 搜索推荐 安全
人工智能与未来社会:探索AI在教育领域的革命性影响
本文深入探讨了人工智能(AI)技术在教育领域的潜在影响和变革。通过分析AI如何个性化学习路径、提高教学效率以及促进教育资源的公平分配,我们揭示了AI技术对教育模式的重塑力量。文章还讨论了实施AI教育所面临的挑战,包括数据隐私、伦理问题及技术普及障碍,并提出了相应的解决策略。通过具体案例分析,本文旨在启发读者思考AI如何助力构建更加智能、高效和包容的教育生态系统。
|
30天前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
37 6
|
7天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
下一篇
无影云桌面