阿里云WAF爬虫风险管理升级,定义高效业务安全

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心 免费版,不限时长
云安全基线管理CSPM免费试用,1000次1年
简介: 提升防护效果,提升使用体验。

————————

验证 “人是人”

数据爬取、秒杀、盗号、薅羊毛、刷票、灌水、垃圾注册、虚假投票、虚假点击、虚假下单……

相信你对各类验证码并不陌生,在访问网站或应用时,我们常要证明自己不是机器。

————————

为了更好帮助云上用户规避此类业务安全风险,1月27日,阿里云Web应用防火墙(WAF)爬虫风险管理功能升级,一方面通过算法升级提升防护效果,另一方面通过向导式操作指引降低运维负担,帮助用户快速打造适合自身业务特点的智能防爬系统。

阿里云WAF爬虫风险管理功能覆盖网页、H5、原生APP、API、公众号、小程序等全场景Web应用防护,支持公共云反向代理接入、ECS/SLB一键透明接入、混合云/多云部署、独享集群部署、CDN一键开启等多种接入方式。阿里云用户可在WAF控制台中选择对抗策略,识别并管控Bot流量。

核心能力升级,好用、易用的防爬工具

在阿里云安全团队的长期观察中,爬虫这类代替或模拟人类用户自动化、快速、大批量执行特定任务的自动化程序,背后有着明确的变现思路与产业链分工,已具备明显的趋利性与强对抗特征,开始走向专业化与产业化,防护难度日趋增高。

11.png

因此,在进行防控时识别维度的丰富性和处置方式的灵活性是核心能力。同时,由于防爬多数时候是个持续对抗的过程,在针对不同场景的防控方案上,专家经验非常重要。

面对长期实践中总结的用户痛点,阿里云爬虫风险管理做了智能算法和用户体验两个维度的针对性升级,将防爬功能做到真正好用、易用。

智能算法提升防护能力


机器学习和深度学习构建了阿里云通用、智能的AI安全防护模型体系。应用神经网络构造多模态特征表示,基于5大类9000+行为和环境指纹特征,对用户流量进行多维度刻画、分析,通过意图分析智能引擎区分正常流量和恶意流量,并且根据场景特征自动生成防护策略。

实时和离线双联路联合决策方案,通过持续学习和模型优化缓解防爬场景对抗问题。实时检测模型对线上流量进行实时刻画,离线模型进行“增量学习”,时刻保留模型重要特征,当对抗发生时能通过自动更新模型策略进行变异风险的自主对抗。

22.png

用户视角改进产品体验

  • 场景化防护,专注业务风险

根据下单、注册、登录、查票等场景定义防护目标,推荐防护策略;基于页面与接口展示防控效果,可视化呈现机器流量比例与拦截分析。

  • 向导式配置,快速Get最佳实践

分步进行场景定义、策略配置、防护效果验证,搭配灵活的自定义策略,轻松构建专家级防护。

  • 灰度验证机制,远离变更故障

策略正式发布前提供防护效果灰度验证,无需担心因策略配置不当、防护兼容性问题等原因导致的大规模误拦截。

实战场景验证,显著提升业务安全水平

阿里云WAF爬虫风险管理,帮助用户解决细粒度、丰富场景下的业务安全问题。

33.png

《The Forrester New WaveTM : Bot Management, Q1 2020》报告中,阿里云安全作为唯一中国厂商入选,防爬能力获得认可。

1. 大量、复杂的API数据接口处置

某航空公司以XHR数据接口提供航班查询服务,长期以来遭受黑灰产及各种旅行公司爬取。之前的安全管理,为了减少正常业务流量误伤采用宽松策略,存在大量漏防。

阿里云WAF的JS无感人机识别,在不产生任何客户投诉和业务影响的情况下,漏防流量较原本方案降低了99%。采集网页环境中的操作行为、设备硬件、指纹等特征,防爬策略判断请求是否来自于自动化工具,并实现XHR接口的浏览器校验、验证码等验证手段,过滤约70%的攻击流量,并对剩余30%的攻击流量使用Browser Driver识别,通过验证码方式的唤醒行为进行拦截。

2. 自动化算法模型

某招聘网站的候选人简历与岗位信息厂商被各种猎头机构与竞品爬取。面临对精心构造的低频、离散IP,单一规则防护易被绕过。

阿里云WAF对客户相关数据接口上的所有流量进行Bot属性打标,并根据不同访问特征进行UBA(User Behavior Analytics)建模。在部署完成后的十数次攻防对抗中,模型均能自动化监控并快速学习攻击流量特征,针对攻击流量唤起处置,无需客户与运营介入。

3.SDK接入APP环境

某交易网站以APP作为主要用户访问平台,低价商品常在上线瞬间被恶意秒杀。为了逃避检测机制,攻击者采用真机攻击,通过改机框架与ADB远控等方式,利用脚本操作手机进行恶意行为,识别难度大。

集成爬虫风险管理SDK后,阿里云WAF直接在流量层面针对各种异常的设备访问方式(如Root、Debugger、进程注入、改机Hook等)进行识别和拦截,多维度刻画过滤,恶意秒杀的情况被遏制。

**4. 非对抗解决方案
**

某金融网站信息常被第三方网站爬取,并在数据加工后提供售卖。由于客户本身的业务系统复杂,以及面向金融类敏感信息的高强度攻防对抗,直接拦截的方式并不是最优解。

阿里云WAF采用了异步处置回源打标的方式,在网关层标记异常流量,并对被打标的请求返回虚假数据,以此干扰了第三方网站的数据准确性,与客户的风控能力耦合,为业务安全赋能。

————————


好的爬虫风险管理工具应当好用、易用,且体现运维价值。

阿里云安全团队致力于打造一套尽可能灵活的工具,帮助用户跳过繁琐的实现细节,同时利用云上海量的数据和计算能力、弹性扩容能力以及威胁情报,实现最适合自身业务特点的防爬能力构建。

相关文章
|
云安全 负载均衡 网络协议
阿里云waf简介和如何配置​
阿里云WAF(Web应用程序防火墙)是一种高效、智能的云安全服务,旨在保护Web应用程序免受各种网络攻击的威胁。它可防止诸如SQL注入、跨站点脚本(XSS)和跨站点请求伪造(CSRF)等攻击,有效保障了Web应用程序的安全性与稳定性。 阿里云WAF在Web应用程序与互联网之间构建一道安全屏障,通过拦截和检测恶意流量,防止攻击者对您的Web应用程序进行攻击。它不仅覆盖了常见的网络攻击类型,还针对新兴的攻击手段进行了防护设计,确保您的Web应用程序在面对各种威胁时都能得到全方位的保护。
|
4月前
|
数据采集 Web App开发 JavaScript
爬虫技术升级:如何结合DrissionPage和Auth代理插件实现数据采集
本文介绍了在Python中使用DrissionPage库和Auth代理Chrome插件抓取163新闻网站数据的方法。针对许多爬虫框架不支持代理认证的问题,文章提出了通过代码生成包含认证信息的Chrome插件来配置代理。示例代码展示了如何创建插件并利用DrissionPage进行网页自动化,成功访问需要代理的网站并打印页面标题。该方法有效解决了代理认证难题,提高了爬虫的效率和安全性,适用于各种需要代理认证的网页数据采集。
208 0
爬虫技术升级:如何结合DrissionPage和Auth代理插件实现数据采集
|
2月前
|
安全 算法 数据安全/隐私保护
11K star!开源WAF的NO1,不花钱也能搞定安全
当我们的网站上线后首先会遇到什么,可能不一定是自己的客户,而是来自网络的攻击。 今天我们分享的开源项目,它是登顶GITHUB的开源WAF,让黑客不敢越雷池一步,并且还是国产的开源项目,它就是:雷池(SafeLine)
|
2月前
|
SQL 运维 监控
安全设备篇——WAF
**Web应用防火墙(WAF)摘要** WAF是关键的网络安全工具,专注于Web应用防护,提供应用层保护,具备事前预防、事中响应和事后审计功能。它通过HTTP/HTTPS策略阻止恶意请求,防止SQL注入、XSS攻击等,并能防止会话劫持、DDoS攻击。WAF支持自定义规则、日志监控和与其他安全产品集成。其特点包括异常检测、输入验证、安全规则库、用户行为分析及多种部署模式如透明网桥、单机和旁路反向代理。与传统防火墙不同,WAF在应用层工作,提供更具体的安全防护。两者结合可增强整体网络安全性。
安全设备篇——WAF
|
2月前
|
安全 API 开发者
|
4月前
|
SQL 监控 安全
【阿里云云原生专栏】云原生安全体系构建:阿里云云防火墙与WAF的应用
【5月更文挑战第27天】阿里云云防火墙和WAF是构建云原生安全体系的关键产品,提供网络、主机和Web应用多维度防护。云防火墙采用分布式架构抵御网络攻击,确保应用安全稳定;WAF专注Web应用安全,防止SQL注入、XSS和DDoS等威胁。简单部署配置,结合使用可实现全面安全防护,提升企业云上应用安全性,保障业务安全运行。未来,阿里云将持续强化云原生安全建设。
320 1
|
弹性计算 缓存 运维
【运维知识进阶篇】用阿里云部署kod可道云网盘(DNS解析+CDN缓存+Web应用防火墙+弹性伸缩)(三)
【运维知识进阶篇】用阿里云部署kod可道云网盘(DNS解析+CDN缓存+Web应用防火墙+弹性伸缩)(三)
196 0
|
4月前
|
云安全 数据采集 安全
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
阿里云提供两种关键安全产品:Web应用防火墙和云防火墙。Web应用防火墙专注网站安全,防护Web攻击、CC攻击和Bot防御,具备流量管理、大数据防御能力和简易部署。云防火墙是SaaS化的网络边界防护,管理南北向和东西向流量,提供访问控制、入侵防御和流量可视化。两者结合可实现全面的网络和应用安全。
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
|
11月前
|
应用服务中间件
阿里云的WAF(Web应用防火墙)3.0的虚拟代理
阿里云的WAF(Web应用防火墙)3.0的虚拟代理
179 2
|
数据采集 安全 网络安全
01-基础设施安全-3-WEB应用防火墙-ACA-01-产品简介与特性解析
01-基础设施安全-3-WEB应用防火墙-ACA-01-产品简介与特性解析
178 1