上个月,阿里云的一个用户,在这里发帖求助,登录上去查看到的情况,如下图。
tcpdump抓包grep出user-agent,可以看到,这几十个请求里,正常的浏览器访问,只占到一个零头,剩下的都是蜘蛛。
而在蜘蛛里,yisou的蜘蛛又占了一大半。这个应该算是极端的情况了,大多数网站都不会有这么多的yisou蜘蛛抓。
蜘蛛爬的多了,硬件资源用的对应的就多了,甚至把服务器爬死。为了节省资源,可以对照下访问量统计和日志,把那些爬的多的来的IP少的蜘蛛屏蔽了。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。