1. 概述
1.1 版本
报表服务器版本 |
---|
11.0 |
1.2 应用场景
随着「大数据」一词大热,「爬虫」也渐渐为大家所熟知,对于企业而言,被爬数据危害巨大。有资料显示,多家航空公司的低价机票数据被爬,然后被加价出售,对相关企业造成了非常大的干扰,同时也扰乱了市场秩序。同时,和 CC 攻击一样,如果对服务器进行大量的请求,会导致服务器压力过大,影响业务人员的正常使用,甚至导致服务器宕机。
常规「反爬虫」技术包括访问频率控制、使用代理 IP 池、抓包、验证码的 OCR 处理等。其中,「访问频率限制」是非常有效的一种手段,通过限制单 IP 一段时间内访问数据的次数,可以有效遏制爬虫爬取数据。当平台被访问次数频率过高时,可以开启访问控制,限制单 IP 访问频率,降低并发性。
1.3 功能简介
帆软平台提供「访问频率限制」功能,开启后,可以对一定时间内的访问次数进行限制,超出则拉入黑名单,无法再进行资源访问,可有效缓解异常访问,爬虫爬取和 CC 攻击的情况。
2. 示例
管理员登录数据决策系统,点击「管理系统>安全管理>访问控制」,「频率限制」按钮默认开启,可设置具体限制频率,对报表的访问请求进行频率限制。如下图所示:
具体说明如下所示:
频率限制默认开启,可自定义设置访问频率,对报表的访问请求进行频率限制。限制频率默认为 60 秒访问 200 次。
超过则拉入拦截名单,拦截后该 IP 再访问会有页面提示:「访问频率过高被拦截,如需访问请联系管理员」。
拦截名单提供超出访问频率被拦截的 IP 的信息,鼠标放置在某个 IP 名单上,会悬浮显示移出按钮,可将该 IP 移出拦截名单。
如果工程存在负载均衡没有做 IP 转发,导致多个用户共用同一个IP访问,那么就会全部算在一个IP上,就很容易超出访问频率限制。
统计访问频率时,预览模板、导出模板、打印模板分别计数。