非功能介绍|学习笔记

简介: 快速学习非功能介绍

开发者学堂课程【大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop 框架搭建)第一阶段非功能介绍】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/669/detail/11590


非功能介绍

 

内容介绍

一.功能模块

二.性能要求

三.描述

四.性能要求总结

 

非功能的性能指标目标:

掌握反爬虫项目面试时可能会问的一些问题,这些问题以及效率是反爬虫识别功能性能之外的知识点。

 

一.功能模块

1.数据管理  

2. 页面响应  

3.数据库响应

4.外部接口响应

 

二.性能要求

1.数据管理

Kafka 缓存队列磁盘要求能处理一天的积压约为50 GB 的数据量

每天数据站集群的容量是100 G 或150 G(3个副本)(考虑副本)。

注:总数据存储量 = 一天增量*副本数*天数

SparkStreaming 每天要处理的数据量约为 50 GB

2. 页面响应

响应时间<5s

系统支撑并发数:50(基于企业内部用户使用)

图片1.png

3. 数据库响应

Sql 查询相应时间 <5s。

连接池连接数量有效百分比大于80%。

4.外部接口响应

外部接口数据返回时间不超过5秒

 

三.描述

1.数据管理

根据前端采集的数据,一条数据大小约 1-2KB。

按照每日2700万的数据量计算 2KB*27000000/1024/1024≈50GB。所以Kafka队列要缓存一天的数据,需要约50 GB 的磁盘空间。

SparkStreaming 将消费 Kafka 队列中的数据,

故每天要处理约 50GB 的数据量

峰值性能要求是 100G  (实际峰值性能要求是97G)。

2.页面响应

对于普通页面内容刷新,因为数据的请求到展现的过程,总体时间不能超过5秒。

此处的系统用户并发数指防爬占座系统的 Web 应用的用户并发数,该系统采集到的南航官网数据以流量形式进行转发,无关用户。同时 Web 服务器需要复用做他用,因此系统用户并发数限制为50个,避免占用过多资源。

3.数据库响应

对于系统的页面展现的 SQL 查询语句查询时间不能大于5秒,以免影响前端页面的展示。

对于已经配置好的连接池,已经被占用的连接数量不能超 过总连接数据的80%,要保证20%的有效连接未被占用。

4. 外部接口响应

对于外部接口的调用,其数据返回的整个时间不能超过5秒。

 

四.性能要求总结

kafka 的吞吐量:

1、 每一条日志的大小约为1-2k

2、每天大概有2700万条数据

3、经计算,吞吐量大概为50 G

4、假如我们 kafka 设置的日志超时时间30天,50乘以30乘以备份引子>=1500*n.

sparkstreaming 计算量:

1、每天计算50 G 的数据

2、计算峰值每天计算100 G 的数据

页面的响应时间和并发数:

1、不超过5 s

2、并发故为50

数据库的响应和外部接口:

1、sql 不超过5秒

相关文章
|
监控 API 开发者
Sentinel:微服务的全能守护
Sentinel 是阿里巴巴开源的一款轻量级流量控制和熔断降级框架。它通过设置流量控制、熔断降级和系统保护规则,确保微服务在高并发场景下稳定运行。Sentinel 提供丰富的功能、实时监控和灵活的集成方式,适用于各种分布式系统。
1588 0
|
消息中间件 存储 Cloud Native
【活动】30秒上云体验,一键体验RocketMQ 六大生产环境
免费试用+30秒一键体验,低门槛、快速、高效、易操作,带你了解“历经万亿级数据洪峰考验”的云消息队列RocketMQ
646 6
|
API 调度 Android开发
带你读《2022技术人的百宝黑皮书》——移动域全链路可观测架构和关键技术(10)
带你读《2022技术人的百宝黑皮书》——移动域全链路可观测架构和关键技术(10)
248 0
|
数据可视化 架构师 算法
“低代码”将干掉70%的软件开发工作?
“低代码”将干掉70%的软件开发工作?
229 0
|
Ubuntu Shell
怎么添加用户到sudo用户组
跨平台系列汇总:http://www.cnblogs.com/dunitian/p/4822808.html#linux 前段时间用Ubuntu的sudo用惯了,回到kali发现自己的用户太low了,每次都要切换到root才能做一些事情,能不能设置下呢? 用户添加完成之后,打这么一条命令:use...
1329 0
|
3天前
|
数据采集 人工智能 安全
|
12天前
|
云安全 监控 安全
|
4天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1069 151
|
4天前
|
编解码 人工智能 机器人
通义万相2.6,模型使用指南
智能分镜 | 多镜头叙事 | 支持15秒视频生成 | 高品质声音生成 | 多人稳定对话