功能介绍数据采集详解|学习笔记

简介: 快速学习功能介绍数据采集详解

开发者学堂课程【大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop 框架搭建)第一阶段功能介绍数据采集详解】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/669/detail/11584


功能介绍-数据采集详解

 

内容介绍

一、学习目标与学习顺序

二、数据采集详解

三、知识点总结

 

一、学习目标与学习顺序

目标:掌握了解企业端的功能模块

学习顺序:数据采集、数据预处理、实时计算、离线计算。

 

二、数据采集详解

(1) 数据采集的详细界面

在企业端的数据管理模块,点击数据采集,界面如下:

图片1.png

(2)数据采集的服务器监控目的

图片2.png

在数据采集流程中

图中所示三个方框代表三个服务器

在每台服务器上布置脚本采集数据

数据采集后,展现前端分为:服务器的 ip、当前活跃连接数、近三天采集数据量

假设布置三台服务器,前端界面展现为:

图片3.png

该图展现在数据采集的监控情况,表示服务器的 ip、当前活跃连接数、近三天采集数据量。

近三天采集数据量:展示今天,昨天和前三天采集数据的情况

只有数据管理模块的采集模块是针对企业内部服务器进行的监控,仅此唯一,其余模块均是基于客户数据进行监控,仅有数据采集时针对企业服务器进行监控。

(3)链路

图中三个方框代表三个服务器,同时代表三个链路,用来给用户查询与预定的服务器称为链路。

等同于大数据生涯系统的节点,包括数据节点与管理节点,统称节点

节点本质上为一台服务器

在书路处理流程中的三个链路,本质也属于服务器,

在采集阶段布置的应用服务器

 (4)监控目的

主要是服务器在企业里面运行的过程当中,是否出现异常,服务器的存活量,服务器上的存活用户以及数据的采集情况。

 

三、知识点总结

数据采集模块

展示:展示了数据采集的数量(多链路)昨天、前天、前三天

监控:通过数据采集数量来监控lua采集脚本是否正常工作

相关文章
|
2月前
|
人工智能 运维 自然语言处理
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
293 15
|
5月前
|
消息中间件 人工智能 资源调度
云上AI推理平台全掌握 (5):大模型异步推理服务
针对大模型推理服务中“高计算量、长时延”场景下同步推理的弊端,阿里云人工智能平台 PAI 推出了一套基于独立的队列服务异步推理框架,解决了异步推理的负载均衡、实例异常时任务重分配等问题,确保请求不丢失、实例不过载。
|
2月前
|
存储 监控 API
Python datetime模块:时间处理的瑞士军刀
免费Python编程教程,深入讲解datetime模块核心用法:时间对象创建、格式化、运算及时区处理,附实战案例与避坑指南,助你高效掌握Python时间操作。链接:https://pan.quark.cn/s/2c17aed36b72
603 0
|
7月前
|
编解码 JSON 缓存
巧筑虚拟星河:Dev中的预览技巧
ArkUI预览器是HarmonyOS开发中的高效工具,支持实时与动态预览功能。实时预览可秒级刷新样式修改,动态预览则模拟真机交互体验。设备支持手机、平板、车机及智能手表等,但禁用账号登录、多媒体播放等功能。启动需通过菜单导航,电脑需支持OpenGL 3.2+。预览模式分页面和组件预览,前者测流程后者调样式。虚拟设备可测试多屏幕适配,避免硬件依赖。双向预览实现代码与界面联动,Hamock插件支持数据模拟,提升调试效率。总结:改样式用实时预览,测交互用动态预览,复杂场景需真机验证!
240 15
|
数据采集 人工智能 自然语言处理
Qwen模型角色扮演最佳实践
角色扮演大模型通过模拟特定角色的行为、语言风格和情感表达,实现高度拟人化和定制化的互动体验。与传统通用模型相比,角色扮演模型在语言风格、性格特征和情绪反应上更加细腻,提供更真实的交互体验。本文介绍了如何通过system prompt、few-shot学习和微调等技术实现大模型的拟人化,包括使用阿里云百炼平台进行角色扮演测试,以及如何通过合成数据和Lora微调提高模型的表演效果。最终,展示了如何通过优化数据质量和训练策略,显著提升角色扮演模型的表现。
|
11月前
|
SQL 数据挖掘 关系型数据库
阿里云百炼|析言GBI全新发布:联合云上数据库,助力企业轻松实现ChatBI
析言GBI是阿里云推出的一款基于AI的智能数据分析产品,通过自然语言处理实现对话式数据分析。用户无需编写代码,即可轻松进行数据查询、分析和可视化。该产品支持多种数据库连接方式(如MySQL、PostgreSQL等),并提供多版本选择以适应不同业务需求。即将发布的动态规划BI分析功能将进一步提升复杂问题的拆解与综合分析能力。欢迎访问阿里云百炼应用广场体验析言GBI,并享受200次免费问题额度。
|
11月前
|
JavaScript 前端开发 测试技术
盘点原生JavaScript中直接触发事件的方式
本文全面探讨了原生JavaScript中触发事件的多种方式,包括`dispatchEvent`、`Event`构造函数、`CustomEvent`构造器、直接调用事件处理器以及过时的`createEvent`和`initEvent`方法。通过技术案例分析,如模拟点击事件、派发自定义数据加载事件和实现提示框系统,帮助开发者掌握这些方法在实际开发中的应用,提升灵活性与兼容性。
417 3
mybatis-plus从3.1升级到3.4.2
mybatis-plus从3.1升级到3.4.2
435 0
Grafana如何展示柱状图-将折线图调整为柱状图
Grafana如何展示柱状图-将折线图调整为柱状图
|
存储 缓存 前端开发
意外之惊喜!浏览器缓存优化方案,让页面加载速度飙升48.5%!
经过对浏览器缓存优化方案的调研和实现过程,我发现了一个令人意外的发现:**页面加载速度提升了整整48.5%!** 这个令人震撼的结果在微前端架构项目中具有重要意义,同时虽然本文是针对微前端架构的,但这个浏览器缓存优化方案同样适用于其他前端项目。本文将深入探讨这个优化方案,并分享调试和改进的经验。
670 1
意外之惊喜!浏览器缓存优化方案,让页面加载速度飙升48.5%!