使用SLS统计分析三方CDN回源OSS月95带宽实践

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 本文介绍通过使用阿里云日志服务SLS,对存储在SLS中的三方CDN回源阿里云OSS的监控日志数据,进行自定义查询分析之后得到按照不同运营商、不同业务类型(CND)纬度下,回源OSS的带宽月95量级数据,用于业务统计分析。

1. SLS介绍

日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升研发、运维、运营、安全等场景的数字化能力。

2. 需求场景描述

基于阿里云OSS为源站,并结合三方CDN,可以搭建起对外提供公网的服务。将三方CDN回源阿里云OSS的监控数据存储在日志服务SLS中,需要SLS中获取三方CDN回源OSS的相关监控数据,用于业务统计分析。
相应的监控日志简化样例如下:
image.png
不同业务场景(CDN)、域名和运营商之间的对应关系示例如下:
image.png
具体需求:基于存储在SLS中的三方CDN回源阿里云OSS的监控数据,需要得到按照运营商纬度,来区分不同业务类型(CND)下回源OSS的带宽月95量级数据,用于业务统计分析。

3. SLS解决方案呈现

3.1 前置资源准备

  • 已创建Linux系统ECS服务器
  • 已创建用于存储不同业务场景(CDN)、域名和运营商之间对应关系的CSV格式文件
  • 已创建对象存储OSS,并把CSV文件上传至OSS
  • 已开通SLS服务,创建Project并在该Project下创建Logstore1和Logstore2

3.2 构造模拟日志

为验证基于SLS满足该需求的解决方案可行性,按照日志样例在阿里云Linux服务器上构造模拟日志,在root/usr/local/logs路径下创建cdn.log文件,在文件中输入JSON格式的日志数据如下。
image.png

3.3 Logtail采集日志

在SLS中创建Project,创建Logstore1用来存放采集的Linux服务器模拟日志,Logtail的采集配置如下:日志路径为usr/local/logs/cdn.log,模式为JSON模式。由于构造的模拟日志不是实时产生的,因此在模拟日志接入Logstore1后,需要vim cdn.log打开日志文件编辑并关闭一次之后,数据才会被采集到Logstore1。
image.png
Logstore1中成功采集到的模拟日志数据如下所示:
image.png

3.4 外表数据导入

由于需求是想得到按照运营商纬度,区分不同业务类型(CND)下回源OSS的带宽月95量级数据。因此需要创建一个外表用于存储业务场景(CDN)、域名和运营商之间的对应关系,并把外表数据导入到俞Logstore1相同Project下的Logstore2中,用于跨两个Logstore之间的数据联合查询分析。
首先创建CSV格式文件,用于存储业务场景(CDN)、域名和运营商三者之间的对应关系。并把CSV文件导入到Logstore2中,导入配置中的数据格式选择为CSV。
查询分析配置如下,关闭全文索引。
image.png
Logstore2中查询到的日志数据如下:
image.png

3.5 联合查询分析

通过使用估算函数approx_percentile(x, percentage),对月带宽值进行正序排列,返回大约处于95位置的数值,具体为approx_percentile(get_throughput, 0.95)。
估算函数approx_percentile结合join、group_by、oder_by子句,在Logstore1的查询框里输入如下语句:
image.png
返回如下结果:第一列为不同运营商、第二列为不同业务类型(CDN)、第三列尾运营商纬度下不同业务类型(CDN)的月带宽95量级。
image.png
在统计图表中的运营商列,检索框中输入CMM,即可得到运营商为中国移动情况下,SCDN、TCDN和PCDN三个业务类型下的月带宽95量级数据,从而可满足统计分析的需求。
image.png

4. 解决方案举一反三

若具体需求是想得到按照业务类型(CDN)纬度,区分不同运营商情况下回源OSS的带宽月95量级统计数据。则查询分析的SQL语句修改如下(仅调换字段的顺序即可)。
image.png
返回如下结果:第一列为不同业务类型(CDN)、第二列为不同运营商、第三列尾业务类型(CDN)纬度下不同运营商的月带宽95量级。
image.png
在统计图表中的业务类型列,检索框中输入SCDN,即可得到自建CDN情况下,中国移动、中国电信和中国联通三个运营商的月带宽95量级数据,从而可满足统计分析的需求。
image.png

5. 总结

阿里云SLS支持的SQL语法中的JOIN子句用于连接多个表,支持跨Logstore和MySQL、Logstore和OSS、Logstore和Logstore之间数据的联合查询,以满足不同业务分析统计场景的需求。

目录
相关文章
|
6月前
|
存储 缓存 网络协议
如何使用CDN加速访问OSS存储的图片资源?
通过阿里云CDN加速OSS上的图片和视频资源,可显著提升访问速度、降低带宽成本。CDN将静态资源缓存至离用户最近的节点,减少加载时间,并提供图像处理、缓存优化等功能,提升用户体验。同时,CDN还支持访问数据分析,助力运营决策。本文详解如何通过CDN控制台配置OSS加速,包括添加域名、设置CNAME、配置缓存策略等步骤,帮助您快速实现资源加速。
|
5月前
|
SQL 人工智能 监控
SLS Copilot 实践:基于 SLS 灵活构建 LLM 应用的数据基础设施
本文将分享我们在构建 SLS SQL Copilot 过程中的工程实践,展示如何基于阿里云 SLS 打造一套完整的 LLM 应用数据基础设施。
1218 82
|
存储 运维 开发工具
警惕日志采集失败的 6 大经典雷区:从本地管理反模式到 LoongCollector 标准实践
本文探讨了日志管理中的常见反模式及其潜在问题,强调科学的日志管理策略对系统可观测性的重要性。文中分析了6种反模式:copy truncate轮转导致的日志丢失或重复、NAS/OSS存储引发的采集不一致、多进程写入造成的日志混乱、创建文件空洞释放空间的风险、频繁覆盖写带来的数据完整性问题,以及使用vim编辑日志文件导致的重复采集。针对这些问题,文章提供了最佳实践建议,如使用create模式轮转日志、本地磁盘存储、单线程追加写入等方法,以降低日志采集风险,提升系统可靠性。最后总结指出,遵循这些实践可显著提高故障排查效率和系统性能。
1421 21
|
Rust 前端开发 JavaScript
Tauri 开发实践 — Tauri 日志记录功能开发
本文介绍了如何为 Tauri 应用配置日志记录。Tauri 是一个利用 Web 技术构建桌面应用的框架。文章详细说明了如何在 Rust 和 JavaScript 代码中设置和集成日志记录,并控制日志输出。通过添加 `log` crate 和 Tauri 日志插件,可以轻松实现多平台日志记录,包括控制台输出、Webview 控制台和日志文件。文章还展示了如何调整日志级别以优化输出内容。配置完成后,日志记录功能将显著提升开发体验和程序稳定性。
897 1
Tauri 开发实践 — Tauri 日志记录功能开发
|
存储 数据采集 监控
云上数据安全保护:敏感日志扫描与脱敏实践详解
随着企业对云服务的广泛应用,数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护,可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟,分析了如何使用阿里云的工具对日志数据进行识别、脱敏(3 种模式)处理和基于 StoreView 的查询脱敏方式,从而在保障数据安全的同时满足业务需求。通过这些实践,企业可以有效降低数据泄漏风险,提升数据治理能力和系统安全性。
1880 233
云上数据安全保护:敏感日志扫描与脱敏实践详解
|
8月前
|
编解码 监控 算法
CDN+OSS边缘加速实践:动态压缩+智能路由降低30%视频流量成本(含带宽峰值监控与告警配置)
本方案通过动态压缩、智能路由及CDN与OSS集成优化,实现视频业务带宽成本下降31%,首帧时间缩短50%,错误率降低53%。结合实测数据分析与架构创新,有效解决冷启动延迟、跨区域传输及设备适配性问题,具备快速投入回收能力。
571 0
|
Web App开发 存储 监控
iLogtail 开源两周年:UC 工程师分享日志查询服务建设实践案例
本文为 iLogtail 开源两周年的实践案例分享,讨论了 iLogtail 作为日志采集工具的优势,包括它在性能上超越 Filebeat 的能力,并通过一系列优化解决了在生产环境中替换 Filebeat 和 Logstash 时遇到的挑战。
549 104
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
924 43
|
存储 运维 监控
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用 Apache Doris 替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。
808 3
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践