告别高昂出站费用:LoongCollector + CDN 打造跨云低成本可观测数据实时采集链路

简介: LoongCollector 作为新一代统一可观测 Agent,将持续致力于为用户提供高性能、低成本、易使用的跨云数据采集解决方案,助力企业构建统一的可观测平台。

作者:林润骑(太业)


背景


在多云战略日益普及的今天,企业往往需要在不同云平台部署业务系统,同时又希望将可观测数据统一采集到单一平台进行分析和管理。然而,跨云数据传输的高昂成本成为了企业实施统一可观测性战略的主要障碍。


我们发现,CloudFront 等 CDN 产品的出站流量价格更低,随用量增加还享有阶梯折扣。通过将 CDN 作为数据传输的“跳板”,可以大幅降低跨云传输成本。


基于这一发现,阿里云可观测团队设计了 LoongCollector + CDN 的跨云低成本采集方案:

  • LoongCollector 作为新一代可观测数据采集器,具备 10 倍于同类开源方案的吞吐性能,同时资源占用降低 50% 以上,确保数据链路的高效与稳定。
  • CDN 作为流量出口,利用其价格优势和全球加速能力,在保证传输质量的同时显著降低成本。


本方案可将跨云数据传输成本显著降低,让企业以更低的代价实现统一可观测平台的愿景。


现有方案 & 痛点

1774247489371_c523557c93034296aa878da5f14b9c8f.png

方案一:纯公网

日志服务 SLS 对外提供公网域名,用户可以直接通过公网将数据发送到 SLS,且 SLS 不收取入站流量费用。


痛点

  • 成本问题虽然 SLS 不收取入站流量费用,但跨云采集面临源云平台的出站流量费用。以 AWS 为例,数据传输到互联网的费用约为 $0.09/GB,对于大规模数据采集场景,成本不可忽视。
  • 网络质量问题跨云公网访问受网络波动影响较大,可能出现丢包、延迟增加等问题,影响数据采集的稳定性和实时性。


方案二:纯公网 + SLS 加速域名

SLS 传输加速利用全球分布的云机房,将全球各地用户对日志服务的访问,经过智能路由解析至就近的接入点,使用优化后的网络及协议极大地提升访问速度。


痛点

双重成本除了源云平台的出站流量费用之外,还需要承担 DCDN 的加速费用,整体成本进一步增加。


方案三:跨云专线打通

通过云服务提供商的专线服务(如 AWS Direct Connect、阿里云高速通道等)建立跨云专用网络连接。


痛点

  • 建设成本高专线建设需要一次性投入大量资金,包括端口费用、专线租用费用等。
  • 维护复杂需要专业团队维护专线连接,运维成本高。
  • 灵活性差专线带宽固定,难以应对突发流量需求。
  • 建设周期长从申请到开通通常需要数周甚至数月时间。


跨云低成本采集方案


EC2 每月有 100GB 的出站免费额度,但是 CloudFront 的出站和公网访问源站的价格要比 EC2 的价格更低。更重要的是,CDN 产品通常提供分级定价和批量折扣,随着使用量增加,单位成本会进一步降低。通过 CDN 的加速链路,将 SLS 服务设置成源站的方式,我们可以复用 CDN 的转发链路,实现以下优势:


  • 成本优化利用 CDN 的价格优势,降低数据传输成本。
  • 易于实施无需建设专线,配置简单,可快速上线。
  • 弹性扩展按需使用,无需预留带宽,可灵活应对流量波动。


CloudFront 区域数据传输到源站的价格:

1774247579400_157366deacca4b168e6920750b6a29b9.png

CloudFront 请求次数价格(每月前 100 万次免费):

1774247590168_502571a81aff44e7a2028a4d3a280425.png

EC2 出公网价格:

以美国地域为例:10TB 的数据,通过 CloudFront 传输,成本比 EC2 直接公网传输可以节约 70%。


整体方案

本方案以 CloudFront 为例,整体的采集方案如图所示:

1774247615345_1329fd9837bc4b89b5696721b3e689e2.png

架构概览

AWS EC2(LoongCollector)

  • 部署在 AWS 上的采集/转发程序
  • 主要职责:

a. 从本地/应用采集日志或数据

b. 按 SLS 写入协议组包(HTTP POST)

c. 将数据发送到目标 SLS


CloudFront

  • 作为数据链路的中转入口,提供统一的域名接入点与边缘节点接入能力
  • 主要职责:

a. 接收 LoongCollector 的请求(HTTP/HTTPS)

b. 按行为规则转发到源站(此处源站为阿里云 SLS 的写入端)


SLS(阿里云日志服务)

  • 作为日志/数据接收与存储分析平台
  • 对外暴露 HTTP(S) 写入接口
  • 写入后数据落入指定 Project / Logstore(图中 Project)


SLS ConfigServer(管控端)

  • 用于下发采集配置、心跳、元数据管理、鉴权信息刷新等“控制面”能力
  • 对数据量要求低、实时性要求相对可控


链路分层:管控链路 & 数据链路

A. 管控链路(Control Plane)——直连公网

特点:请求量小、数据量小、对带宽不敏感。

  • LoongCollector 直接通过公网访问 SLS ConfigServer
  • 典型动作包括:
  • 拉取采集配置/规则
  • 选择直连公网的原因:
  • 控制流量小,对成本与链路质量要求不高
  • 架构更简单(减少中转层)


B. 数据链路(Data Plane)——通过 CloudFront 转发到 SLS

特点:持续写入、对稳定性/连通性敏感,可能存在跨境网络波动。

  • LoongCollector 将日志数据以 HTTP POST 方式发送到 CloudFront 域名
  • CloudFront 再将请求回源转发到阿里云 SLS 写入端
  • SLS 接收后写入指定 Project/Logstore


CloudFront 详细配置

这里以采集数据到 SLS 上海地域的 Project 为例。


源配置

注意事项:

1. SLS 的域名不要带 Project 前缀。

2. CloudFront 访问 SLS 域名,使用 HTTP 或者 HTTPS 都可以。


行为配置

1774248046676_2ea91af1430e40a9887be1a6cf5a4f81.png

注意事项:

1. CDN 默认会缓存响应内容,但 LoongCollector 发送数据是 POST 请求,需要配置为不缓存。

2. CloudFront 对 SLS 域名的请求,需要转发除 HOST 外所有的 header。


CloudFront 的域名验证

直接 Curl CloudFront 域名,如果有如下返回,则说明已配置成功。


{"Error":{"Code":"OLSInvalidMethod","Message":"The script name is invalid : /","RequestId":"XXX"}}

1774248089052_2b93e061b39b46a9922e15e1d3fe1d4c.png


LoongCollector 详细配置


使用 HTTP 协议发送数据


# /usr/local/ilogtail/ilogtail_config.json
{
    "primary_region" : "cn-shanghai",
    "config_servers" :
    [
        "https://logtail.cn-shanghai.log.aliyuncs.com"
    ],
    "data_servers" :
    [
        {
            "region" : "cn-shanghai",
            "disable_subdomain" : true,
            "endpoint_list": [
                "http://xxx.cloudfront.net"
            ]
        }
    ],
    ...
}


关键配置说明:

  • config_servers 中,配置 SLS 公网域名,标准格式为 logtail.${region}.log.aliyuncs.com
  • data_servers 中
  • 只需要配置主地域,endpoint_list 中设置成 HTTP 的 CloudFront 域名
  • disable_subdomain: true(关闭子域名转发)


使用 HTTPS 协议发送数据


# /usr/local/ilogtail/ilogtail_config.json
{
    "primary_region" : "cn-shanghai",
    "config_servers" :
    [
        "https://logtail.cn-shanghai.log.aliyuncs.com"
    ],
    "data_servers" :
    [
        {
            "region" : "cn-shanghai",
            "disable_subdomain" : true,
            "endpoint_list": [
                "https://xxx.cloudfront.net"
            ]
        }
    ],
    "enable_host_ip_replace": false,
    ...
}


关键配置说明:

  • config_servers 中,配置 SLS 公网域名,标准格式为 logtail.${region}.log.aliyuncs.com
  • data_servers
  • 只需要配置主地域,endpoint_list 中设置成 HTTPS 的 CloudFront 域名
  • disable_subdomain: true(关闭子域名转发)
  • enable_host_ip_replace: false(关闭 LoongCollector 内部的 DNS 解析)


LoongCollector 资源参数配置

LoongCollector 是部署在 EC2 或者节点上,因此需要预估单机采集的日志的原始数据量,调整资源参数,具体可以参考帮助文档:https://help.aliyun.com/zh/sls/select-a-network-type

1774248652850_48b6432f13284c9daafe76c49a1018ea.png

PS:LoongCollector 进行数据发送的时候,默认采用 LZ4 进行压缩,针对日志数据,可以有 5 ~ 10 倍的压缩效果。


网络质量测试结果

测试场景:

  • 韩国地域 EC2 采集数据到韩国地域 SLS。
  • 数据包压缩后 800K 左右。

可以看到在同地域场景下,CloudFront 的访问质量跟直接公网访问基本持平,HTTP 的访问延迟还是略低一些。


限制说明

  • LoongCollector 版本需要>=3.3.0。
  • 目前仅支持日志数据采集,时序、主机监控等数据还不支持通过 CDN 链路发送。
  • 本功能逐步按照地域灰度中,如需使用,可以联系 SLS 技术支持人员。


总结与展望


方案总结


本文介绍的跨云低成本可观测数据实时采集方案,通过 CDN + LoongCollector 的组合,实现了:


1. 成本降低相比纯公网方案,显著降低跨云数据传输成本。

2. 性能提升利用 CDN 的全球节点和 LoongCollector 的高性能,提升数据采集速度和稳定性。

3. 易于实施配置简单,无需建设专线,可快速上线。

4. 灵活扩展按需付费,自动弹性扩展,适应流量波动。


LoongCollector 作为新一代统一可观测 Agent,将持续致力于为用户提供高性能、低成本、易使用的跨云数据采集解决方案,助力企业构建统一的可观测平台。


参考资料:

[1] LoongCollector 官方文档

https://github.com/alibaba/loongcollector

[2] AWS CloudFront 官方文档

https://docs.aws.amazon.com/cloudfront/

[3] 阿里云 SLS 官方文档

https://help.aliyun.com/zh/sls/

相关文章
|
Web App开发 缓存 JavaScript
手把手教你 WordPress 使用阿里云 CDN 教程,让你的网站飞起来
优化 WordPress 访问速度详细攻略,手把手教你优化过程
10423 0
手把手教你 WordPress 使用阿里云 CDN 教程,让你的网站飞起来
|
5月前
|
缓存 监控 安全
如何设置阿里云CDN的流量阈值以避免超额费用?
在信息爆炸时代,阿里云CDN助力网站加速。合理设置CDN阈值可提升性能、节省带宽、增强安全。本文详解阈值配置步骤与监控优化,助你高效利用资源。无账号者可通过翼龙云上云,享技术支持与优惠。
|
5月前
|
弹性计算 网络协议 Linux
阿里云服务器ECS全解析:什么是ECS?实例规格族、付费类型、地域及网络可用区详细说明
阿里云ECS是安全可靠、弹性灵活的云服务器,支持多种实例规格与付费模式。本文详解ECS概念、实例类型、地域可用区、网络配置及购买流程,助您快速掌握创建与使用方法。
1062 0
|
5月前
|
域名解析 缓存 监控
阿里云渠道商:如何排查阿里云CDN访问问题?
排查阿里云CDN访问问题需分步诊断:先检查DNS解析与CDN基础配置,再根据访问慢、内容未更新或50x错误等现象定位原因,结合ping、tracert及阿里云实时日志、节点检测等工具深度分析。掌握此流程,快速解决异常。
|
4月前
|
存储 域名解析 缓存
DNS工作原理:从域名到IP
每天输入域名就能访问网站,背后靠的是DNS——互联网的“地址翻译官”。它将域名智能解析为IP地址,实现快速访问。本文详解DNS记录类型(A、CNAME、MX等)与四级查询流程,助你理解“域名变IP”的全过程,轻松应对解析问题。
1075 157
|
4月前
|
域名解析 网络协议 算法
网络基础知识随记:TCP/IP 网络模型—从分层逻辑到核心知识点
本文系统梳理TCP/IP网络模型的分层架构与核心原理,涵盖应用层、传输层、网络层及网络接口层的关键协议与概念,如HTTP、TCP/UDP、IP、MAC、ARP等,解析数据封装、解封装过程及各层协作机制,帮助读者建立清晰的网络通信认知体系,掌握跨设备通信的底层逻辑。
704 9
网络基础知识随记:TCP/IP 网络模型—从分层逻辑到核心知识点
|
4月前
|
SQL 弹性计算 安全
阿里云服务器全方位介绍:云服务器是什么?应用场景、购买流程、活动价格及使用教程参考
阿里云服务器凭借其强大的性能、灵活的配置和丰富的应用场景,已成为众多企业和个人用户购买云服务器的首选云服务商。本文将从阿里云服务器的定义、应用场景、价格分析、租用购买流程以及使用技巧等方面进行全面解析,帮助用户更好地了解和应用阿里云服务器。
|
4月前
|
Kubernetes Cloud Native 调度
寻因生物 × 阿里云 ACS:Argo Workflows 驱动的基因分析新范式
国家级专精特新“小巨人”企业寻因生物[1],基于阿里云容器服务全托管工作流引擎 Argo Workflows[2] (以下简称:全托管 Argo Workflows)与容器计算服务 ACS[3](以下简称:ACS)构建的了新一代基因生信分析平台。该平台实现生信流程编排效率提升 70%、计算成本降低超 50%、运维复杂度下降 70%,为单细胞、空间转录组、表观测序技术等前沿研究提供了高效、弹性、标准化的算力基础设施。
381 1
|
4月前
|
存储 缓存 网络协议
移动端弱网优化专题(十五):字节跳动移动端网络HttpDNS优化实践
本文要分享的是字节跳动团队针对火山HTTPDNS Cache2.0通过自研网段库与动态划分算法,将缓存粒度从“城市-运营商”细化为“网段”,解决了传统方案的城市级调度污染问题。配合缓存分级、预取等优化,在提升调度精准度的同时保证了高命中率,最终实现了服务端调度准确性提升和客户端性能优化。
298 1
|
4月前
|
安全 算法 网络安全
高防CDN可以防御DDOS攻击吗
总结起来说,在面对日益严重的网络安全威胁时,高防CDN是一个非常有效且必要的工具。它不仅可以提升网站访问速度、改善用户体验,并且还能有效地抵御DDoS等多种形式网络攻击。
1371 13

热门文章

最新文章