为什么别人家的APP,上报日志就这么省流量?

简介: APP一般如何上报日志?使用类似于Google Analytics的第三方工具;自己制订私有协议进行上报;使用HTTP协议,通过GET参数传递需要上报的数据。

为了统计APP内用户行为,或者需要收集某些产品数据,APP往往需要进行日志上报,日志上报往往又非常费流量,大家的APP是怎么上报日志的呢?

画外音:用户流量的大头,是日志上报?


APP可不可以不上报日志,只从服务器日志统计用户的行为和产品数据?
不行,有些用户行为不会与服务器进行交互,例如“卡片切换”,服务器日志无法完成所有统计。


APP一般如何上报日志?
常用方法有这么几种。


(1)使用类似于Google Analytics第三方工具

优点:无需开发

缺点:不能做个性化统计


(2)自己制订私有协议进行上报;

优点:节省流量

缺点:开发成本高

画外音:例如,TCP二进制协议,可定制化,又省流量。


(3)使用HTTP协议,通过GET参数传递需要上报的数据。


如何通过HTTP协议进行上报?

可以在Web-Server下放置一个文件,APP发起HTTP请求访问这个文件,通过GET参数传递数据,并通过分析access日志来得到想要的数据。


如何通过GET参数传递数据?

一般又有两种方式:

(1)约定格式法;

(2)KV法。


什么是“约定格式法”?

约定格式法:约定分隔符,约定占位符,约定每个字段的含义,例如:

[bj][20190304][1939][1][login]


约定如下:

(1)被访问文件是up;

(2)分隔符是[];

(3)第一个字段[bj]代表城市,第二个字段代表日期,第三个字段代表时间,第四个字段代表用户id,第五个字段代表行为。


该方法缺点是:扩展性较差,有时候某些字段没有值,也必须在相应的位置保留占位符,因为每个字段的含义都是事先约定好的,要想新增统计项,只能在GET后面新增[]。


什么是“KV法”?

KV法:通过GET参数自解释的KV方式来上报数据。


上面的例子用KV法来上报,则上报形式为:

该方法的优点是:扩展性好

缺点是:上报数据量比较大,非常消耗流量


为什么会这么消耗流量呢?

之所以消耗流量,主要有这样一些原因:

(1)无效流量多,HTTP报文有很多无效数据;
(2)
URL冗余,每次都要上报URL;
(3)
KEY冗余,每次都要上报KEY;
(4)
上报频度高,用户每次操作都要日志上报的话,上报量很大。


有没有节省流量的方法呢?

针对上述1-4点,常见的优化方案有这样一些。


痛点1:HTTP请求内无效数据多。

解决方案:手动构造HTTP请求,尽可能多的去除HTTP中的无效数据。

画外音:

如果使用第三方库构造HTTP请求,可能会带上你并不需要的UA数据。

自己构造,则可以只保留GET /up HTTP/1.1和GET传递的必须数据;


痛点2:URL冗余。

解决方案:使用尽可能短的域名来接收上报的日志。

画外音:例如,s.daojia.cn/a


痛点3:KEY冗余。

解决方案:使用尽可能短的KEY来标识数据,日志收集方一定要统一规范好KEY。

画外音:例如,city=bj可以优化为c=bj

一个BAD CASE,由于没有规范,曾经某个部门上报用户ID,不同项目中重复埋点,上报了4次:

name=shenjian&user_id=123&uid=123&user_name=shenjian

而上述name、user_id、uid、user_name都属于重复上报。


痛点4:上报频率高。

解决方案:先将数据保存到APP本地存储,再定时上报,这类优化对于PV类,SUM类,AVG类统计尤为有效。


例如,要统计登录按钮的点击次数,三次点击,传统统计可能需要上报三次:优化后,增加了一个参数,只需要上报一次:


非实时上报,应该在什么时机进行日志上报呢?

如果进行合并上报,或者批量上报,数据的时效性会有一定的影响

画外音:如果策略合理,数据误差会非常小。


为了优化,会在这样的一些时间点进行上报:
(1)
特殊时间点上报:例如,APP打开,关闭,后台转入活跃时;
(2)
按时间批量上报:例如,每隔10分钟才上报一次;
(3)
按数据量批量上报:例如,每收集10条记录才上报一次;


还有其他什么优化方案?
批量上报,
数据压缩


希望,文章的逻辑是清晰的。

本文转自“架构师之路”公众号,58沈剑提供。

相关实践学习
通过日志服务实现云资源OSS的安全审计
本实验介绍如何通过日志服务实现云资源OSS的安全审计。
目录
相关文章
|
12月前
|
数据采集 JSON 网络安全
移动端数据抓取:Android App的TLS流量解密方案
本文介绍了一种通过TLS流量解密技术抓取知乎App热榜数据的方法。利用Charles Proxy解密HTTPS流量,分析App与服务器通信内容;结合Python Requests库模拟请求,配置特定请求头以绕过反爬机制。同时使用代理IP隐藏真实IP地址,确保抓取稳定。最终成功提取热榜标题、内容简介、链接等信息,为分析热点话题和用户趋势提供数据支持。此方法也可应用于其他Android App的数据采集,但需注意选择可靠的代理服务。
482 11
移动端数据抓取:Android App的TLS流量解密方案
|
11月前
|
存储 数据可视化 开发工具
【Application Insights】Application Insights存储的Function App的日志存在"Operation Link" 为空的情况
在将 Azure Functions 升级到 .NET 8 和 Isolated Worker 模式后,Application Insights 的请求日志中 `operation_Link` 字段为空,导致分布式追踪无法正常关联。解决方法包括:确保引用正确的 SDK 包(如 `Microsoft.Azure.Functions.Worker.ApplicationInsights`),正确配置 Application Insights 服务,移除默认日志过滤规则,并使用最新依赖包以支持分布式追踪。通过这些步骤,可恢复端到端事务视图的可视化效果。
214 12
|
12月前
|
存储 监控 API
【Azure App Service】分享使用Python Code获取App Service的服务器日志记录管理配置信息
本文介绍了如何通过Python代码获取App Service中“Web服务器日志记录”的配置状态。借助`azure-mgmt-web` SDK,可通过初始化`WebSiteManagementClient`对象、调用`get_configuration`方法来查看`http_logging_enabled`的值,从而判断日志记录是否启用及存储方式(关闭、存储或文件系统)。示例代码详细展示了实现步骤,并附有执行结果与官方文档参考链接,帮助开发者快速定位和解决问题。
325 22
|
12月前
|
数据采集 数据可视化 数据挖掘
基于Python的App流量大数据分析与可视化方案
基于Python的App流量大数据分析与可视化方案
|
人工智能 运维 监控
一招高效解析 Access Log,轻松应对泼天流量
一招高效解析 Access Log,轻松应对泼天流量
242 0
一招高效解析 Access Log,轻松应对泼天流量
|
Go 开发者
【应用服务 App Service】App Service发生错误请求时,如何查看IIS Freb日志,从中得知错误所发生的模块,请求中所携带的Header信息
【应用服务 App Service】App Service发生错误请求时,如何查看IIS Freb日志,从中得知错误所发生的模块,请求中所携带的Header信息
249 2
|
开发框架 .NET Docker
【Azure 应用服务】App Service .NET Core项目在Program.cs中自定义添加的logger.LogInformation,部署到App Service上后日志不显示Log Stream中的问题
【Azure 应用服务】App Service .NET Core项目在Program.cs中自定义添加的logger.LogInformation,部署到App Service上后日志不显示Log Stream中的问题
244 1
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
【Azure 应用服务】当在Azure App Service的门户上 Log Stream 日志无输出,需要如何操作让其输出Application Logs呢?
【Azure 应用服务】当在Azure App Service的门户上 Log Stream 日志无输出,需要如何操作让其输出Application Logs呢?
169 0
【Azure 应用服务】通过 Web.config 开启 dotnet 应用的 stdoutLog 日志,查看App Service 产生500错误的原因
【Azure 应用服务】通过 Web.config 开启 dotnet 应用的 stdoutLog 日志,查看App Service 产生500错误的原因
365 0