所谓的常识,很大一部分是周期性变化:到了这个时间,就会出这种事。周期性分析,主要是从日常杂乱的数据中,发现会周期性出现的规律,从而避免上述问题。常见的周期包括两种:自然周期/生命周期。
所谓自然周期,是指业务指标随着时间自然发生波动,比如上边吐槽的“2月份业绩自然少”,这是因为2月份过年,大家都放假了,业绩肯定少呀。
类似地:
- 吃喝玩乐类的消费,一般周六、周日比较多,这时候才有空出来玩。
- 企业间交易,一般工作日高,周末很低。大家都放假了谁还办公呀。
- 雪糕冰棍冰淇淋类商品,一般夏季是旺季,冬季是淡季
- 帽子手套暖手宝类商品,一般冬季是旺季,夏季是淡季
这些是比较直观的例子。需要注意的是,所谓的自然周期,对不同业务而言是不一样的,切不可混为一谈哦。
但是很多时候,自然周期表现并不直观,隐藏在日常起起伏伏的数据里。这时候就需要我们手动发现周期规律。比如比如一个公众号的阅读人数走势,可能如下图
一眼看过去,是不是弯弯曲曲,毫无规律可言?
这就需要手动做区分。为了更好的区分,一般取6个月的,每日的数据。因为六个月的时间,一般能涵盖2个季度,能观察出季节性变化。
同时,每日数据,能观察出每周是否有规律和每月是否有规律。不过上边例子只给个2个月的数据,那就凑合着用。
从上例蜿蜒起伏的波折里可以直接看出:没有明显的月规律。一般有月规律的数据会如下图所示(如下图)因此可以进一步观察,是否有周规律。
想看周规律,需要把数据做一下处理(如下图),把6个完整周的数据,从周一到周日对齐。之后做折线图,更容易观察出周规律。
处理过以后,可以看出:却有周规律变化,表现为:周一至周六逐步降低,周日反弹。如果把每周一到周日的数据做平均数,就能画出周规律曲线(如下图)
这里有很多明显不符合走势的点。这很正常,因为公众号发文也是有分类的,如果是卖东西的文章阅读就很低,派福利、抽奖类的阅读就高一点,搞标题党的《震惊!》《大厂!》《字jie!》的阅读就很高。所以除了日期,也和文章类型有关。
周期性分析,主要目的是做出一个参考曲线,为进一步判断提供依据。进而避免:“为啥周六阅读那么低呀!”这种低级小白问题。之后再结合内容标签,做进一步的分析。
比如上例中,第三周周一、周二是明显异常点。如果没有做标签,就会直接报警:“本周连续2天异常!请注意!”但是做了标签,如果发现周一发了卖货文(原本就该低)周二则是标题党(原本就该高)则不需要大惊小怪了。
还有一种周期是生命周期走势。比如一个活动上线,刚上线的时候肯定参与人很多,之后感兴趣的都参与过了,不感兴趣的都不参与了,因此人越来越少。这样就会出现如下图的走势。
注意:要发现生命周期走势,统计数据,是从一个业务开始的时候进行统计的,之后往后数:第1天/第2天/第3天……或者第1个月/第2个月/第3个月
生命周期走势有很多经典的运用。比如一款新商品上市,其销量和上市时间,经常有如下关系,因此被称为“商品生命周期”。
类似的,还有“APP生命周期”“用户生命周期”的说法,都是一个时间轴+指标走势组合出来的。后续有机会再跟小伙伴们一一分享。
以上就是今天的分享。周期性分析看起来很简单,因为它主要是用来做参考线的,为后续各种分析方法铺路。很多复杂的分析,比如数据监控模型、数据预警模型、数据驱动决策,也是以周期性曲线为参照,所以小伙伴们先掌握基础方法,再循序渐进哦。今天的分享就到这里,谢谢大家