时间: 2021-07-30 09:07:49 人气: 34 评论: 0
编辑导语:在数据分析及其可视化产品中,我们最常使用的分析思路就是对比分析,有对比才有实际可量化标准。那么对于量化对比,我们最常使用的是同比、环比分析。虽然它们听起来很普通,但是其中需要考虑的点却不少,我们一起来看看吧。
在数据分析、数据可视化产品中,最常用到的分析思路就是对比分析,有对比才有直观的量化评价标准,如果只是说今天DAU 1000W,那这1000W仅是个数字而已,业务表现到底是好还是坏呢?
对比分析过程,日期的对比是最为普遍的对比角度,而不同的业务属性、业务不同的发展阶段,日期对比的范围也往往不同,同比、环比听起来很简单,但实际在数据分析或数据产品设计时,有很多要点需要考虑到。
当对比日期为上周同期、或者上月同期时,有的人**叫周环比,月环比因为很多人把同比定义是对比的去年同期。从同环比的定义出发,可以明确澄清一下,对于某日数据对比上周同一天或上月同一天时,严格的定义应该是:周同比、月同比,而不是环比。
对于实时监控类的分析场景,数据更新频率到分钟级,直接看对比日期的分时段数值和趋势,可以更直观的看到最新的业务表现是否**越了历史,创造了新的业务峰值。
不同日期颗粒度的数据,支持对比的方式如下:
在同环比计算时,有些坑点还是要提前在需求层面确认好,避免测试或上线后,再去调整。
天粒度的数据,月同比的计算**存在此问题,例如3月29日之后的日期,同比上月(2月)时,可能2月就没有对应日期的数据了,此时对比分母不存在,可以做“—”处理,即这几天的月同比值不存在。
每周对应去年同期的周日期基本上是对不上的,一般的处理方式是,建立每一年的日期维度表,即对每年的周进行1-52的编号,周同比计算时,可以用当前周编号,减去一年(52周)的周号计算
数据产品的数据是动态更新的,周一或者每月看数据,当周、当月都没过完,此时同环比的计算需要考虑数据对齐的问题。
方式一:直接用本期已有数据,对比上期完整周期的数据,例如现在7月10号,7月数据环比计算时,取7月1日-7月12日,而6月则是整月的数据。
这种方式的好处是数据处理简单,不需要额外增加清晰工作量,不足是数据对比有失偏颇,用不完整的数据,对比整周或整月的数据。只有当周期过完时,数据才是相对可信的。
方式二:本期和上期相同天数的范围对比,例如:今天7月20日,7月数据环比6月,是用7月1日-7月20日的数据对比6月1日-6月20日数据,优点是数据对标范围一致,缺点是对比日期的数据需要动态的计算,尤其对于UV类涉及去重的指标,需要单独清洗一份数据,**增加额外的工作量。
如果前期没有说明清楚逻辑,测试或者上线后再调整,重新清洗数据就已经来不及了。
一般建议采用方案二,**更加严谨。
同比、环比是数据产品设计中最常用的对比分析功能,来定量评估数据的表现。相比较离线数据分析的静态数据,数据产品的数据是每日更新的,天、周、月不同时间颗粒度以及周初、月初等不同时间节点,同比、环比计算时都有一些坑点需要提前明确好逻辑的。
数据干饭人,微信号公众号:数据干饭人,人人都是产品经理专栏作家。专注数据中台产品领域,覆盖开发套件,数据资产与数据治理,BI与数据可视化,精准营销平台等数据产品。擅长大数据解决方案规划与产品方案设计。
本文原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Pexels,基于CC0协议