时间: 2021-07-30 10:48:42 人气: 4 评论: 0
导语:“当XX指标下跌时,你**如何进行分析?”XX包括但不限于销售额、用户数、活跃率、ROI等等。这个问题是一个面试时经常遇到的问题,也是日常工作中很常见的一个问题。可同学们在回答的时候经常丢三落四,似乎不管怎么讲都讲不全。在日常工作中也经常被业务方纠缠,屁大一点波动也让你分析一下,分析完了又嫌弃:“我早知道了!”。今天作者为我们系统性讲解一下,该如何应对这个问题。
首先要明白一点:单纯靠数据分析,不可能100%理清所有原因。
真实的原因往往需要数据分析+市场调查+一线走访+行业研究共同努力才能锁定的。数据分析在解析原因上,更大的作用是定位问题而不是解答问题。想要解答问题背后的业务逻辑,市场调查要有用得多。
其次,业务出现波动是很正常的事,哪天不动了才是见鬼了,所以日常**经常碰到类似问题。
第一顺位要解决的是判定问题的轻重缓急。这样才能在时间和精力都有限的情况下,选择合适的方法。如果每一个问题都要深入彻底分析,就**浪费大量人力精力,耽搁其他工作。数据分析工作也要讲投入产出比的。
最后,很多时候其实真实的原因很难100%解析出来,但对业务来说,也不需要100%解析原因才能行动。对业务方而言,在特定的时间内,可以调整指标的方法是非常有限的,只要信息量足够支持行动就行了。
以销售指标波动为例,影响销售指标的原因有一大堆,见下图:
其中:顾客态度非常难量化,需要调研支持;外部竞争,行业景气这些需要行业研究。而产品卖得不好,到底有百分之多少归罪于用户,百分之多少归罪于销售,百分之多少归罪于营销,很难完全剥离清楚。
可能还得上个ABtest测试一下。如果每一次波动都这么折腾去找原因,公司就可以关门了。
与此同时,改善指标的方法却非常有限的:
所以判定了问题的轻重缓急之后,在有限的时间内帮业务部门找到应对策略,改善局面才是最重要的。指标能改善回来才是终极目标,探索宇宙真理不是终极目标。这是企业里做分析和大学里做研究的根本区别。
分析指标下跌的时候,本着:清晰情况 + 突出重点 + 够用就行的三原则,就能应付实际工作中各种场景。分析指标下跌并不是下**得越多越好,并不是找的指标越多越好,并不是事事都得上ABtest。
在能满足业务需求的情况,尽量依靠日报、周报、月报等固定报表解决战斗。尽量把专题分析留给真正有意义的话题,而不是每天对着这**来**去。
实际上因为数据源出问题,导致的指标异常非常非常多,具体的可以参见做埋点、ETL、数仓的同学们的各种吐槽。所以遇到问题第一顺位先确认数据没有错,不要报假警。
这是确认问题的轻重。常见的指标,比如销售额/新用户数/活跃率等等,其波动是有一定范围的,根据历史经验可以划分为轻中重。在数据真实的情况下,一般重度波动都是有明显迹象的。
比如受政策影响要停止某些业务,公司主动关停业务,春节/十一等假日因素。所以对于重大变化,事先要设好预期值,这样看数据的时候,就不**一惊一乍。对于严重**出预料的情况才做重点跟进。
这是确认问题的缓急。指标下跌/上升,通常有三种形态:
这三种形态本身意味着问题的严重性不同。
如果是指标下跌的话,持续性下跌≥一次性下跌≥周期性下跌。如果是周期性下跌,一般都不需要大惊小怪。如果是一次性下跌,往往来得猛去得也快,要关注事件持续性。持续性下跌,特别是不见好转,一路大牛市的下跌,持续的时间越长问题越严重。
单纯看走势并不能严谨解释问题,要和波动幅度结合起来看。比如同样是周期性下跌,如果本周期的数值明显比上周期跌得更厉害,就得注意,可能在周期性变化背后隐藏了其他问题。
同样是一次性下跌,如果相同事件下,跌得越来越厉害,就说明隐藏有其他问题。有些看似一次性事件,带来的影响可能持续发酵,最后演化成持续性下跌。持续性下跌中,可能每一期跌幅都不大,但放长线看,就**发现累积跌幅特别大,这时候问题严重性就更高。
很多业务部门**在这里犯错误。比如一说为什么二月份销量下降,就理所当然地认为是春节影响,没有认真计算其实今年春节后恢复速度大大慢于往年。
一看上促销有销量,就急着庆功,没有计算促销前的蓄力期和促销后的疲软期越来越长,很有可能平台的用户已经出现了结构性变化,忠诚用户越来越少。这些都是一味凭经验办事,不细致看数据的恶果。
做数据分析的同学们,往往**犯相反的错误,还没有判断轻重缓急,听到要分析XX指标下跌就急着提取一大堆数据。既浪费时间,又没有什么分析假设,结果大海捞针一样空费气力。
赶紧打电话向相关部门确认,之后向领导汇报。
如果真的短时间内发生重大问题,慢慢写代码分析本身就是贻误战机的行为,就像火灾来了不去打119,还在这认真分析哪里起火了,火大不大一样脑残。这时候赶紧先确认数据有没有问题,不能报假警。之后抓起电话赶紧向相关部门反馈。
对于长期存在的重大问题,要深入分析才能找到症结,这时候就得慢慢来,做多角度多维度的分析,而且分析结论要放回到市场调查、一线走访、行业研究里去相互验证,这样才是从根上解决问题的办法。不然分析完一版,业务并不觉得好用,最后还是白费力气。
不严重但是突发问题,先锁定问题点。因为问题本身并不严重,如果全面做检查,很有可能被淹没在平均值的计算里。去平均化,把真正问题严重的点暴露出来,这样后续分析才能深入。
这时候不用急着取一堆数据,问题本身不严重,取了也对比不出来所以然,可以再观测一段时间再说。
要注意的是,到目前为止我们没有谈到任何专业的分析方法或者技术,只要盯着一根销售曲线或者用户数曲线,做一些简单的同比,环比就够了。这就是传说中的数据敏感性。看到指标曲线开始下跌,敏感性高的话**先对走势进行解读。这一点后续我们还有专门的分享。
有了轻重缓急的判断,下一步就可以缩小怀疑范围,建立分析假设。之前我们说了,单纯依靠数据很难把原因搞清楚,但当我们缩小问题范围的时候,就更容易找到问题源头。而建立假设,有助于去伪存真的进行验证,进一步逼近真实原因。
往往重大的变化都伴随着重大事件的发生。因此反映在数据上,往往表现为在事件发生后,指标应声而落。这样即使不需要严谨的分析,只要在指标走势图上标识出事件发生的先后顺序,都能看出事件的影响。
事件可分为内部事件和外部事件。严格区分两种事件的影响是个很巨大的分析工程,而且很有可能压根区分不了。但内部外部事件对指标的影响方式与效果是不同的。
外部宏观事件我们常用PEST来分析,P影响一般是致命打击,直接把指标打崩,把业绩搞停。而EST的影响更多是渐进的、缓慢的、基础的、结构性的,因此表现在指标上,更多是阴跌不止。
内部事件往往能短期内快速改变指标,所以在解读指标变化的时候,可以按这个简单原则进行:泰山压顶看政策,短期变化找内因,长期异动找外因。
一定时间内同时发生的事件可能很多,要特别关注三类:
我们可以把事件标注在指标变动趋势图上,这样可以清晰地看到事件与指标的关系,从而更好地缩小怀疑范围,细化分析假设。找到那些看起来像是核心问题的事件进行深入研究。
有趣的是,在指标变动趋势图上标事件这件事,业务部门也**干,而且很多业务部门**直接依此下结论。比如天气一下雨销量就跌,一调价销量就涨。他们就想当然的**说:就是这个原因。
这是一种很经验主义的做法,可能**忽视很多结构性的问题。对做数据分析的同学而言,对于非十万火急的问题,其实这么做也无妨大雅。既然大家都这么认可,我们也省省精力。可以精选一些重+缓的问题,深入分析,找结构性变化的原因。这样既显得我们有价值,又显得我们懂业务。
区分问题发生的区域/渠道,也可以缩小假设范围。
比如看起来整体销售业绩下跌了30%,是否所有门店,所有区域都是30%,有没有还在涨的,有没有跌得更惨的,还在涨的/跌的惨的是不是有规律(门店位置、店长资历、开店时间、销售的产品线、存量客户群体……)通过分类对比,可以帮我们更容易找到问题发生点。
这么干还有个好处:为解决问题找标杆。比如在整体销售业绩下滑的情况下,有些省份/地市的门店可以做到不下滑,很有可能他们有独特的手段可以应对问题。
比如在整体流量减少的情况下,有些渠道仍然能供应优质流量,很有可能意味着新的机**。因此可以通过对比不同区域的数据,把表现相对好的也标出来,这样未来寻找解决方案也有了依据,不用自己凭空拍脑袋想办法。
需要注意的是,很多做分析的同学在这一步就直接下结论,大标题写“各地区销售问题分析”,然后给个答案是:因为ABC地区销量差,所以拖累大**。
这种分析是很容易引来:“我早知道了”的吐槽的。因为这只是找到了问题发生的地点,没有真正切入问题原因,真正影响零售的是外部内部,是人货场,不找到真正的问题根源,是不能说“问题原因是XXX”这句话的。
同区域类似,可以区分不同的客群进行切入,看不同客群间是否有差异。产品线也可以做类似的区分观察。一般传统企业没有完善的CRM,缺少客户ID,所以从产品线+区域的角度切入的比较多。互联网企业更关注用户群体,从用户角度切入的多。
这里引发了一个问题,比如当我看到区域、客群、产品线的时候,有可能都存在组间差异,该先从哪个维度切入呢?原则上讲,应该按行业的业务特性来,比如传统企业就是要先看区域再看产品。互联网企业就是习惯性先看用户。如果没有业务理解的话,那就看哪个组间差异大,从明显的问题切入。
截止到这里,字写了很多,可实际操作的时候非常轻松。因为以上所有分析只要基于一张指标日报和有分渠道/分用户群两个维度的日报就能搞掂。难点不是跑一个神奇的指标出来,而是去认真解读指标曲线走势,如收集和指标相关的数据。
锁定问题点以后,我们**有很多问题假设。本次指标下跌是因为:
之后可以根据时间、资源的条件来深入分析了。如果时间紧,可以直接打电话联系一线确认问题,然后把那些做得好的标杆经验直接复制出来。如果时间宽裕,互联网企业可以做ABtest,尝试剔除一些干扰因素。传统企业可以做试点,丢一些样板店下去看效果。
总之有了明确的假设,验证假设的速度就很快,找优秀标杆的速度也很快。前边所有的工作都是在为这一刻铺路。基础工作做扎实了,后续才越做越轻松。
这一篇的长度又破了陈老师的进度。熟悉陈老师的同学都知道,陈老师一向懒得写长文。为什么这个看似简单的问题却写了这么多?
是因为:解读指标才是数据分析师的看家本事,而这些年过度迷信技术,沉迷可视化,沉迷阿尔法大狗子,搞得新入行的数据分析师们的看家本事的水平越来越差。无论是求职还是工作都有很多让人尴尬的事。
比如很多同学2月份写日报,就写:因春节因素影响,销量低迷。然后2月份的周报也是:因春节因素影响,销量低迷。然后2月份的月报也是因春节因素影响,销量低迷。这就是传说中的三花聚顶式报表。同一句话啰嗦三遍,完全没有任何解读。
不过这不能怪同学们,因为跟很多同学深入聊以后发现:他们的主管压根没教过这些……
难怪,这些年很多挂着“数据分析”组长头衔的领导,其实是做hadoop,做BI出身,写sql出身,本身确实只有开发能力没有分析能力。所以这一篇才特别啰嗦,希望大家能平时多练起来,日报、周报、月报是数据分析的骨架,骨头都软了,人也就直接废了。
照例,这么长的啰嗦是有福利的,陈老师把上边拉拉杂杂所有的总结一张思维导图,下图左边是确认假设,右边是判定轻重缓急。大家在面试的时候,最好自己一边写思维导图一边说,对面试官是秒杀级的,比随口扯几个理由,然后被人嫌弃:讲得不全,讲地不到位要好的多。
接地气的陈老师,微信公众号:接地气学堂,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议。