时间: 2021-07-30 10:48:25 人气: 6 评论: 0
编辑导语:在互联网,无处不在强调数据分析的重要性,互联网岗位离不开数据分析。那么,有没有一种通用方法能够快速将实战和方法结合起来?作者分享了自己的一套关于指标数据分析的一套方法,我们一起来看下吧。
这几天延期一年的欧洲杯正在如火如荼的踢着,学姐作为伪球迷也在借着看球的名义吃夜宵,不知道大家有没有发现,现在的比赛越来越高科技了,不仅有VAR,每个球队除了在场上(抠鼻子)的主教练之外,还有专门负责数据分析的团队,甚至国外的体育大学都设立了数据分析专业。
那么身在互联网行业的我们,还能不好好学数据分析吗?
数据是互联网的魅力之一,经常看到网上有一些注水文章“学好数据分析,年薪提升50%”、“这种类型的产品经理很稀缺,月薪XX!”之类的,当然学姐不是这种标题党,但也从侧面反映了数据分析对确实很重要。
互联网的岗位,不管是产品、运营、销售、市场、战略等等,几乎都一定**用到这个技能,甚至学姐认识的研发,在周报里面也开始做数据分析了。
大家平时是否有遇到过这些问题:
业务千千万,数据也各不相同,那么是否**有一些通用的方法?怎样把方法和实战结合?下面学姐就来做系统地介绍,希望大家可以举一反三。
在讲数据分析的第一步——怎么选取核心指标之前,还是要先强调下,就像社**主义有核心价值观一样,任何产品都**提供其核心价值,价值不是数字、不是指标也不是KPI。
如果老板让你去完成某个KPI(比如DAU或者交易额提升到多少多少),但是却说不清产品提供了什么核心价值,那是主次颠倒了,是先有产品价值,基于产品价值才设立对应的KPI。
不清楚什么是产品核心价值的童鞋,可以留心下各大厂的slogan,一般可以看出一些端倪,比如阿里是“让天下没有难做的生意”,那么翻译过来,核心价值就是帮助用户在平台上找到想要的商品,从而让卖家卖货更简单。
比如美团是“帮大家吃得更好,生活更好”,也就是帮助用户在平台上找到更好的餐饮服务和其他生活服务;微博是“随时随地发现新鲜事”,就更直白了(吃瓜ing)。
有了产品价值之后,如何用指标去衡量?
首先,指标一定是和产品价值对应的数字(后几段介绍指标时**举例)。
其次,我们要明确一个概念:主要指标和次要指标,类似于主要矛盾和次要矛盾。主要指标只能有1~2个(1个最佳),是现阶段公司或部门最重要的指标,这就像社**主义目前的主要矛盾只有一个一样,如果定太多就没有意义了。
同时,我们还可以监控几个重要的次要指标。因为指标之间往往**产生冲突,比如在一个电商平台推高客单价的商品,那么购买人数可能就**减少;比如通过降低成本来提升利润,就可能**影响用户体验,用户数可能**降低。
很多公司被“既要又要还要”这句鸡血口号迷惑,选n多个指标,每个都要提升一把,结果往往是左手打右手。
其实当主要指标、次要指标和其他指标产生冲突时,我们**优先选择提升主要指标的项目,再选择提升次要指标。
当然,和社**主义的主要矛盾一样,主要和次要指标**随着公司/业务的阶段变化。
在初创期和发展期,我们**更关注业务规模,来验证产品模式,不过多地考虑收入和利润,才能快速扩张,而在成熟期和衰退期我们**更关注赚钱。
如果打开某个大厂的财报PPT,主要指标往往**写在第一页最醒目的位置(当然财报的封面和免责那几页不算啦~),而次要指标**写在第一页其他位置或前几页。
初创期&发展期常见的关键指标有以下几种:
(1)有效用户数/客户数
注意是有效用户数不一定是DAU/MAU,不同的业务有不同的定义。
比如**主营业务提供在线社交的用户价值,**看微信和**的合并月活跃账户数(12亿,快赶上中国人口了),也就是仅打开App的用户不算,一定要注册了账号且登陆的活跃用户才算,因为没有注册登陆的用户无法在这些平台上社交,也就没有必要计算。
比如拼多多和美团作为交易平台,**把交易用户数作为主要指标。如果美团把月活跃账户作为主要或次要指标,那就偏离了这些平台应该提供的产品价值了(拼多多有社交属性,倒是可以看下)。
摘自**2020年报
(2)供给数
在有供需关系的双边平台(关于有供需关系的平台可以看学姐的这篇文章)这个指标很关键,因为用户的需求就是找供给。比如电商的SKU数、O2O的商家数,比如内容平台B站除了除了看月活跃用户,也**把活跃UP主数作为次要指标。
摘自B站2021 Q1财报
(3)订单数/交易额
如果用户数和供给数都趋于稳定,那么一个交易平台(或业务)就要考虑提升供需匹配的效率,最直观的指标就是订单数或交易额了。
同样是交易平台,拼多多还处于扩张阶段,更关注交易用户数的增长,也就是上文提到的有效用户数(年交易用户8亿多,还能保持31%的年同比,真不戳),而阿里更关注交易额(年GMV 8兆?数零要好一**儿了)。
摘自拼多多2021 Q1财报
摘自阿里巴2021年报
在业务的成熟期和衰退期,我们可以把更多精力放在“搞钱”上,也就是营收、利润指标:
营收。不少(几乎全部吧)互联网上市的时候利润是负的,为什么还能有几百亿几千亿的市值?因为他们有能力把初期的“用户数/供给数”、“交易额”转换成了实打实的营业收入。
传统公司经常**看市盈率(PE值,利润除以股数),而互联网或者科技公司**去参考PS值,也就是营收除以股数,可见营收的重要性。
因为互联网有规模效应(关于规模效应可以看学姐的这篇文章),当突破规模效应的节点后,通过很低的边际成本来盈利,因此高营收代表着未来盈利的潜力。
即将上市的滴滴年营收**过一千亿,招股书中还有一部分专门解释营收是怎么计算的(下表),看晕的童鞋,学姐简化下:用户打车费10元,过路费和税金等费用1元,平台补贴用户9元,用户实付10.1元,交易额等于11元,营收是10-0.9=9.1元。
摘自滴滴出行招股书
利润。除了标准的利润计算方式之外,互联网公司的利润还有非标准的计算方式,比如把固定资产的摊销去除、把某笔一次性投资得到的利润去除、把发给员工的期权去除等等(如果不清楚具体算法,可以去咨询公司的财务)。
当然这其中产品或运营比较需要关注的是怎样通过产品或者运营的手段去降本提效,从而提升利润,比如内部系统就是典型的提升效率的工具。
看了这些大厂的指标后,大家有没有明确定义出自己业务的主要指标和次要指标?学姐总结为一句话“对着价值定指标,分清主次:前期拓规模,后期搞钱”。
核心指标往往是比较战略层面的结果指标,那么到底要怎么完成指标?
很多童鞋(也包括老板)不知从何下手,拍脑袋想出了一些方案,想盲试一下结果。
其实这这当中缺了一步,对结果指标进行拆解,得出过程指标,因为关键的主要指标和次要指标,其实都是结果(指标),而产品方案是过程,所以这两者之间**产生断层。
怎么样把结果指标拆解成过程指标?比如学姐的朋友小明平时爱躺在家里喝奶茶,体检后发现自己得了脂肪肝,医生告诉他减重10%以上才可以让肝脏恢复正常,那么小明想恢复健康,“体重”就是结果指标,小明决定提升运动量并控制饮食——靠每天跑步5KM并且不喝奶茶来减重。
那么运动后“多消耗的卡路里”和控制饮食后“少摄入的卡路里”就是两个过程指标。当然,小明是查阅了一些资料才作出这个拆解,那么我们要怎样才能找到我们的“卡路里”?下面介绍几种常见的拆解方法。
(1)漏斗法
对用户的每个步骤进行拆解。
比如一个电商交易平台,每日的购买用户数可以拆解为DAU*访购率(即购买人数/访问人数),我们可以把DAU、访购率作为过程指标进行监控,也可以进一步细拆。
比如从DAU→商品详情页→下单→支付成功,每一步的转化率,从DAU→商品详情页又可以再拆为DAU→商品列表页→商品详情页,总之每个步骤的转化率都可以作为过程指标进行进一步的细拆。
那么如果该电商平台的主要指标是核销交易额,那么就还需要在支付成功之后,把核销率(也就是1-退款率)、客单价也作为过程指标监控。
(2)分层法
对于用户进行分层后再进行漏斗分析。
比如外卖平台可以监控不同城市用户的访购率,可以这样分层:
分层要符合MECE,也就是补充不漏的原则(关于分层可以去看学姐介绍MECE方法论的文章)。这其中最常见的拆解法就是根据用户的路径(用户从哪些模块进入)去监控漏斗了,以某电商App举例子。
我们可以选取其中UV占比高,访购率低(上表中蓝色列)的路径去细拆更多过程指标比如每一步的转化率(上表中**色列),看是否可以通过产品体验去提升数据,怎么找出有潜力的指标**在下一章中详述。
(3)周期法
随着时间推移看用户的某些属性。
比如有些SaaS、**产品是付年费的模式,那么我们就可以把某个时间点的付费用户先通过分层拆解成:新签约用户+老用户=新签约用户+(到期老用户*续约率+未到期老用户)。
这样看,续约率就是一个比较值得监控的过程指标了。
大家经常**去看的留存率也是同理,对于把MAU作为主要指标的业务来说,可以这样拆解:新用户+老用户=新用户+(上月MAU*次月留存率+两月前MAU*两月留存率+……)
为了避免累死自己(和BI),我们选取一个固定的周期去看就行了,比如次月留存率、半年留存率等,一些粘性较大的平台(容易上瘾的那些,比如游戏、抖音等)可以看次日、7日留存率。复购也是同理,高频的可以看每周的复购,低频的可以考虑半年复购等。
再进一步,我们可以把分层法和周期法结合,把上个月的访问用户拆解为新用户和老用户,看新用户的次月留存和老用户的次月留存(新、老用户的复购率也是同理)。
(4)投入/产出法
把利润拆解为产出减去投入,就可以看出目前的业务模式是否有盈利的的可行性,比如用LTV(单用户生命价值)减去CAC(单用户获取成本),就好比小明每天消耗的卡路里减去他摄入的卡路里,如果是正的才能帮助他减肥。
LTV是指平均一个用户在生命周期内(从加入到离开)产生的总收入,如果小明买了一个电动牙**1000元,利润率50%。
假设每个牙**平均使用三年,三年之后小明**喜新厌旧抛弃该品牌,且每半年要换一个**头(假设只能购买该品牌的**头),**头每个100元,利润率70%。
那么小明对于这个品牌的LTV就应该是1000*50%+100*(2*3-1)*70%=850,所以我们不能简单地将LTV理解为1000*50%。
当然,我们也不能把这期间小明买的牙膏也算在LTV内,如果该品牌很良心地开发出一款可以永久使用的**头,那么我们只需要简单地算这一次购买的利润就行了,也就是500元。
所以,一个业务到底怎么去计算单用户生命价值(LTV)是很重要的。
很多互联网业务,比如在线教育、医美等,前期都使用勾子单进行推广,就是因为后期的“**头”可能比“牙**”还贵得多,比如体验课9.9,而正式课可能要3万元(假设利润率60%)。
如果有10%的转化率能转化成正式用户,其实这就类似于用户可以购买任意**头去适配这款牙**,而有10%的概率用户**使用该品牌的“**头”。
那么获取一个体验课的用户成本(CAC)只要远低于30000*60%*10%=1800即可,9.9元都可以忽略不计了。
CAC是指获取单个用户的成本,在互联网企业中,我们可以更关注获取单个用户无法节省的成本,比如购买一个用户所需要的广告费用、销售费用等。
而那些有边际效应的成本在初期可以先不计算在内,比如产品、研发费用等,等业务有了规模之后,这些成本将**被分摊的很低。
比如B站是PUGC的模式,当入驻的UP主越多,每个入驻UP主的边际成本也就越低(因为B站的品牌也越来越响了),所以这部分成本初期可以先不计算在内,而爱奇艺的剧就需要专业团队去逐一了解后再去购买版权了。
所以每个剧的成本(不管是版权还是专业团队的工资)并不**降低很多,这部分就一定要计算在CAC内(所以B站的市值目前是爱奇艺快4倍了)。
当然,这些拆解法可以互相组合,刚刚提到的用户路径、不同用户的留存率就是把分层分别和漏斗、周期结合得到的,比如也可以去看不同地区用户的LTV和CAC。
经典的RFM模型就是把周期(最近一次消费时间)和分层(用户的交易频次和金额)进行了结合,虽然听上去分出9种情况有点小复杂,但其实都是从很简单的维度去拆解,有兴趣的童鞋可以自行学习下。
拆解出过程指标后,我们发现每一个过程指标看上去都有可能提升,比如小明百度之后发现充分的睡眠也能帮助脂肪肝恢复,那么为什么他选择了跑步和不喝奶茶呢?因为小明发现自己能保证8小时睡眠,已经在最佳范围内了。
对于产品来说也是一样,我们如果能预估某个过程指标能提升的数值,就能计算出对结果指标可能带来的提升了。
比如我们在看了不同路径的用户访购率后,发现某个路径的体验可以明显提升,从而对访购率带来10%的相对提升,那么用该路径的UV*10%就可以得出购买用户数提升的数量了。
完全估准这个数需要一定的经验,不过我们也可以借助以下的几个方法:
(1)查看行业报告
比如国家统计局的数据、某些机构的报告等。
一般来说国家的数据是最准确的,除了人口、人均消费能力等基础数据,还有细分到各个行业比如农业、工业、餐饮、旅游、教育等等各行各业的数据。
比如一个OTA行业的童鞋拆接出一个供给侧的过程指标——平台上入驻的星级酒店数量,那么他就可以用现在平台上的星级酒店数量除以全国总的星级酒店数量,得出覆盖率。
如果这个已经很接近100%了,那就没有提升的空间了。国家统计局的宝藏网站请大家百度“国家数据”并点击第一条。
(2)类比
找类似的行业/竞品/页面/入口做对比。
还是OTA的例子,如果该童鞋发现星级酒店的覆盖率在50%左右,而竞品平台的覆盖率是80%,那么如果我们相比竞品并没有明显的弱点,那我们的覆盖率还是有提升空间的。
再比如,按照路径分析用户访购率后,发现类似的几个运营位之间,有一个运营位的访购率明显低,而这个位置的UV占比相当可观,那就很有潜力了。
如果找不到竞品也没有类似的入口/页面,那我们也可以去找类似的行业。
比如两个票务相关的行业——火车票和电影票,都是提前预订座位的形式,电影票的线上化率(在线购买电影票的交易额/所有电影票的交易额)约90%,可以预估火车票线上化率的天花板**略低于90%。
因为火车票是班次+座位的概念,电影是场次+座位的概念,场次和班次的概念非常类似,但火车座位对体验的影响没有电影这么大,所以大家**更倾向于事先在网上抢好离屏幕近的电影票。
(3)调研分析
还是OTA的例子,如果童鞋发现星级酒店的覆盖率是50%,但是又拿不到竞品的数据,那么除了安插商业间谍或者爬数据之外(犯法的),可以通过调研的形式去预估。
比如对各个星级没有合作的酒店进行抽样,调研他们没有上平台的是因为线下的客人或竞品带来的客人就已经让酒店满房了(无法解决),还是因为销售没有触达或者产品体验不佳(可以解决),再去预估覆盖率提升的潜力。
不管是过程指标还是结果指标,我们都不能指望一下子拉满,需要有一个阶段性的数字。
“一个亿”小目标大家都听过吧,王健林的原话是“想做世界首富,这个奋斗的方向是对的。但是最好先定一个能达到的小目标。”
比如我先挣它一个亿,你看看能用几年挣到一个亿,你是规划五年还是三年。到了以后,下一个目标,再奔10亿、100亿。
那么1亿、10亿、100亿就是阶段性的目标,就好比小明要减10%的重量,他先通过每天5KM和戒奶茶,希望先在半年内减掉5%,但如果每天跑10KM且不吃肉,想能在一个月内直接减10%,这对小明来说就不太现实了。
好的阶段性目标应该有以下特点:
(1)选取的时间段合适
足够完成提升某个过程指标的3-5个小功能及1-2个大功能,太短**验证不出这个指标是否有潜力,导致过早放弃,太长又**在不必要的方向上浪费时间。
比如我们想提升某个运营位的访购率,发现从运营位到商户详情页可以通过产品优化提升。
如果产品设计需要1周,排入版本后发布需要3周,用户更新版本需要1周,运营还需要1~2周去测试哪种素材效果最好,那么一个大功能就需要1个半月的时间去验证结果,那么三个月考察一次阶段性指标是比较好的。
(2)结果指标提升的数值有一定的挑战性
但是又不**太遥不可及,至少能完成70~80%,数值如果太高容易让团队士气低落,太低又**导致摸鱼。
可以根据增长曲线去估算,比如一个初创期的新业务第一年YOY(年同比)增长300%,在大**没有变化的情况下,第二第三年增速可能就**稍微放缓。
但是也应该保持在三位数,一个发展期的业务YOY可能在30%~50%左右,而一个非常成熟的业务如果YOY能保持两位数就很不错了。
根据这个结果指标去拆解,就可以得到相应的过程指标的增长值了。
如果发现选定的过程指标完成了目标,但是结果指标却没有相应的增长,那么有可能是拆解的时候发生了错误,也有可能是在产品优化的过程中别的过程指标下跌了。
比如小明虽然戒了奶茶,但是戒奶茶导致他失去了精神慰藉,每天喝咖啡续命,影响了睡眠,导致熬夜后发胖。
这种情况特别容易出现在一些拆的非常细的过程指标上,比如我们把访购率拆解成:(运营位→商品详情页的转化率)*(商品详情页→下单的转化率),然后决定提升前者,在活动的landing页优化了一波,最后发现前者涨了,后者跌了,乘一下四舍五入等于白干。
学姐不是很**成在一个用户路径上只考虑单独的页面,要知道用户购买商品是一个完整的流程。
如果只是在某些地方进行优化,路径的前后没有相应的配合就很难达到效果,比如在landing页弄了些花里胡哨的优惠标签和动画效果骗用户点击到商详,然后用户在商详中发现优惠不实或者并不是自己想找的商品,那后续下单的转化率当然就跌了。
那么如果运营位的访购率有增长,但是还是没有完成购买用户数的指标,可能是什么原因呢?
那一定也是其他的指标发生了变化。
我们也可以分层拆解(和拆解过程指标是类似的),比如这样的运营位优化是不是在大促活动的时候让UV转化率提升,而日常的运营活动素材不适合这样的入口,那么是否应该考虑设计另外一种运营位的样式,在没有大促的时候来适配日常的运营活动?
总之,数据分析就是一个不断拆解和推理分析的过程,我们先根据产品的核心价值来定下关键的结果指标,然后再拆解出过程指标,找出其中有潜力的几个,并定下阶段性的结果指标和过程指标,通过项目的数据来验证我们找的方向是否正确。
那么针对每个项目、页面,要怎么设计项目的打点、实验,才能确保后续数据分析能更全面、准确?要选择什么样的数据产品去持续监控数据呢?请期待学姐文章的下半部分。
作者:海贝学姐;公众号:海贝学姐
本文由 @海贝学姐 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于 CC0 协议