时间: 2021-07-30 09:13:31 人气: 9 评论: 0
本文将围绕实际的数据分析步骤,细化地来讲讲具体是如何进行分析。
美国前邮政部长,美国百货商店之父,约翰·华纳梅克(John Wanamaker)感叹到:“我在广告上的投资有一半是无用的,但是问题是我不知道是哪一半。”
这种类似的感叹现在也经常发生我们身边。
小A同学:在项目结束后,拿到了项目数据,看看自己的方案是否有带来数据上的增长,但面对一堆面前Excel表里一堆密密麻麻的数字,却不知从何下手了……
小B同学:拿到了自己花大精力投入的项目数据,满怀期待的想来验证自己在项目中推动落地的好几个方案,还把项目过往数据也找来进行对比,一顿操作猛如虎之后,看到整体数据上涨了,但因为影响因素特别多,具体是哪些方案产生了作用却无从知晓……
我们更常遇到的情况是不知道该如何去运用数据,让数据带来实际上的作用。在上一篇文章《如何用数据指导设计?》中,已经阐述了设计师看数据的价值、数据是什么、何时看数据、以及数据指导设计的一些基本思路。本文将围绕实际的数据分析步骤,更细化地来讲讲具体是如何进行下去的。
数据分析主要分为6大步骤:构建X问题 – 提出假设&选择指标 – 数据采集与整理 – 数据分析 – 数据呈现 – 提出后续建议。
下文将围绕这6步详细讲解每一步具体是如何做的:
从本质上来说,数据分析的最终目的在于解决问题。带着不同的出发点得到的数据结果可能**很不一样。所以,一切分析的开始必须要先识别要解决的重要问题是什么,以及这个问题为什么是最重要的。这两个问题将引导我们进入构建问题的过程,也就是明确数据分析的目的。
(1)从哪入手:
①有预判类的分析,可以从已有的策略方案出发,寻找相应定量衡量方法。例如:尝试通过强化某促销A页面利益点等相关信息,从而促进用户购买,此案例则可以直接预设X问题为:“强化利益信息是否可以提升转化率”。
②而无预判类(发现问题或机**)的分析,构建问题的起点往往是业务角度的商业目标,通过指标拆解、经验判断、横向对比、逻辑推导等方式来寻找有效的实现方式。例如:某电商促销页面B的核心目标是“提升GMV(销售额)”,而GMV=流量*转化率*客单价,就可以围绕提升转化率、客单价等指标出发去寻找解决方案。
(2)判断是否重要
①有预判类的的问题,可以直接寻找指标评估验证结果是否可靠即可。
②无预判类(发现问题或机**)的则可以通过评估该问题解决后,能够对最重要的商业目标带来的增益**有多大。例如,上述提升GMV的案例中,通过横向对比相同类页面的数据,发现此页面的转化率为1.8%,明显低于同类页面4.7%的转化率,而流量和客单价与同类页面基本持平,故判断转化率极有可能是“提升GMV(销售额)”的关键点,所以可定义“提升转化率的关键因素是什么”为此页面数据分析的重要问题。
(3)定义X问题
可以根据不同的类型用一个问句来表达,如何/哪种/是否/原因是什么……。根据经验,细化之后的常见问题有以下几类,每类都可以用一个X问题来描述。
(4)注意,问题的范围不可过于宽泛
往往要得出一个可靠且明确的结论,**需要收集数据并将数据应用到一个可检验的假设身上。如果问题太宽泛,数据收集就**变得非常困难,举个反例:“项目D的数据效果是否有变好”,这个例子中,“是否有变好”可能的方向有拉新效果是否有变好/销售是否有变好/跳失情况有变好……
非常多种方向,每个方向都做探索将使你本次分析驶入无边大海迷失方向。但也不要过早地限制问题范围,刚开始时,可以开放性地思考问题,在脑中形成一些可供选择的方向。例如:“可能带来D项目的销售变好的可能情况是1、2、3,通过初步数据来看3的可能性**更高一些”,然后就可以往3的方向深入分析下去了。
在上一步中,我们已经明确了X问题,即数据分析的目标。接下来,我们将围绕X问题,提出该问题的结论假设,并建立模型(选择衡量指标)来验证假设是否成立。
1.2.1 提出假设
针对有预设的问题,假设可以直接来源于问题,如方案A有助于提升转化率。对于没有实现预设的问题,则需要我们围绕问题进行穷举可能的假设,如页面E的跳失率急剧下降,可能原因有:
1.2.2 根据假设,选择衡量指标
不同类型的假设,衡量方式**不一样,有些假设可能还需要定性调研配合来验证。在电商定量数据范围来看,可以参考以下思路:
数据源分为定量数据和定性数据,定性数据更偏用研方法,本文将注重讲定量数据的采集与整理。
1.3.1 数据采集
各平台的原始数据正在进入指数级爆炸的阶段,仅从电商平台来看,各类数据指标都非常的多而复杂。在采集之前的一个阶段,必不可少的是与数据产品或开发人员明确:
1.3.2 数据整理
数据整理的第一步是数据清洗,原始的数据表往往含有不少脏数据,如测试数据、异常值、空缺等等,直接用来计算分析可能**导致数据结论有偏差或无法计算。数据清洗就是要将原始数据表处理成可方便计算分析的干净整洁的数据表。
主要包括:
1.3.3 数据加工计算
数据整理好之后,可以进行初始的数据加工了。因为原始数据可能并不符合我们的分析需求,比如:我们想看的是某模块的数据,但原始数据是拆成每一个点击位的数据,我们就需要把每个点击位的数据进行求和等操作,转化成模块数据。
还有一些常见的情况是利用标准的行业计算公式,将某几个指标进行数理计算得到另一个指标,如单UV价值=GMV/页面UV、订单转化率=引入订单数/页面UV、人均点击次数=点击PV/点击UV……通过这一步的操作,我们将能初步看到要验证假设需要的一些基本指标的数据了。
数据整理完之后就到了真正的重头戏——数据分析了,也是含金量最高的一步。做数据分析有一个非常基础但又及其重要的思路,那就是对比,基本上90%以上的分析都离不开对比。
沿着2.2假设及衡量指标的思路,我们有了一个假设“X策略可以提升A页面转化率”,且定义了此假设的衡量指标为“页面转化率”,当我们拿到页面转化率指标后,转化率需要达到多少才算好呢?是否是因为X策略带来的提升,还是可能是时间规律上的自然上涨?这时就可以通过对比来分析了。
各个角度的对比都能帮助你更清晰的理解目前指标的情况,然后就可以据此继续做下一步计划啦~
因单篇文章篇幅限制,本文只介绍了6步取的前3步,及简单抛一些基本分析思路出来,后续系列文章将针对后3步——数据分析、数据呈现、及提出后续建议做更加细致详尽的介绍。
参考资料:
张文霖 刘夏璐 狄松《谁说菜鸟不**做数据分析》电子工业出版社
托马斯·达文波特;(美)金镇浩《成为数据分析师》浙江人民出版社
(美)米尔顿(Milton,M.)《深入浅出数据分析》电子工业出版社
作者:胡瑶,公众号:京东设计中心JDC(ID:JDCdesign)
来源:https://mp.weixin.qq.com/s/zurv3PejUz0DlrUgsSb84w
本文由 @京东设计中心JDC 授权发布于人人都是产品经理,未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议