时间: 2021-08-03 09:36:00 人气: 15 评论: 0
接下来两篇文章都是针对虚假流量的识别,上篇围绕虚假流量的发生机制、发生原因(背后的利益捆绑)、识别虚假流量的常见维度等;下篇从一个案例完整介绍如何识别虚假流量。
电商、支付平台、O2O、自媒体、广告等行业无一例外地充斥着虚假流量,不同行业的流量作弊形式不同。对广告主来说, 了解广告投放过程中虚假流量的作弊形式和获益形式,是识别虚假流量的基础与前提。
图 1 各行业虚假流量的形式
一般而言,广告投放过程包含这样几个环节:
由于广告投放过程中渠道服务商存在各级代理,存在流量获取的透明度不高的问题,让可供作弊的灰色区域越来越多。
图 2 广告投放流程
看似正常的广告投放流程,其实隐藏着虚假流量的危机。站在广告主的角度,我们从两个方向去解读虚假流量:
图 3 机器作弊 & 人为作弊
“机器作弊”常见的手段有,通过机器发送虚假流量、肉机访问网页、修改 DNS/IP 访问网页、爬虫技术访问网页等手段来 制造虚假流量,目的是模拟浏览行为产生大量浏览痕迹或点击和实现流量增加,机器作弊的成本相对较低,但都离不开代码程序。
目前较好的预防措施,是通过基础的用户行为分析来识别此类虚假流量,再通过补量、屏蔽的方法来减少此类虚假流量。 例如:频繁更换用户身份,在一个 cookie 身上猛薅羊毛,一个用户有成千上万次展示;
再如:iframe 造假展示也是常用方式,iframe 是一个 HTML 标签,常常被用来作为承载展示广告的载体,作弊可以通过将 iframe 的尺寸改为肉眼无法识别的图**。但这毕竟算一次曝光,广告主**要向此付费,实际上用户并未看到。
“人为作弊”场景的手段有,通过雇佣、激励的方式雇佣大批人员去点击广告、下载 APP、访问网页,因为属于人为操作。
这类虚假流量较难屏蔽,但成本相对较高。可通过深度用户行为分析,如转化情况来识别此类虚假流量,并提高“人为作弊” 的运营成本来减少此类虚假流量。
图 4 虚假流量的获益形式
提到虚假流量的获益形式,就离不开上文提到的广告付费形式。每种广告都**有对应的结算和考核指标,这就成为虚假流量作假的痛点之一。
每种广告都有对应的付费形式,每种付费形式都有虚假流量获益的诉求点,这些组成了虚假流量获益的形式。这些虚假流量的出现,通常带有明显特点,比如:点击变得很频繁但无有效交互、一段时间内同一个人频繁访问投放的广告等。
虚假流量之所以能成为“生态圈”,是因为供需双方有着共同的利益。在这个“生态圈”中,虚假流量的提供者、虚假流量 的获取者是两个重要角色。
广告平台和媒体是虚假流量的提供者,两者掌握着大量的流量资源。
在一定程度上,广告主很容易成为虚假流量的“推动者”,例如在以下场景中:
虚假流量并无高深的技术含量,且流量造假成本极低。相关数据显示:**流量的成本不及正常流量成本的十分之一。
广告主对流量质量的评估,除了发布方提供的报告外,无直接证据证明对方造假,因此追究虚假流量难度大,维权较为困难。
为识别虚假流量,广告主**因以下两个问题而犯难:
广告投放数据与网页转化数据断层是信息不透明的重要原因。
什么是广告媒体数据?
前文提到,虚假流量**针对曝光和点击数据做假,这两个数据就属于广告媒体数据。
什么是转化数据?
当流量来到网站后就成为了访客,访客在网站完成交互(如:L注册、有效呼起、下载等)可以认定为线索, 这就是转化数据。 广告媒体数据与转化数据断层,也就是通常说的前后端流量数据割裂。
这种情况下,一旦转化率下降,广告主将无法判断 是投放策略问题还是虚假流量作怪。 广告主只能统计到前端的点击转化,不知道后续业务转化如何,广告主不能获得用户的详细信息,就很容易被广告平台所 蒙蔽,尽管对广告平台的流量有所怀疑,也没有明确的作弊证据。
无论是哪种转化行为(注册、呼起、下载、激活等)都离不开流量渠道,更多时候转化行为是由多个流量渠道共同承担的。
当全部流量混在一起的时候,即使你知道有虚假流量存在,也无法准确定位是哪一个渠道带来的虚假流量。
无论从哪个维度入手,识别虚假流量,需要将流量数据、行为数据和转化数据通过一定的数据采集手段,来获取完整、全 面和准确的数据,目的是实现全流程数据流量的跟踪与分析。只有获取了完整全面的数据,我们才能找到虚假流量的踪迹,只分析一个虚假流量环节,不足以支撑虚假流量的证据。
下图是流量转化的完整过程:为方便大家理解什么是“全流程数据流量”,可见下图:
图 5 全流程数据流量
一般来说,真实流量一般自然 (真实的流量在各个维度中表现一定是自然的)与多样(网民的喜好各不相同,行为一定也是 多样的)。而对于虚假流量,常表现出一定的目的性(虚假流量的产生一定和某个特定的目的有关)和规律性(特定的目的导致虚假流量一定有特殊的规律)。
由于虚假流量与真实流量在具体访问行为有较大差异,围绕用户行为可从以下几方面识别出虚假流量。
图 6 识别虚假流量的常见维度
具体包括:时间 & 地域维度、终端类型、操作系统、联网方式、运营商、IP 集中等。
具体包括跳出率、平均访问深度、平均访问时长、用户行为路径、页面点击情况、流量留存情况、单页面人均访问次数等。
(1)跳出率
我们通常通过跳出率来衡量网站性能与质量等,跳出率也可以作为辨别虚假流量的参考指标。如果跳出率过高,我们除了要判断投放渠道的质量和定位客户群体是否精准外,还应该警惕虚假流量。
(2)平均访问深度
访问深度是用户一次浏览网站、APP 的深度,它是衡量网站服务效率的重要指标之一。以**量为目的的虚假流量,用户访 问深度通常非常低。当然,造成用户访问深度不够的原因有多种,如:新投放的落地页的失败引导等。
因此我们在观察此指标时, 应率先排除产品较大改动造成的访问深度不足等特殊情况,或者与其他渠道的流量数据综合比较,进行科学评估。
(3)平均访问时长
平均访问时长指标,主要用来衡量用户与网站、APP 交互的深度。交互越深,相应停留的时长也越长。显然虚假流量追求 的是“量”,而非“时长”,因此平均访问时长也可以配合几个网站参与度指标一起分析。
(4)用户行为路径
用户在 APP 或网站中的访问行为路径,用户路径的分析模型可以将用户行为进行可视化展示。因此通常用户通过渠道来到 网站后**有不同的行为,他们一般**从落地页开始进行分流,**访问不同的页面,并在不同的页面结束对网站的访问。
显然, 用户行为序列分布是没规律的,而对于虚假流量,虽然通过某些方式完成 2-3 次点击,但也是预先设定,有迹可循的。
(5)页面点击情况
虚假流量用户的页面点击通常是不点击,或者杂乱点击的,借助热力图工具可以较为容易地发现问题。
(6)留存情况
留存可以判断用户忠诚度,真实的流量总**有一部分访问者**再次访问,而虚假流量在合作结束后是不**进行这些收尾工作的。
(7)流量的单页面人均访问次数
如果某个落地页面的人均访问次数很高,比如:4 次以上的话,就很可疑了,因为在一次访问中用户一般是不**多次浏览同一 个落地页的。结合该页面在网站整体的人均访问次数进行对比,结果**更加准确。
很多作弊流量可以模仿人类行为,成功绕过跳出率、平均访问深度和停留时长这些宏观指标,但是要模仿一个业务转化就 比较难了,如果宏观指标表现很好,业务转化很少的话,就需要提高警觉。
下篇将从用户行为数据讲述如何多维度诊断虚假流量。
作者:张乔,神策数据内容营销负责人。公众号:神策数据
本文由 @张乔 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议