时间: 2021-07-30 10:48:34 人气: 7 评论: 0
编辑导语:用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务;本文作者分享了关于用户画像的相关分析,我们一起来了解一下。
用户画像能不能提升付费率?肯定能,问题是:怎么干?
前几天就有同学A,在面试的时候遇到这个问题。同学A举手:这题我**!构建RFM模型,把用户分成27类,然后重要价值客户(111)给予**资格,重要保持客户(011)要主动保持联系……熟练地背诵出27类的做法。
结果,被面试官直接挂掉!
首先,每种分析方法,是有特定业务场景限制的。从本质上看,网上盛传的RFM做法,只适合高频互动的零售电商业务的场景,比如耐用品、母婴、医疗、保健、游戏、影视娱乐等,都不适合RFM。而这位同学正撞枪口上了:他面的是小说阅读APP。
小说业务,其付费的动力是高度内容驱动的。想让用户掏钱,至少得有内容让用户看得爽。想让用户看得爽,得知道用户喜欢什么样的内容题材。这是用户画像要解决的一个问题。
同样是内容,小说又不同于短视频或者直播。用户的爽快感,不是直接被屏幕上扭来扭去的小姐姐或者喋声喋气的“乌鸡哥”激发的,而是在持续阅读过程中,在沉浸式的体验中获得的。
这样就形成了一个逐步沉浸的转化过程:寻找内容→点击阅读→持续阅读→付费页面→付费→持续付费;因此,定位用户当前所处的阶段,引导用户向下一阶段发展,是用户画像要解决的第二问题。
此时,可以进一步去想:从小说阅读APP里,能获取何种用户标签,构建用户画像了。
一提到用户画像,很多同学又**说贯口一样说出:性别、年龄、职业、收入、爱好……只要做一个信息收集表,就能搞掂啦!
实际上确实有场景可以用表单收集。比如:
但是,这些表单是建立在业务本身的刚需之上。没有这些信息,服务根本开展不了。所以这种表单信息能受到用户的理解和配合,采集难度也相对较低,复核起来也容易。
在小说这个场景里,就不适合用表单收集。
因为对小说的“爱好”根本没啥刚需可言:
更不要提其他涉及个人隐私信息,难道看小说还需要被查户口?不受用户理解,即使强行采集,数据也是假的。
因此设计表单的时候,要保持克制,尽量找关键字段。对阅读而言,男女差异很大,且容易受到用户理解,因此可以在表单采集。并且男女,是个符合MECE的简单选项,不容易引起歧义。
换个角度,如果收集的是:阅读兴趣。
选项是:玄幻、历史、穿越、言情、霸道总裁、其他
用户很容易引起歧义,比如玄幻+穿越的,算哪类?比如大女主算哪类?用户在有歧义的时候,就**乱填一通,收集回来的数据就有问题;这些细节看似琐碎,实则决定了基础属性标签的准确度。
要定位用户当前所处的阶段,需要找能区分用户类型的最关键标签。
既然目标是提升付费率,因此付费相关标签,就是第一重要的;根据用户付费记录,可以区分三个状态:从未付费/付费一本小说/付费2本及以上。
引导方向也很清晰(如下图):
注意,上边分类里,有一个策略是导向:保持本篇续订。这就意味着,需要观察用户在阅读小说时候的进度。
如果付费的小说已经完结了/断更了,就得即使推荐新内容;如果用户根本连看都看不下去,或者已经愤然弃坑,那也得另寻好内容推荐,因此得再考虑用户阅读行为标签。
用户阅读行为对付费意义很重大。**上,只有入坑的用户才**付费,还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里,已经脱坑的要防止流失;因此,区分出未入坑、入坑、脱坑状态,很重要。
“入坑”是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便,要有具体的指标+计算公式+业务含义,才能算一个标签。
用户如果入坑了,最起码的要求是在小说APP的登录时长、登录频次有一定保证,因此可以现用比如最近一周内登录次数/登录总时长,来区分用户平台活跃的轻、中、重(如下图):
再次,如果用户入坑了一个内容,那么他肯定不**东瞄西逛,而**聚焦在一个内容里。那么这个内容占他在平台活跃时间的比例,一定相当长。
这样可以将用户是否聚焦一个内容的标签区分出来:
具体多长算长,也得用分层分析法哦
第三,入坑、脱坑是一个动态过程。之前没有聚焦内容,之后有了,叫入坑;之前有聚焦的,之后没有,叫脱坑;因此构造标签的时候,不能只考虑当前状态,而是得关联上一个周期的状态,比如关联上一个周期,发现用户聚焦下降了,那么可以归纳为入坑。
如果聚焦上升,可以归纳为脱坑(如下图):
有了行为标签,再结合付费,就更能精准区分问题了。当然,在制定策略的时候,也要考虑用户规模,优先满足大群体的需求(如下图)。
当然,实际工作中,数据情况可能没有这么复杂。
这些都有可能发生,而且**让数据分析变简单。但是在构造标签逻辑的时候,也要符合MECE方法,才能避免意外发生;这是专业数据分析人员与业务人员思考问题的本质区别——业务人员能直接抓最显眼的,数据则关注情况全面性与严谨性。
上文有提到,直接收集兴趣**有各种问题。那还能怎么办呢?当然可以从用户行为中提炼兴趣。如果一个用户入坑了某个内容,那他肯定是对这个内容感兴趣的。
这里的难点,在于区分:他到底对哪个点感兴趣。因为一个内容相关的静态标签太多了:作者、主题、风格、评论、是否热门、写法……还有很多无法标准化的部分。
因此从一开始,就不能太指望兴趣标签做得特别精准,而是要结合小说的品类特点,把同款、交叉款单品选出来,找到贴近的单品即可。毕竟小说不是短视频,不需要15秒一切换。
当兴趣偏好与付费行为交叉,还**产生一种可能:有一类用户就是坚持白嫖,有很多关联阅读行为,但是就是不付钱;此时可用优惠**测试,把其中价格敏感型与真正白嫖到底的区分开,从而形成价格偏好标签。
有了以上基础的标签准备,最终输出策略时就可以像搭积木一般,针对用户需求,组合出各种策略,只要基础打得牢,出结果是手到擒来的事(如下图)。
很多同学习惯了做网上的现成数据集。所谓的用户画像,大部分是现成的字段,尤其以直接收集的表单字段居多。
这种现成的数据集练手很爽,可与实际情况差距非常大;实际工作中,即使能用表单采集,也得考虑采集过程中错误、造假、复核问题。
更不用说,相当多数据标签需要通过分析计算+测试获得,需要一层层的构造,由简单到复杂;这些处理过程中技巧与手段,才是真正值钱的技能与能力,与大家共勉。
接地气的陈老师,微信公众号:接地气学堂,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议。