如何校验用户画像的准确性？

时间: 2021-07-30 09:18:13 人气: 38 评论: 0

用户画像是数据运营的基础，也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础，确保画像质量，后续的深挖行为才有突破的可能。

在用户研究的课题中，用户画像是几乎每个公司都**去做的，浅层的包括统计类的：上月购买量，上周活跃天数等；深层的包括洞察类的：潜在需求偏好，生命周期阶段等；前者的校验简单，后者的校验需要通过一些特别的方式。本文就洞察类画像校验做一系列的梳理。

省略掉预处理设计的过程，画像校验的步骤主要集中在画像开发，画像上线，画像更新中，并且三个阶段中，每个阶段的校验方式不尽不同

一. 用户画像开发中

当我们所开发的用户画像是类似于用户的下单需求、用户的购车意愿、用户是否有注册意愿这一类存在历史的正负样本的有监督的问题，我们可以利用历史确定的数据来校验我们的画像准确性。比如，银行在设计用户征信的画像前，**有一批外部购买的坏样本和好样本，其实画像问题就转化为分类问题去解决评估了。

1. Recall、Pecision、K-S、F1曲线、Roc曲线、Confusion Matrix、AUC

针对这类问题，已经有较为成熟的**基础，直接利用测试样本判断的准确程度判断画像是否准确

这张图是一张非常常见也是有效的来总结Recall、Pecision、Lift曲线、Roc曲线、Confusion Matrix的图。

FPR = FP/(FP + TN)

Recall=TPR=TP/(TP+FN)

Precision=TP/(TP+FP)

F1曲线:2*Precision*Recall/(Precision+Recall)

Roc曲线：TPR vs FPR，也就是Precision vs Recall

Auc：area under the roc curve ，也就是roc曲线下面的面积，积分或者投点法均可求解。

2. 交叉验证

并不是所有画像都是有监督训练的画像，举个例子，用户的性别画像，是一个无监督的刻画，当你无法通过app端资料填写直接获取到的时候，你只能够通过其他数据特征的对用户进行分群。

首先，我们在总的数据集中筛选出所有关键影响特征，每次将筛选出的特征分为两块，测试特征训练特征，利用训练特征建立模型，再利用测试特征去判断模型是否合理（比如女鞋用户群的女鞋购买次数小于男性用户群，则次模型异常，删除），最后集成所有合理模型。

这样的逻辑中，我们将所有异常不合理的模型全部剔除，训练过程中就校验了用户画像的准确性。

二. 用户画像上线后

1. ABTest

不得不说，abtest是用户画像校验最为直观有效的校验方式。

用户分流模块：

一句话解释，就是A1=A2保证分配随机，A3好于A1+A2的效果检验画像是否准确？多准确？

三. 用户画像更新

用户回访

在画像刻画完成后，必然**存在画像优化迭代的过程，客服回访是非常常见且有效的方式。

比如，我们定义了一波潜在流失用户10万人，随机抽取1000人，进行回访，根据回访结果做文本挖掘，提取关键词，看消极词用户的占比；

（来源网络）

机制检测

再比如，我们定义了一波忠诚用户10万人，随机抽取100人，后台随机获取用户安装app的列表，看用户同类app的下载量数目的分布；

横轴为用户手机中同类竞品安装量的个数，纵轴为对应的随机抽样的100人中的个数。

人群1分布为忠诚用户画像最准确的，同类app下载量集中在1附近，定义的用户极为准确
人群2分布杂乱
人群3分布在下降量异常高的数值附近，定义人群不准确

用户画像是数据运营的基础，也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础，确保画像质量，后续的深挖行为才有突破的可能。

最后，谢谢大家阅读。

作者：沙韬伟，苏宁易购高级算法工程师，4年数据挖掘数据分析经验，前惠普中国算法研究员、滴滴租车用户征信负责人、分布式R开发研究员贡献者，Data学院特邀讲师，当前为苏宁易购全产业算法研究负责人。

本文由 @沙韬伟原创发布于人人都是产品经理。未经许可，禁止转载。

给作者打赏，鼓励TA抓紧创作！

5人打赏

---蛙鱼源码WAYUYM.COM---专业提供网站模板,网站源码下载,教程培训,程序插件,网站素材等建站资源，主要收集各类精品源码资源，包含CMS程序模板、网站源码、游戏源码、APP源码等，所有资源都没有水印适合搬运，我们致力于打造一个优秀的建站资源共享学习平台!

专业厂家，设备先进，技术力量雄厚，自动化生产技术先进，产品质量符合国家标准，价格合理，https://www.69shenlan.com/，具有质量保证，生产及时，交货快捷的特点。我们的宗旨：做我们擅长的事，希望用我们的创意和创意为客户实现战略定位，塑造品牌，强化形象！
我们的要求：坚持“优质产品、优质服务、优惠价格、快速交货”的经营方针，努力开拓市场，真诚为客户服务！我们的发展：以独特的专业和专业精神，https://www.69shenlan.com/1：1--

数据运营

分享链接