时间: 2021-07-30 09:16:56 人气: 13 评论: 0
因数据分析统计分析有其局限性,基于此的**画像也不可能做到真正意义上的全面完整。因此,我们只能做到尽可能的全面无死角的**画像。
最近有不少朋友留言,让对**画像做个全面的点的讲解下。就此,我对《三生三世话CRM》系列课程的第四课“**分析”中的**画像内容进行个展开讲解。
首先,基于我自己对**画像的认知对其做个定义。**画像可以认为是基于**分析的聚类分组后的定性描述的标签化呈现,是对**多维度属性展开的更加立体全面的描述归纳。
**画像本质也是**分析的一种分析呈现方法。**分析的目的就是为了清楚的描述展现**的特征属性,更好地理解把握**是我们做分析的终极目标。“标签”可以认为是自然语言的一部分,是一个简单精炼的归纳表现形式。在实际业务中,大家都在广泛的应用这一类基于标签的画像方法,即**画像。基于**画像的标签方法归纳起来,就是给用户贴一系列的标签,而“标签”是能表示用户某一特征属性的标识。
**画像是建立在一系列属性数据之上的目标用户模型。**画像的基础信息应该是对**描述的全量信息,通常可以分为机器很容易解析的结构化信息和机器很难理解需要结合知识库才能够理解的非结构化信息,这些信息最后以饱含深意的标签的形式表现出来。
**画像逻辑
先来说说结构化信息,可以理解成在数据库中结构化存放的信息,归结起来包括**的基础信息,行为信息,已经分析总结后的特征信息。**的这些信息要基于时间和空间维度来谈才有意义,脱离了时间,空间的数据是无意义的。
比如“有钱人”这个标签,100年前的有钱人和现在的有钱人绝不是一个概念,至少有钱程度差异很大了;即使同一时间的当下的1万/月的高薪,在一线城市和三四线城市,在不同的国家,肯定都意味不同的。因此用户画像应该是多维度的立体的描述体系。
非结构化信息,就是一些零碎的,人类自然语言描述等,目前机器还不能有效的准确的理解人类的自然语言,因为我们的自然语言很多时候是有歧义的,需要通过上下文才能理解的,而机器需要结合庞大知识库的转译才能够理解的非结化信息。
比如一些人类生活总结出来的概念、行为、习惯等知识的结合就能解读出额外的信息。比**信息中缺失的性别,**信息中没有性别,但我们可以结合一些业务描述语境来判断,通常姓名中带有女字旁,与花名相关的**,我们可以认为其为女性。又比如用户访问过的网站,经常访问一些美妆或女性服饰类网站,是女性的可能性就高;访问体育军事类网站,是男性的可能性就高。还有用户上网的时间段,经常深夜上网的用户男性的可能性就高。把这些特征加入到知识分类器进行训练,也能提高一定的数据覆盖率。当然这些知识也要限定在一定的时间空间下,不同的时间空间的知识解读出来的信息完全是不一样的。
要想让机器能够理解这些知识:
**画像归根结底就是对**属性分析结果的描述呈现,终究只是概括性的归纳描述。因此,我们不可能通过**画像对**做到全方位全面的描述,这里的全面只能是相对的。细细纠结下,**画像本身也是有其自身缺陷的。
首先,**画像从某种程度讲上还是不完整的。
导致这个问题可能有两个原因,第一个原因就是任何画像的来源数据都是有一定偏差的,一般描述的都是用户画像的某一方面,很难有一个非常完整的画像。还有一个非常重要的原因就是隐私,大家都是有选择性的提供个人信息,**回避不愿谈及自己的,但是很多时候可能了解用户不愿谈及的这个方面的内容对于我们做产品,做服务又是非常重要的。基于这两个原因,我们对用户的理解就是一个碎**式的,很难召回完整的目标客户。
其次,**画像还有一个问题就是不正确性。
也就是说,我们对用户画像的理解很多时候是错误的,这导致**出现错误的服务应用。导致不正确性的原因有很多,人类社**是在向前发展,知识也在不断的演变。因此,供机器学习的知识库永远也不**有完整全面的时候,总有机器还无法理解知识,就**做出不够精准正确的描述。
综上, 我们理解的**画像,通常只是基于存量的历史数据,通过数据分析模型,对**数据从属性特征在时间、空间内尽可能地描述归纳。因数据分析统计分析有其局限性,基于此的**画像也不可能做到真正意义上的全面完整。因此,我们只能做到尽可能的全面无死角的**画像。
PS:本人最近因公司(万达网科)出现众所周知的原因,刚刚失业,求合适的坑
Reuter,知乎专栏:电商CRM规划,人人都是产品经理专栏作家,自诩数据分析思维做产品的PM。善以数据分析思维做解析产品业务需求,完成产品实现。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议