清明节,用数据思维案例聊聊平均死亡年龄和期望寿命


时间: 2021-07-30 10:55:47 人气: 6 评论: 0

本文中,笔者将结合清明节聊一聊如何用数据思维分析“平均死亡年龄”和“期望寿命”。

前些天,我所在的一个产品经理群里面,无意中有人聊到了社保,继而聊到了关于中国人平均寿命的问题。问题如下:

中国现在对外公布的平均寿命,如:2018年平均寿命75岁,是一个名叫“期望寿命”的指标。

而中国人2018年的平均死亡年龄实际上只有66岁左右,所以群里有人认为,期望寿命是国家忽悠人一个指标,应该用平均死亡年龄来作为平均寿命的指标。

对此,你有什么看法呢?

中国人到底寿命多长,如果让你去收集数据然后得出结论,你**怎么做?

要知道平均寿命66岁和75岁,差别可是非常巨大的,**导致完全不同的舆论和国家政策。

群里面不少人随声附和,什么毒奶粉地沟油又被提起了,然而一个专业的产品群居然很少有人对上面的说法提出质疑。

看到大家的反应,我担心的倒不是中国人的平均寿命,而是担心产品经理的整体职业素质。

作为职业产品经理,平时都说自己根据数据分析来改进结果,这么多人对于这么明显的数据坑不能识别,那么得有多少决策是错误的?

在很多人看来,产品经理可能是一个门槛很低的职业,然而数据思维真的是很多人的硬伤。

数据思维不就是统计统计平均值,比比大小吗?

还真没有这么简单,有的看似很简单的问题,却藏着巨大的坑。

忽略掉基数,是很多时候数据分析的一个大坑,对认真学过统计的人,识别这个坑并不难,但是多数产品人员并不能,只**做简单点加减乘除求平均。

就像上面那个问题一样,如果想要计算一个国家人口的平均寿命,就把死亡年龄算个平均数不就OK了。

你要是不这么计算,他还说你把简单的事情复杂化。被“简单化思维”洗脑的人群其实也蛮可怕的,**变得有点反智。

这个世界上有的东西本质上就是不能简化的,过度简化就是错误。

一、平均死亡年龄

平均死亡年龄是一个很容易理解的指标,就是把当年所以死亡人口的年龄算平均。但这个具有误导性的统计指标,代表不了人群的平均寿命。

为了说明问题,我们来简化一下问题。假设有两个群体:

  • 第一个群体:由十个10岁的人和五个70岁的人组成;
  • 第二个群体:由五个10岁的人和十个70岁的人组成。

2018年,第一个群体中,10岁的人死亡2个,70岁的人死亡4个;第二个群体中,10岁的人死亡1个,70岁的人死亡8个。如下图所示:

算平均死亡年龄,第一个群体:50岁,第二个群体:63.3岁。

于是,有的人可能就想得出结论:第二个群体的人口比第一个群体人口人均寿命更长。

但是我们仔细看看:

这两个群体,10岁的死亡率都是20%,70岁死亡率都是80% 。刨除掉不同年龄阶段人口基数的误导,这两个群体的两个年龄阶段的死亡率是完全相同的,也就是说,这两个群体的人寿命应该是相同的。

然而,平均死亡年龄这个指标却相差很大,平均死亡年龄将不同基数混淆在里面了,没有任何的意义。

一个年轻人非常多的国家,只要年轻人意外死亡很小一部分比例,就能把平均死亡年龄拉的很低,造成大家寿命短的假象。而一个年轻人很少的老龄化的国家,平均死亡年龄就**被拉得很高。

中国当前就是中年、青年人口更多,所有平均死亡年龄**比较低。如果你用平均死亡年龄当寿命指标,就**被误导。

想要真正反映一个国家当前人口的健康及寿命的状况,需要刨除掉不同年龄人口基数的影响,要用到一个叫做期望寿命的指标。

期望寿命虽然叫“期望”,但并不是指的“期待”的意思,这个期望是“数学期望”,反应的是当下人真实寿命的,是刨除掉了基数影响的平均寿命。

二、期望寿命

为了刨除掉基数的影响,期望寿命的计算使用死亡率而不是死亡人数。

假设一个群体中年龄最大的是n岁,年龄最小的1岁。

假如在2018年,1岁人群的死亡率是A1(死亡率是一个百分数),2岁人群的死亡率是A2 , 3岁人群死亡率A3,以此类推,n岁人群死亡率 An。

那么人均预期寿命为:

1*A1 + 2*(1-A1)*A2 + 3*(1-A1)*(1-A2)*A3 + 4*(1-A1)*(1-A2)*(1-A3)*A4+….(直到n岁)

这个计算方法,是根据当年各个年龄阶段的死亡率来计算平均寿命的,直观感觉有点类似于有一个虚拟的人在同一年从出生到死去,平均**在多少岁死亡。

还有一种错误的理解,在一些网页新闻中能够见到。他们认为:2018年的期望寿命是2018出生的人预计能活到多少岁,这也是完全错误的。

期望寿命是当前人口刨除掉基数影响后寿命的数学期望值,不是对新生人口未来的预计。

三、总结

在做产品数据分析的时候,也有不少这样的问题。比如:有的人就直接把不同渠道的转化用户直接相加,或者把不同地区的转化用户相加等。

要知道这些数据的基数都是不一样的,很有可能**得出误导性的结论。

有的人说数据是不**骗人的,其实,数据是最**骗人的,数据思维不过关的更容易被数据欺骗。

数据思维也不是想某些文章讲的那样,有意识地去看看数据就是有数据思维了,那顶多称得上数据意识。

后续有机**还**继续分享数据思维相关的问题。

 

本文由 @ArvinNing 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

给作者打赏,鼓励TA抓紧创作!
1人打赏
---蛙鱼源码WAYUYM.COM---专业提供网站模板,网站源码下载,教程培训,程序插件,网站素材等建站资源,主要收集各类精品源码资源,包含CMS程序模板、网站源码、游戏源码、APP源码等 ,所有资源都没有水印适合搬运,我们致力于打造一个优秀的建站资源共享学习平台!

专业厂家,设备先进,技术力量雄厚,自动化生产技术先进,产品质量符合国家标准,价格合理,https://www.69shenlan.com/,具有质量保证,生产及时,交货快捷的特点。 我们的宗旨:做我们擅长的事,希望用我们的创意和创意为客户实现战略定位,塑造品牌,强化形象!
我们的要求:坚持“优质产品、优质服务、优惠价格、快速交货”的经营方针,努力开拓市场,真诚为客户服务! 我们的发展:以独特的专业和专业精神,https://www.69shenlan.com/1:1--

2年

评论