平均数的意义(这3种情况根本不适合取平均值！然而95%的人甚至官方有时都错了！)

1年前发布

000

这3种情况基本不合适取均匀值！但是95%的人乃至官方偶尔都错了！

互联网崇高传着这么一则笑话：

张家有钱一万万，

九个邻人穷光蛋。

均匀起来算一算，

个个都是张百万。

前段时间有条讯息：如今互联网行业人均月薪 2W、90子孙均存款 50 W。看到讯息，不少人都大呼“被均匀了”“给各位拖后腿了”。

这些例子展现了一个成绩：靠均匀值来了解一个群体的收入水平，约莫是不安妥的。

偶尔分，均匀数未必能反应均匀水平！

那什么时分用均匀值权衡均匀水平才切合呢？假如用均匀值不切合，还能怎样权衡均匀水平呢？本文我们一同来探究一下：

1、什么时分均匀数是故意义的？

均匀数反应数据会合趋向，它的盘算办法通常是把一切的观察值相加后再除以观察值个数。

但是假如我们拿到的数据，是像下图如此有一些极度值。

此时，我想要盘算客户的均匀回款金额，取得的数据后果（下图赤色横线），会发觉大局部公司都没有到达均匀的回款金额：

这是由于均匀值很容易遭到极度值的影响，很多时分都是不克不及准确的反应数据全体真原形况的，尤其是在样本量较小的情况下，均数但是难以代表总体情况。

也就是说，全体均匀值是在数据呈匀称分布大概正态分布的情况下才会故意义，假如忽略整个数据的分布情况，只提均匀值，但是是没故意义的。

2、推断数据的分布

那么拿到数据的第一步是什么呢？天然是推断数据的全体分布外形。

画出直方图可以协助我们快速了解数据的分布，也就是数据样本会合在何处。

比如客户置办金额的数据，我们以横轴为置办金额区间，纵轴为在该区间的公司数，画出直方图如下图所示：

就可以看到这些数据的会合趋向，大部疏分布在151-167之间，并不是匀称分布大概正态分布，那么用均匀值代表客户的置办金额就是不切合的。

那假如碰到这类成绩，怎样才干反应真原形况呢？

3、分组和全体均匀值

我们必要引入分组的看法。

好比我们第一节说的 90 后的均匀存款到了 50W，哪些人能有这么多存款？我们会想到地点都市、年事段、事情背景、收入泉源等等信息。好比一线都市 90 后的存款约莫广泛比二三线都市高，然后再拿本人举行比力。这时就引入了分组的看法。

「分组均匀值」和「全体均匀值」但是是不同的，全体均匀值由于遭到极度值的影响，后果禁绝确。分组均匀值则是在对应的组别范围内盘算数据的均匀情况。

「分组均匀值」和「全体均匀值」后果约莫完全不同。

这就引申出一个很幽默且稀有的看法：辛普森悖论

辛普森悖论的一个出名的例子显如今加州大学伯克利分校登科数据。在此示例中，从总体上看研讨生登科数据时，看来男性比女性更容易被登科（性别藐视），但是当单独查察每个学院的数据时，女性比男性更容易被登科。

缘故就是：

不同学院的承受率十分不同，更多女性哀求“更难”的部分。

假如要制止「辛普森悖论」给我们带来的误区，就必要推敲一局部分组的权重，以一定的系数去消弭以分组材料基数差别所形成的影响。好比使用 ARPU、ARPPU 等。

相反的，假如要更客观分析产物的运营情况，就必要设立更多角度去综合评判。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

生活百科
# 加权平均数的意义 # 怎样理解平均数的意义 # 平均数的意义

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交