箱形图
最后更新于
这有帮助吗?
箱形图(Box-plot)又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。
当拿到一组需要分析的数据,首先对数据进行由小到大排序。
适用于观察一组或多组数据的分布情况,以一种简单的方式,概括出一个或多个数值变量的分布,同时又不会占据太多空间。
箱形图不能提供关于数据分布偏态和尾重程度的精确度量;
对于批量较大的数据集,箱形图展现的形状信息更加模糊;
用中位数代表总体平均水平有一定的局限性等。
所以,使用箱形图最好结合其他描述统计工具。如:均值、标准差、偏差、分布函数等来描述数据集的分布情况。
美国著名统计学家约翰·图基(John Tukey)在1970年就将箱形图作为其探索性数据分析工具包的一部分,但直到1977年才正式推出。
上图展示了1200年至2000年八个世纪中最重要的90位画家平生,并着重标注了其中40位画家他们的杰作,分析了作品的主要用色、尺寸和绘画技艺。从而更好地帮助分析了绘画在过去八百年中的变化。
在这个显示奥林匹克运动年龄分布的准系统图表中,非常年轻或年老的参赛者都有明显的异常值。但重点是体育运动之间的普遍差异。
以下为具有代表性的设计案例,更多案例持续添加中。