统计/数据可视化/箱线图
外观
箱线图(也称为盒须图)是单变量样本的关键特征的简单可视化表示。
箱体位于样本范围内的垂直轴上。通常,箱体的顶部放置在第 1 四分位数,底部放置在第 3 四分位数。箱体的宽度是任意的,因为没有 x 轴(尽管请参见下面的小提琴图)。
在箱体的顶部和底部之间,是某种对集中趋势的表示。一种常见的版本是在中位数处放置一条水平线,将箱体分成两部分。此外,在箱体的水平方向上,中心位置放置一个星号或星号来表示均值。
另一个常见的扩展是“箱须图”。这在图的顶部和底部添加了垂直线,扩展到例如最大值和最小值。例如,均值上下 2 个标准差内的最远值。或者,须线可以扩展到第 2.5 和第 97.5 百分位数。最后,在箱须图中,通常用星号显示在须线末端之外的单个值,表示离群值(无论定义如何)。
小提琴图是箱线图的扩展,它利用水平信息来呈现更多数据。它们显示了对CDF的某种估计,而不是一个箱子,尽管分布的分位数仍然显示出来。