分位数与箱线图

1.概念

    统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
    比如,中位数就是第50百分位数,第25百分位数又称第一个四分位数(First Quartile),较小四分位数,用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),较大四分位数,用Q3表示。若求得第p百分位数为小数,可完整为整数。第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值

2.计算过程

    数字按从小到大排序,主要选择四分位的百分比值p,及样本总量n有以下数学公式可以表示:
L_{p}=n*\frac{p}{100}

  • 如果L是一个整数,则取第L 和 第L+1的平均值
  • 如果L不是一个整数,则取下一个最近的整数。(比如L = 1.2,则取2)

3.例子

    高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。
    假如:有10个数:1、2、3、4、5、6、7、8、9、10 按由小到大将其排列。求它的第90%百分位,也就是第9个数刚好是9 ,那么90%分位数就是9 。例子来自我是攻城狮

4.箱线图

箱线图就是四分位数的可视化表现


boxplot.jpg

所以通过这个图可以看到一组数据的分布状态。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容