2.9 分位数

对连续分布函数Fx),分位数(quantile)函数qα)定义为方程

α=Fqα))

的解.实际上,分位数函数是Fx)的反函数

qα)=F-1α

分位数函数qα)是定义在[0, 1]到X的取值范围的函数.

以百分比表示,100×qα)称为分布的百分位数(percentile).例如,第95百分位数等于0.95分位数.

特别地,中位数(median)是分布的0.5分位数.四分位数(quartile)是分布的0.25, 0.5和0.75分位数.“四分位数”把总体等分为四个部分.五分位数(quintile)是分布的0.2, 0.4, 0.6和0.8分位数.十分位数(decile)是分布的0.1, 0.2,···, 0.9分位数.

分位数是描述分布散布程度的有用指标.

例8 指数分布.Fx)=1-exp(-x), x≥0.为计算分位数qα),令α=1-exp(-x),求解x.则x=-log(1-α).例如,0.9分位数为-log(1-0.9)≈2.3,0.5分位数为-log(1-0.5)≈0.7.

例9 时薪.图2-6展示了时薪的分位数函数.从纵轴的点0.25, 0.50, 0.75,画线到分布函数,再用箭头画线到横轴.它们表示时薪分布的四分位数,分别为12.82美元、18.88美元和28.35美元.其解释是,25%的人的时薪小于或等于12.82美元,50%的人的时薪小于或等于18.88美元,75%的人的时薪小于或等于28.35美元.

图2-6 时薪的分位数函数