2.3 离散随机变量

我们把随机变量X定义为一个实值结果.在大多数情况下,X只在实数轴的某个子集中取值.以抛硬币实验为例,正面朝上记为1,反面朝上记为0,结果只取0和1.这是离散分布的例子.

定义2.2 如果集合X中的元素是有限的或可数的,则称其为离散的(discrete).

在实际应用中很多离散集都是非负整数.例如,在抛硬币实验中,X={0, 1}.在掷骰子实验中,X={1, 2, 3, 4, 5, 6}.

定义2.3 如果存在一个离散集合X满足P[XX]=1,则称X离散随机变量(discrete random variable).满足这一性质的最小集合X称为X支撑(support).

支撑是集合中取正概率的值.当描述支撑时,有时可用X={τ1,τ2,···,τn},X={τ1,τ2,···}或X={τ0,τ1,τ2,···}表示,称τj支撑点(support point).

定义2.4 随机变量X等于x的概率,记为πx)=P[X=x],称为随机变量的概率质量函数(probability mass function).考虑支撑点τj时,πj=πτj).

以抛硬币实验为例,设其正面朝上的概率为p,支撑X={0, 1}={τ0,τ1},概率质量函数的取值为π0=1-pπ1=p.

以掷骰子实验为例.支撑X={1,2,3,4,5,6}={τjj=1,2,···,6},概率质量函数为πj=1/6,j=1,2,···,6.

一个可数随机变量的例子如下:

这是一个合理的概率函数,因为.支撑为X={0,1,2,···},概率质量函数为πj=e-1/(j!),j≥0.(这是3.6节定义的泊松分布的特例.)

通常利用条形图表示概率质量函数.条形图可直观地表示事件发生的相对频率.图2-2a展示了式(2.1)中的概率质量函数.每个条形的高度表示支撑点处的概率πj.虽然分布是可数的,但可以忽略k≥6时的概率,故只绘制了k≤5的概率质量函数.可以看到,k=0和k=1的概率大约为0.37,k=2的概率大约为0.18,k=3的概率大约为0.06,k=4的概率大约为0.015.

再比如真实世界的例子,图2-2b展示了2009年美国工薪阶层的受教育年限[1].可以看出,受12年教育的概率(大约27%)最高,第二高的是受16年教育的概率(大约23%).

图2-2 概率质量函数