1.8 独立性

若事件的发生是无关的,则称它们独立(independent),或者说,给定某个事件的信息并不影响另一个事件发生的条件概率.以抛两次硬币为例,如果两次的机制不相关,通常认为某次投掷不会影响另一次结果的发生.同样,掷两次骰子,如果两次的机制不相关,通常没有理由认为某次投掷会受到另一次结果的影响.第三个例子考虑伦敦的犯罪率和上海的茶叶价格.没有理由认为两个事件中的一个会影响另一个.在上述每个例子中,称事件是独立的.

上述讨论表明两个无关(独立)的事件AB满足性质P[A|B]=P[A]和P[B|A]=P[B],即一枚硬币正面朝上(H)的概率不受另一枚硬币抛掷结果(正面H或反面T)的影响.从条件概率定义可知,P[AB]=P[A]P[B].其正式定义如下:

定义1.4 若P[AB]=P[A]P[B],则称事件AB统计独立(statisticallyindependent).

更简洁地称为独立(independent).根据定义推导出一个直接的结果,得到以下等价关系.

定理1.4 若事件AB是独立的,且P[A]0,P[B]0,则

P[A|B]=P[A]

P[B|A]=P[B]

考虑1.6节股票指数的例子.我们发现P[Ut|Ut-1]=0.57和P[Ut|Dt-1]=0.57,这表示某周股票价格上涨的概率不受上一周的影响,即满足独立性的定义.因此,事件UtUt-1是独立的.

如果事件是独立的,那么联合概率可通过单个概率相乘来计算.以独立地抛两枚硬币试验为例.第一枚硬币可能的结果为{H1, T1},第二枚硬币可能的结果为{H2, T2}.令p=P[H1]且q=P[H2],得到联合概率表1-3.

表1-3 联合概率:独立事件

其中pq分别表示两枚硬币朝上的概率,它们决定了表中的四个联合概率.每一列的概率相加是p和1-p,每一行的概率相加是q和1-q.

若两个事件是不独立的,则称为相依的(dependent).在这种情况下,联合事件AB发生的概率与事件独立时的预期不同.

以工资和受教育程度为例.我们已经分析过某人具有大学学位会影响其获得高工资的条件概率,这表明两个事件是相依的.现在考虑在(错误的)独立假设下,由单个概率相乘计算联合概率会发生什么.结果展示在表1-4中.

表1-4 联合概率:工资和受教育程度

中心实线框内的概率是通过单个概率相乘得到(例如P[HC]=0.31×0.36=0.11).可以看出,与正确的联合概率相比,对角线事件的概率远小于正确的,非对角线事件的概率远大于正确的.在此例中,联合事件HCLN发生的频率远大于工资和受教育程度独立时预期的结果.

可利用独立性来计算概率.以抛两枚硬币试验为例.如果连续抛两枚公平硬币是独立的,那么两次均正面朝上的概率是

这回答了1.5节中提出的问题.事件H H的概率是1/4而不是1/3.关键在于独立性假设,而不是结果是如何排列的.

再以掷一对公平骰子的试验为例.如果掷两个骰子是独立的,则出现两个“1”的概率是P[1]×P[1]=1/36.

有人可能天真地认为独立性可推出事件互不相交,但是事实是反过来才是正确的.如果事件AB是互不相交的,则它们不可能独立,即对不相交事件AB=∅,根据定理1.2的性质2,

P[AB]=P[∅]=0≠P[A]P[B]

根据独立性的定义,等式右边不为0.

独立性是许多概率计算问题的核心.如果能把一个事件分成几个独立事件,则该事件的概率等于单个事件概率的乘积.

以抛两枚硬币的试验为例,考虑事件{HH, HT}.该事件等价于{第一个硬币正面H朝上,第二个硬币正面H或反面T朝上}.如果抛两枚硬币相互独立,则其概率为

再举一个更复杂的例子,掷一对骰子,两面相加等于7的概率是多少?可进行如下计算.用(x, y)表示掷两次(考虑顺序的)骰子的结果.下面的结果其和为7:{(1, 6),(2, 5),(3, 4),(4, 3),(5, 2),(6, 1)}.其结果是不相交的.利用概率公理的第三条,其和为7的概率为

P[7]=P[1, 6]+P[2, 5]+P[3, 4]+P[4, 3]+P[5, 2]+P[6, 1]

假设两个骰子相互独立,则联合概率可通过单个概率相乘计算.对于公平骰子,上式等于

现假设骰子是不公平的,但仍是独立的.每个骰子都是有偏的,其中“1”面朝上的概率为2/6,“6”面朝上的概率是0.此时修正概率的计算,