확률론 : 1.3. 조건부확률과 독립 사건

2023-08-10 5 분 소요

1. 확률론 기초

확률론에 대한 기초적인 개념들에 대해 설명해봅니다. 흔히 고등학교 교과과정에서 하는 식으로, 경우의 수와 이항정리에 대해 먼저 다룹니다. 그 다음으로는 확률에 대하여 직관적인 방식과 엄밀한 방식으로 각각 설명해봅니다. 이후에는 조건부확률과 독립사건의 개념을 배운 후 Sterling’s lemma에 대해 간략히 살펴봅니다.

1.3. 조건부확률과 독립 사건

(1) 조건부확률

주사위를 던지는 시행에서 표본공간은

\[S=\{1,2,3,4,5,6\}\]

이었습니다. 또한, $A$를 짝수가 나올 사건이라고 하면,

\[A=\{2,4,6\}\]

이라고 쓸 수 있고 $P(A)$를

\[P(A)=\frac{n(A)}{n(S)}=\frac36=\frac12\]

로 계산할 수 있다고 했었습니다. 한편, $B$를 3의 배수가 나올 사건이라고 하면

\[B=\{3,6\}\]

이고

\[P(B)=\frac{n(B)}{n(S)}=\frac26=\frac13\]

입니다.

이번 파트에서 생각하는 것은 “주사위를 한 번 던져서 짝수($A$)가 나왔다고 가정할 때, 그 눈이 3의 배수($B$)일 확률”입니다. 짝수가 나오는 경우가 2, 4, 6의 세 경우이고, 이 중 3의 배수가 6밖에 없으므로 그 확률은 $\frac13$으로 계산할 수 있을 것입니다. 즉,

\[P(B\mid A)=\frac{n(A\cap B)}{n(A)}=\frac{n(\{6\})}{n(\{2,4,6\})}=\frac13\]

입니다. 이런 것을 조건부확률(conditional probability)이라고 하는데, 정확한 정의는 다음과 같습니다.

조건부확률
사건 $A$가 일어났다는 것을 가정했을 때 사건 $B$가 일어날 확률을 조건부확률이라고 부르고, $P(B\mid A)$로 적습니다. $P(B\mid A)$의 값은 $$P(B\mid A)=\frac{P(A\cap B)}{P(A)}$$ 으로 정의됩니다.

아까의 계산에서 사용한 정의

\[P(B\mid A)=\frac{n(A\cap B)}{n(A)}\]

와 위의 정의는 일치합니다.

\[\frac{n(A\cap B)}{n(A)}=\frac{\frac{n(A\cap B)}{n(S)}}{\frac{n(A)}{n(S)}} = \frac{P(A\cap B)}{P(A)}\]

이기 때문입니다.

$P(B\mid A)$를 계산했으니 반대로 $P(A\mid B)$도 계산해볼 수 있습니다. 이것은 “3의 배수($B$)가 나왔다고 가정할 때 그 눈이 짝수($A$)일 확률”입니다. 조건부확률의 정의에 의해

\[P(A\mid B)=\frac{P(A\cap B)}{P(B)}=\frac{\frac16}{\frac26}=\frac12\]

입니다. 아니면

\[P(A\mid B)=\frac{n(A\cap B)}{n(B)}=\frac12\]

와 같이 계산하여도 될 것입니다.

(2) 독립 사건

두 사건이 서로 영향을 미치지 않으면 두 사건을 독립(independent)이라고 합니다. 즉, 사건 $A$가 발생하는 것이 사건 $B$가 발생할 확률에 영향을 미치지 않는다면 (반대로, $B$가 $A$에 영향을 미치지 않는다면) 두 사건이 독립적이라고 말할 수 있을 것입니다. 다시 말하면, 사건 $B$가 발생할 확률과, 사건 $A$가 발생했을 때 사건 $B$가 발생할 확률과, 사건 $A$가 발생하지 않았을 때 사건 $B$가 발생할 확률이 모두 같으면 두 사건이 독립적이라고 말할 수 있습니다. 수식으로 쓰면

\[P(B)=P(B\mid A)=P(B\mid A^c)\]

가 될 것입니다. 이것을 반대로 쓰면

\[P(A)=P(A\mid B)=P(A\mid B^c)\]

입니다. 다시 말해, 총 4개의 식

\[\begin{align} P(B)&=P(B\mid A)\tag a\\ P(B)&=P(B\mid A^c)\tag b\\ P(A)&=P(A\mid B)\tag c\\ P(A)&=P(A\mid B^c)\tag d \end{align}\]

이 성립하면 두 사건 $A$, $B$가 독립이라고 말할 수 있을 것입니다. 재미있는 것은 이 네 개의 식이 모두

\[P(A)P(B)=P(A\cap B)\tag e\]

와 필요충분조건의 관계에 있다는 것입니다. 분모가 0이 되는 상황을 피하기 위해 $P(A)\ne0$, $P(B)\ne0$을 가정하고 각각을 증명해보겠습니다. 먼저 $\text{(e)}$의 양변을 $P(A)$로 나누면

\[P(B)=\frac{P(A\cap B)}{P(A)}=P(B\mid A)\]

가 되어 $\text{(a)}$가 성립합니다. 반대로 $\text{(a)}$식의 양변에 $P(A)$를 곱하면 (e)가 됩니다. 따라서 $\text{(a)}\iff\text{(e)}$ 입니다. 마찬가지의 논리를 적용하면 $\text{(c)}\iff\text{(e)}$ 입니다. $\text{(b)}$에 관해서는

\[\begin{align*} \text{(b)} &\iff P(B)=P(B\mid A^c)\\[5pt] &\iff P(B)=\frac{P(B\cap A^c)}{P(A^c)}\\[5pt] &\iff P(B)P(A^c)=P(B\cap A^c)\\[5pt] &\iff P(B)(1-P(A))=P(B-A)\\[5pt] &\iff P(B)-P(A)P(B)=P(B)-P(A\cap B)\\[5pt] &\iff P(A)P(B)=P(A\cap B)\\[5pt] &\iff \text{(e)} \end{align*}\]

이므로 $\text{(b)}\iff\text{(e)}$입니다. 또한, 마찬가지의 이유로 $\text{(d)}\iff\text{(e)}$ 입니다. $\square$

그러므로, 다음과 같이 독립의 개념을 정의할 수 있습니다.

독립과 종속
$P(A)\ne0$, $P(B)\ne0$인 두 사건 $A$, $B$에 대하여 $$P(A\cap B)=P(A)P(B)$$ 이면 두 사건이 서로 독립이라고 말합니다. 한편, 두 사건이 서로 독립이 아니면, 두 사건이 서로 종속이라고 말합니다.

(3) 독립 사건 (예시)

예를 들어, (1)에서 $A$와 $B$는 독립입니다.

\[\begin{align*} A&=\{2,4,6\}\\ B&=\{3,6\} \end{align*}\]

에서

\[P(A\cap B)=\frac16=\frac12\times\frac13=P(A)P(B)\]

이기 때문입니다.

한편, $C$를 소수가 나올 사건이라고 하면

\[C=\{2,3,5\}\]

이고,

\[P(A\cap C)=\frac16\ne\frac12\times\frac12=P(A)P(C)\]

이므로 $A$와 $C$는 서로 종속이라는 것을 알 수 있습니다.

(4) 독립 사건의 해석

$A$와 $B$가 독립인 것은

\[\begin{align*} P(A)&=\frac36\\ P(A\mid B)&=\frac12\\ P(A\mid B^c)&=\frac24 \end{align*}\]

가 되어

\[P(A)=P(A\mid B)=P(A\mid B^c)\]

인 것을 통해서도 알 수 있습니다.

이와 같은 계산은 아래와 같이 표로 표현하면 쉽게 볼 수 있습니다. 가로축을 $A$에 속하는지 속하지 않는지, 세로축을 $B$에 속하는지 속하지 않는지로 나누어 4등분하고 각각에 원소의 갯수를 채워넣은 것입니다.

아래와 같이 빨간색 네모와 초록색 네모 부분을 살피면 $P(A\mid B)=\frac12$ 이고

$P(A\mid B^c)=\frac24$ 이며

$P(A)=\frac36$ 인 것을 확인할 수 있습니다.

다시 말해, 왼쪽열($A$)과 오른쪽열($A^c$)에 있는 숫자들의 갯수의 비율이 윗행($B$)과 아랫행($B^c$)과 관계없이 일정하면 독립인 것입니다.

마찬가지로, $P(B\mid A)=\frac13$ 이고

$P(B\mid A^c)=\frac13$ 이며

$P(B)=\frac26$ 이므로

\[P(B)=P(B\mid A)=P(B\mid A^c)\]

인 것도 확인할 수 있습니다. 즉, 윗행($B$)과 아랫행($B^c$)에 있는 숫자들의 갯수의 비율이 왼쪽열($A$)과 오른쪽열($A^C$)에 상관없이 일정하므로 독립입니다.

한편, $A$와 $C$에 대해서도 표를 그려보면 다음과 같은데, 행과 열의 비율이 일정하지 않습니다. 왼쪽열($A$)과 오른쪽열($A^c$)에 있는 숫자들의 갯수의 비율이 윗행은 1:2이고 아랫행은 2:1입니다. 따라서 $A$와 $C$는 서로 종속이라고 생각해볼 수 있습니다.

실제로, $P(A\mid C)=\frac13$ 이고

$P(A\mid C^c)=\frac23$ 이며

$P(A)=\frac36$ 이므로

$A$와 $C$는 서로 독립이 아님을 확인할 수 있습니다.

(5) 독립과 배반

두 사건 $A$, $B$가 서로 독립인 것과 배반인 것은 완전히 별개의 문제입니다. 서로 독립이라고 배반이라고 할 수 없고, 서로 배반이라고 독립이라고 할 수도 없습니다.

예를 들어, 주사위를 하나 던지는 시행에서 $A=\{2,4,6\}$와 $B=\{3,6\}$는 서로 독립인 것을 아까 확인했지만, 서로 배반이라고는 할 수 없습니다.

또, 사건 $D$가 1이 나오는 경우를 가리킨다고 했을 때,

\[D=\{1\}\]

인데, 그러면 $A$와 $D$는 서로 배반입니다. 하지만,

\[P(A\cap D)=0\ne\frac12\times\frac16=P(A)P(D)\]

이므로 $A$와 $B$는 서로 독립이 아닙니다.

(6) 분할

사건들의 집합 $\mathcal A=\{A_i\mid i=1,2,\cdots,n\}$이 pairwisely exclusive이고, 다 합했을 때 전사건이 되면, $\mathcal A$를 $S$의 분할(partition)이라고 부릅니다. 다시 말해, 다음의 두 조건 (a), (b)을 만족시키면 됩니다 ;

\[\begin{align*} (a)~~&i\ne j\Longrightarrow A_i\cap A_j=\varnothing\\ (b)~~&A_1\cup A_2\cup\cdots\cup A_n=S \end{align*}\]

$\mathcal A$의 정의에서 $i$는 임의의 index set의 원소여도 됩니다. 다시 말해, 공집합이 아닌 집합 $I$에 대하여 $\mathcal A=\{A_i\mid i\in I\}$가

\[\begin{align*} (a)~~&i\ne j\Longrightarrow A_i\cap A_j=\varnothing\\ (b)~~&\bigcup_{i\in I}A_i=S \end{align*}\]

이면 $\mathcal A$는 $S$의 분할이라고 할 수 있습니다.

(7) 전확률의 정리

$\mathcal A=\{A_i\mid i=1,2,\cdots,n\}$가 $S$의 분할인 것은 그림으로 다음과 같이 나타낼 수 있을 것입니다.

그리고 또다른 사건 $B$가 있다고 하겠습니다.

그러면, 아래 그림에서 $P(B)=P(A_1\cap B)+P(A_2\cap B)+\cdots+P(A_n\cap B)$임을 직관적으로 확인할 수 있습니다.

일반적으로, 다음의 전확률의 정리(law of total probability)가 성립합니다.

전확률의 정리
사건들의 집합 $\mathcal A=\\{A_i\mid i=1,2,\cdots,n\\}$가 $S$의 분할이고 $B$가 사건일 때, \begin{align*} P(B) &=\sum_{i=1}^nP(A_i\cap B)\\ &=\sum_{i=1}^nP(A_i)P(B\mid A_i) \end{align*}

이에 대한 증명은 집합의 분배법칙으로부터 간단히 나옵니다. 먼저,

\[\begin{align*} P(B) &=P(S\cap B)\\ &=P\left((A_1\cup A_2\cup\cdots\cup A_n)\cap B\right)\\ &=P\left((A_1\cap B)\cup(A_2\cap B)\cup\cdots\cup(A_n\cap B)\right)\\ &=P(A_1\cap B)+P(A_2\cap B)+\cdots+P(A_n\cap B) \end{align*}\]

입니다. 따라서 첫번째 등식이 성립합니다. 또한, 조건부확률의 정의에서 $P(A_i\mid B)=\frac{P(A_i\cap B)}{P(B)}$으로부터 $P(A_i\cap B)=P(A_i)P(B\mid A_i)$가 성립하므로

\[\begin{align*} P(B) &=P(A_1\cap B)+P(A_2\cap B)+\cdots+P(A_n\cap B)\\ &=P(A_1)P(B\mid A_1)+P(A_2)P(B\mid A_2)+\cdots+P(A_n)P(B\mid A_n) \end{align*}\]

이 성립합니다. $\square$

이상은 $\mathcal A$가 유한집합인 경우에 대한 설명이지만, $\mathcal A$가 countably infinte인 경우에도 비슷한 설명을할 수 있습니다. 즉, $\mathcal A={A_i\mid i=1,2,3,\cdots}$가 $S$의 분할이고 $B$가 사건일 때,

\[\begin{align*} P(B) &=\sum_{i=1}^\infty P(A_i\cap B)\\ &=\sum_{i=1}^\infty P(A_i)P(B\mid A_i) \end{align*}\]

가 성립합니다.

(8) 전확률의 정리 (예시)

다음과 같은 문제를 풀어봅시다. 각각 5개의 구슬이 담겨있는 세 종류의 자루가 있습니다.

첫번째 자루에는 4개의 빨간 구슬과 1개의 파란 구슬이 담겨있습니다.
두번째 자루에는 2개의 빨간 구슬과 3개의 파란 구슬이 담겨있습니다.
세번째 자루에는 5개의 파란 구슬이 담겨있습니다.

임의로 자루를 하나 택한 뒤 자루 속에서 구슬을 하나 꺼낼 때, 빨간 구슬이 나올 확률은 얼마일까요?

쉬운 문제이지만, 앞서 설명한 개념들을 활용해서 풀어보겠습니다. 표본공간 $S$는 $S=\{1,2,3\}\times\{1,2,3,4,5\}$로 나타낼 수 있습니다. 즉,

\[\begin{align*} S =\{&1,2,3\}\times\{1,2,3,4,5\}\\ =\{&(1,1), (1,2), (1,3), (1,4), (1,5),\\ &(2,1), (2,2), (2,3), (2,4), (2,5),\\ &(3,1), (3,2), (3,3), (3,4), (3,5)\} \end{align*}\]

입니다. 각각의 근원사건 $(i,j)$는 $i$번째 자루를 선택한 뒤 $j$번째 구슬을 선택하는 상황을 나타냅니다. 총 15개의 근원사건들 중, 빨간구슬이 택해지는 경우는 첫번째 자루를 택했을 때의 4개의 경우, 두번째 자루를 택했을 때의 2개의 경우이므로, 구하는 확률은 $\frac{2+4}{15}=\frac25$이 될 것입니다.

이것을 전확률의 정리로 풀어보겠습니다. 사건 $A_1$, $A_2$, $A_3$를 각각 첫번재 자루, 두번째 자루, 세번째 자루를 선택하는 사건이라고 하겠습니다. 수학적으로 표현하면

\[\begin{align*} A_1&=\{1\}\times\{1,2,3,4,5\}=\{(1,1), (1,2), (1,3), (1,4), (1,5)\}\\ A_2&=\{2\}\times\{1,2,3,4,5\}=\{(2,1), (2,2), (2,3), (2,4), (2,5)\}\\ A_3&=\{3\}\times\{1,2,3,4,5\}=\{(3,1), (3,2), (3,3), (3,4), (3,5)\} \end{align*}\]

입니다. 그러면 $\{A_1,A_2,A_3\}$은 $S$의 분할이 됩니다.

사건 $R$을 빨간 구슬을 선택하는 사건이라고 하면 전확률의 정리에 의해

\[\begin{align*} P(R) &=P(A_1\cap R)+P(A_2\cap R)+P(A_3\cap R)\\ &=P(A_1)P(R\mid A_1)+P(A_2)P(R\mid A_2)+P(A_3)P(R\mid A_3)\\ &=\frac13\times\frac45+\frac13\times\frac25+\frac13\times0\\ &=\frac{4+2}{15}\\ &=\frac25 \end{align*}\]

가 됩니다.

참고한 자료

「Introduction to Probability, Statistics and Random Process」, example 1.24,

1. 확률론 기초

1.3. 조건부확률과 독립 사건

(1) 조건부확률

(2) 독립 사건

(3) 독립 사건 (예시)

(4) 독립 사건의 해석

(5) 독립과 배반

(6) 분할

(7) 전확률의 정리

(8) 전확률의 정리 (예시)

댓글남기기