균일 분포는각 사상이 일어나는 확률이 같은 분포를 말합니다. 예를 들어 정교하게 잘 만들어진 주사위를 던져 각 눈이 나올 확률, 면적이 균일하게 나뉜 다트게임에서 각 번호가 적중할 확률 등입니다. 균일 분포는 각 사상이 연속적인지 불연속적인지에 따라 이산균일분포, 연속균일분포로 나뉘어집니다.
확률변수가 1,2,3,.. 과 같이 이산적인 값을 취하는 경우 입니다. 만약 확률분포 X가 {1, 2, ... n } 의 값을 취한다고 하면, 확률분포표는 다음과 같이 작성할 수 있습니다.
x | P(x) | xP(x) |
1 | 1/n | 1/n |
2 | 1/n | 2/n |
.. | .. | ... |
n | 1/n | 1/n |
\begin{align*}
\text{E}(X)
&= \frac{1}{n} + \frac{2}{n} + \cdots + \frac{n}{n} \\[8pt]
&= \frac{1 + 2 + \cdots + n}{n} \\[8pt]
&= \frac{\frac{n(n+1)}{2}}{n} \\[8pt]
&= \frac{n+1}{2}
\end{align*}
분산은 확률 변수의 제곱의 평균을 계산해서 앞서 구한 평균의 제곱값을 빼면 됩니다.
\begin{align*}
\text{Var}(X)
&= \text{E}(X^2) - \left( \text{E}(X) \right)^2 \\[8pt]
&= \left( \frac{1^2 + 2^2 + \cdots + n^2}{n} \right) - \left( \frac{n+1}{2} \right)^2 \\[8pt]
&= \left( \frac{\frac{n(n+1)(2n+1)}{6}}{n} \right) - \left( \frac{n+1}{2} \right)^2 \\[8pt]
&= \frac{(n+1)(2n+1)}{6} - \frac{(n+1)^2}{4} \\[8pt]
&= \frac{2(n+1)(2n+1) - 3(n+1)^2}{12} \\[8pt]
&= \frac{(n+1)\left[2(2n+1) - 3(n+1)\right]}{12} \\[8pt]
&= \frac{(n+1)(4n+2 - 3n - 3)}{12} \\[8pt]
&= \frac{(n+1)(n -1)}{12} \\[8pt]
&= \frac{n^2 - 1}{12}
\end{align*}
균일분포를 적용할 예를 고민해 봅시다. 한국에는 로또라는 게임이 있습니다. 이 게임은 1부터 45까지의 숫자 중 6개를 맞추는 게임입니다. 위치에 관계없고, 숫자 중복을 허용하지 않기 떄문에 이 게임의 당첨 확률은 1/8,145,060 입니다. 그런데 한국에서는 이 로또 추첨이 조작되었다는 의혹을 많이 받아왔습니다. 녹화 방송이라는 둥, 특정 번호가 나오게 기계를 세팅했다는 둥 말이죠. 그리고 지금까지 나온 번호들을 이용해 추첨번호를 제공하는 사람들도 있습니다.
로또가 실제로 조작 되었는지 아닌지를 알 수는없지만, 지금까지 나온 통게 수치들을 검토해 보면 힌트는 얻을 수 있을 것 같습니다. 먼저 앞서 유도한 식을 이용해 봅시다. 만약 로또 게임을 1000번 진행했다면, 평균은 23이 나올 것이고, 표준 편차는 13.09 입니다.
그럼 실제 데이터를 봅시다. 아래 표는 500회까지 로또에서 나온 숫자들의 분포표 및 확률 입니다.
x | count | \(P(x)\) | \(xP(x)\) | \((x_{i}-\mu)^2\) | \((x_{i}-\mu)^2P(x)\) |
1 | 142 | 0.0237 | 0.0237 | 485.14 | 11.48 |
2 | 136 | 0.0227 | 0.0453 | 442.09 | 10.02 |
3 | 134 | 0.0223 | 0.0670 | 401.03 | 8.96 |
... | |||||
43 | 145 | 0.0242 | 1.0392 | 398.97 | 9.64 |
44 | 134 | 0.0223 | 0.9827 | 439.92 | 9.82 |
45 | 138 | 0.0230 | 1.0350 | 482.86 | 11.11 |
total | 6000 | 1 | 23.0258 | 170.27 |
평균은 23.0258, 표준 편차는 13.0489 입니다. 어떤가요?
'Statistics' 카테고리의 다른 글
포아송 분포 (0) | 2025.04.24 |
---|---|
이항 분포 (0) | 2025.04.22 |
초기하 분포 (1) | 2025.04.19 |
확률분포의 기대값과 분산 (0) | 2025.04.17 |
확률변수와 확률분포 (0) | 2025.04.15 |