본문 바로가기

Statistics

균일 분포

균일 분포는각 사상이 일어나는 확률이 같은 분포를 말합니다. 예를 들어 정교하게 잘 만들어진 주사위를 던져 각 눈이 나올 확률, 면적이 균일하게 나뉜 다트게임에서 각 번호가 적중할 확률 등입니다. 균일 분포는 각 사상이 연속적인지 불연속적인지에 따라 이산균일분포, 연속균일분포로 나뉘어집니다.

 

확률변수가 1,2,3,.. 과 같이 이산적인 값을 취하는 경우 입니다. 만약 확률분포 X가 {1, 2, ...  n } 의 값을 취한다고 하면, 확률분포표는 다음과 같이 작성할 수 있습니다. 

x P(x) xP(x)
1 1/n 1/n
2 1/n 2/n
.. .. ...
n 1/n 1/n

 

\begin{align*}
\text{E}(X) 
&= \frac{1}{n} + \frac{2}{n} + \cdots + \frac{n}{n} \\[8pt]
&= \frac{1 + 2 + \cdots + n}{n} \\[8pt]
&= \frac{\frac{n(n+1)}{2}}{n} \\[8pt]
&= \frac{n+1}{2}
\end{align*}

 

분산은 확률 변수의 제곱의 평균을 계산해서 앞서 구한 평균의 제곱값을 빼면 됩니다. 

 

\begin{align*}
\text{Var}(X) 
&= \text{E}(X^2) - \left( \text{E}(X) \right)^2 \\[8pt]
&= \left( \frac{1^2 + 2^2 + \cdots + n^2}{n} \right) - \left( \frac{n+1}{2} \right)^2 \\[8pt]
&= \left( \frac{\frac{n(n+1)(2n+1)}{6}}{n} \right) - \left( \frac{n+1}{2} \right)^2 \\[8pt]
&= \frac{(n+1)(2n+1)}{6} - \frac{(n+1)^2}{4} \\[8pt]
&= \frac{2(n+1)(2n+1) - 3(n+1)^2}{12} \\[8pt]
&= \frac{(n+1)\left[2(2n+1) - 3(n+1)\right]}{12} \\[8pt]
&= \frac{(n+1)(4n+2 - 3n - 3)}{12} \\[8pt]
&= \frac{(n+1)(n -1)}{12} \\[8pt]
&= \frac{n^2 - 1}{12}
\end{align*}

 

균일분포를 적용할 예를 고민해 봅시다. 한국에는 로또라는 게임이 있습니다. 이 게임은 1부터 45까지의 숫자 중 6개를 맞추는 게임입니다. 위치에 관계없고, 숫자 중복을 허용하지 않기 떄문에 이 게임의 당첨 확률은 1/8,145,060 입니다. 그런데 한국에서는 이 로또 추첨이 조작되었다는 의혹을 많이 받아왔습니다. 녹화 방송이라는 둥, 특정 번호가 나오게 기계를 세팅했다는 둥 말이죠. 그리고 지금까지 나온 번호들을 이용해 추첨번호를 제공하는 사람들도 있습니다. 

 

로또가 실제로 조작 되었는지 아닌지를 알 수는없지만, 지금까지 나온 통게 수치들을 검토해 보면 힌트는 얻을 수 있을 것 같습니다. 먼저 앞서 유도한 식을 이용해 봅시다. 만약 로또 게임을 1000번 진행했다면, 평균은 23이 나올 것이고, 표준 편차는 13.09 입니다. 

 

그럼 실제 데이터를 봅시다. 아래 표는 500회까지 로또에서 나온 숫자들의 분포표 및 확률 입니다. 

 

x count \(P(x)\) \(xP(x)\) \((x_{i}-\mu)^2\) \((x_{i}-\mu)^2P(x)\)
1 142 0.0237 0.0237 485.14 11.48
2 136 0.0227 0.0453 442.09 10.02
3 134 0.0223 0.0670 401.03 8.96
...          
43 145 0.0242 1.0392 398.97 9.64
44 134 0.0223 0.9827 439.92 9.82
45 138 0.0230 1.0350 482.86 11.11
total 6000 1 23.0258   170.27

 

  평균은 23.0258, 표준 편차는 13.0489 입니다. 어떤가요? 

'Statistics' 카테고리의 다른 글

포아송 분포  (0) 2025.04.24
이항 분포  (0) 2025.04.22
초기하 분포  (1) 2025.04.19
확률분포의 기대값과 분산  (0) 2025.04.17
확률변수와 확률분포  (0) 2025.04.15