본문 바로가기

Statistics

t분포

I. t분포의 정의

\(X_1\), \(X_2\), ... , \(X_n\) 이 정규모집단 \( N(\mu, \sigma^2) \) 으로부터의 확률표본 일 때, 표본평균에 대해 아래 식이 성립함

을 배운 적이 있습니다. 여기 

 

\[ \overline{X} \sim N \left( \mu, \frac{\sigma^2}{n} \right), \quad \frac{ \overline{X} - \mu }{ \sigma/ \sqrt{n}} \sim N(0,1) \]

 

그런데 만약 정규모집단의 \( \sigma \) 를 모르는 경우는 어떻게 될까요? (대부분 우리는 알 수 없습니다) 이런 경우에는 \( \sigma \) 대신 표본표준편차를 대입하여, 스튜던트화(studentized) 된 확률변수의 분포를 필요로 하는 경우가 많습니다. 

 

\[ \frac{ \overline{X} -\mu }{ S / \sqrt{n} } \]

 

이 확률변수의 분포는 t분포(t-distribution) 이라 부르며 다음과 같이 정의 됩니다. 

우선 정규모집단의 정의에서 표본분산의 분포는 다음과 같이 정의됨을 배웠습니다.

 

\[ \frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1) \]

 

여기서 T분포는표본평균의 분포를 표본분산의 성질을 이용해 다음과 같이 정리할 수 있습니다. 

\begin{aligned}
T &= \frac{\overline{X} - \mu}{S / \sqrt{n}} \\[8pt]
  &= \frac{\overline{X} - \mu}{\sqrt{ \frac{\chi^2(n-1)}{n-1} } \cdot \frac{\sigma}{\sqrt{n}}} \\[8pt]
  &= \frac{Z}{\sqrt{V / k}}
\end{aligned}

 

여기서 확률변수 \(V\)는 자유도 k(=n-1) 인 카이제곱분포를 따르는 확률변수 입니다. t분포는 정규모집단에서 표본의 크기가 작을 때 특히 유용하게 쓰이는 분포입니다. 아래 그림은 자유도 5인 t분포와 표준정규본포의 모양을 비교한 것인데요, t분포도 표준정규분포와 동일하게 0을 중심으로 좌우대칭형이지만, 표준정규분포에 비해 두터운 꼬리를 갖는 것이 특징입니다. 

 

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm, t

# x축 값 범위 설정
x = np.linspace(-5, 5, 1000)

# 표준정규분포와 자유도 5인 t-분포의 확률밀도함수
normal_pdf = norm.pdf(x)
t_pdf = t.pdf(x, df=5)

# 그래프 그리기
plt.figure(figsize=(8, 5))
plt.plot(x, normal_pdf, label='Standard Normal', linestyle='--', color='blue')
plt.plot(x, t_pdf, label='t-distribution (df=5)', linestyle='-', color='red')
plt.title('Standard Normal vs t-distribution (df=5)')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)

# 그림 파일로 저장
plt.savefig('normal_vs_t_dist.png', dpi=300)
plt.show()

 

 

'Statistics' 카테고리의 다른 글

점추정  (0) 2025.05.05
추론의 개념  (0) 2025.05.04
F분포  (0) 2025.04.29
카이제곱분포  (0) 2025.04.28
표본분포  (0) 2025.04.27