본문 바로가기

Statistics

검정 : 모평균

I. 모평균의 검정

1) 모분산을 아는 경우

모분산 \(\sigma^2\)이 알려진 정규모집단 \(N(\mu, \sigma^2)\)의 모평균 \(\mu\)에 관한 가설 검정에 대해 생각해 봅시다. 가설 검정은 귀무가설과 대립가설의 구간에 따라 우측 검정 (right-side test), 좌측 검정 (left-side test), 양측 검정 (two-side test)로 구분할 수 있습니다.  

 

① 좌측 검정 (left-side test) 

좌측검정은 귀무가설이 어떤값 보다 작거나 같다의 형태일 떄 사용합니다. 

 

\[ (a) \quad H_0\,:\, \mu \leq \mu_0, \quad H_1\,:\, \mu > \mu_0 \]

 

위의 가설에 대해서는 크기 n인 확률표본으로부터의 표본 평균 \(\overline{X}\)의 값이 클수록 \(H_1\)이 참이라는 것이 명백해집니다. 따라서 기각역, 즉 귀무가설을 기각할 수 있는 영역은 다음과 같은 형태로 표현할수 있습니다.  

 

\[R\,:\,\overline{X} \geq c\] 

 

다음은 유의수준이 \(\alpha\)가 되는 c의 값을 찾아야 합니다. 표준정규 확률변수를 \(Z\)라 하면 이 검정법의 검정력 함수는 다음과 같습니다.

 

\begin{aligned}  \gamma(\mu) &= P\{ \overline{X} \geq c \, | \, avg = \mu \} \\[8pt] &= P\{ \frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq\frac{c-\mu}{\sigma / \sqrt{n}}  \} \\[8pt] &=P\{ Z \geq\frac{c-\mu}{\sigma / \sqrt{n}}  \}  \end{aligned}

 

\( \mu \) 값이 변함에 따라 검정력 함수의 값이 어떻게 변하는지 생각해 봅시다. 마지막 식의 우변의 값은 \( \mu \) 가 늘어남에 따라 값이 작아지고, 따라서 검정력, 즉 제 1종 오류를 범할 확률은 \( \mu \) 가 늘어남에 따라 늘어나게 됩니다. 따라서 귀무가설에서 제시하고 있는 실제 평균의 최대값인 \(\mu_0\) 일 때 제 1종 오류를 범할 확률은 최대가 되므로, 유의 수준을 \(\alpha\) 이려면

 

\[ \gamma(\mu_0) = \alpha, \quad \rightarrow  \frac{c-\mu_0}{\sigma / \sqrt{n}}=z_{\alpha} \]

 

에 의해 c를 정하면 됩니다. 따라서 유의 수준 \(\alpha\)의 기각역은 아래와 같이 나타낼수 있습니다.  

 

\[R\,:\,\overline{X} \geq \mu_0 + z_{\alpha} \frac{\sigma}{\sqrt{n}} \quad \text{or} \quad  \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \geq z_{\alpha} \] 

 

② 우측 검정 (right-side test)

우측 검정은 귀무가설이 어떤값 보다 크거나 같다의 형태일 때 사용합니다. 

 

\[ (b) \quad H_0\,:\, \mu \geq \mu_0, \quad H_1\,:\, \mu < \mu_0 \]

 

일 떄는, 유의 수준인 기각역은 아래와 같이 주어집니다. 

 

\[R\,:\,\overline{X} \leq \mu_0 - z_{\alpha} \frac{\sigma}{\sqrt{n}} \quad \text{or} \quad  \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \leq -z_{\alpha} \] 

 

③ 양측 검정 (two-side test)

양측 검정은 귀무가설이 어떤 값과 같다의 형태 일 때 사용합니다. 

 

\[ (c)\quad H_0\,:\, \mu \geq \mu_0, \quad H_1\,:\, \mu \neq \mu_0 \]

 

이 때는 \(\overline{X}\)가 \( \mu_0 \)로 부터 멀리 떨어져 있을 수록 \(H_1\)이 사실이라는 증거가 커집니다. 따라서 이 경우 기각역은 다음과 같은 형태로 정의할 수 있습니다. 

 

\[R\,:\, \left\vert  \overline{X} - \mu_0 \right\vert \geq c  \] 

 

이 떄 1종 오류를 범할 확률은 아래와 같고, 

 

\[ P\{ \left\vert \overline{X}-\mu_0 \right\vert \geq c \, \vert \, avg = \mu_0 \} = P\left\{ \frac{  \left\vert  \overline{X} - \mu_0 \right\vert  }{ \sigma / \sqrt{n}} \geq \frac{  c}{\sigma / \sqrt{n}} \right\} \]

 

기각역은 다음과 같이 주어집니다. 

 

\[R\,:\, \left\vert \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}}  \right\vert \geq z_{\alpha/2} \] 

 

지금까지 정리한 내용을 요약하며 다음과 같습니다. 

  • 모분산이 알려진 정규모집단에 대한 검정 통계량

\[ Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \]

  • 기각역
  귀무가설 대립가설 유의수준 \(\alpha\)인 기각역
(a) \( H_0\, :\, \mu \leq \mu_0 \) \( H_1\, :\, \mu > \mu_0 \) \(Z \geq z_{\alpha}\)
(b) \( H_0\, :\, \mu \geq \mu_0 \) \( H_1\, :\, \mu < \mu_0 \) \(Z \leq -z_{\alpha}\)
(c) \( H_0\, :\, \mu = \mu_0 \) \( H_1\, :\, \mu \neq \mu_0 \) \( \vert Z \vert \geq z_{\alpha/2}\)

 

예제입니다. 어떤 질병에 대한 기존 치료법의 치료 기간은 평균 15일, 표준편차 3일을 따른다고 합시다. 의료진은 새로운 치료법을 개발했으며, 이 치료법이 기존 대비 치료 기간을 단축 시킨다고 주장하고 있습니다. 이를 확인하기 위해 n 명의 환자를 랜덤하게 추출해 치료 기간을 기록하였습니다. 새로운 치료법의 치료기간도 표준편차가 3일인 정규분포를 따른다고 할 때 유의 수준 0.05인 검정법은 어떻게 될까요.

 

단계별로 생각해봅시다.

1) 가설 수립

\[  H_0\,:\, \mu \geq 15, \quad H_1\,:\, \mu < 15 \]

2) 확률분포와 검정기준 수립

  : 확률분포는 정규분포라고 가정 했고, 검정 기준은 유의 수준 0.05 입니다. 

  : 기각역은 기존 치료 기간인 15일 보다 적게 잡는게 합리적이므로, 기각역은

\[R\,:\,  \frac{\overline{X}-15}{3/\sqrt{n}} \leq -z_{0.05} = -1.645\]

   : 따라서 표본평균의 범위는 다음과 같이 설정할 수 있습니다. 

\[ \overline{X} \leq 15-4.935 / \sqrt{n} \] 

 

2) 모분산을 모르는 경우 

이번에는 모분산을 모르는 경우 입니다. 모분산이 알려지지 않은 정규모집단 \(N(\mu, \sigma^2)\)에 대해 크기 n인 확률표본으로 부터의 평균을 \(\overline{X}\), 표본분산은 \(S^2\) 이라 하면, 아래의 식이 성립합니다.

 

\[ \frac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1) \]

 

따라서 앞서 소개한 검정법의 검정통계량에서 \(\sigma\)대신 표본표준편차 \(S\)를 사용하여 검정을 하면 됩니다. 이 떄 검정법을 t 검정법 (t-test) 라고 하며, 아래와 같이 정리할 수 있습니다. 

  • 모분산이 알려지지 정규모집단에 대한 검정 통계량

\[ T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \]

  • 기각역
  귀무가설 대립가설 유의수준 \(\alpha\)인 기각역
(a) \( H_0\, :\, \mu \leq \mu_0 \) \( H_1\, :\, \mu > \mu_0 \) \(T \geq t(n-1, \, \alpha) \)
(b) \( H_0\, :\, \mu \geq \mu_0 \) \( H_1\, :\, \mu < \mu_0 \) \(T \geq -t(n-1, \, \alpha) \)
(c) \( H_0\, :\, \mu = \mu_0 \) \( H_1\, :\, \mu \neq \mu_0 \) \( \vert T \vert \geq t(n-1, \, \frac{\alpha}{2}) \)

 

예제입니다. 어떤 전구회사에서 본인들의 제품의 수명시간의 분포는 정규분포이며, 평균 1950 시간 이상이라고 주장하고 있습니다. 이 주장의 참/거짓을 판단하기 위해 샘플 9개를 추출하였고, 평균 1966.7 시간 표준편차는 69.6 으로 계산되었습니다. 이 결과를 유의수준 0.05 에서 검정해봅시다.

 

이 문제 역시 단계별로 생각해봅시다.

1) 가설 수립
\[  H_0\,:\, \mu \leq 1950, \quad H_1\,:\, \mu > 1950 \]

2) 확률분포와 검정기준 수립
  : 확률분포는 정규분포라고 가정 했고, 검정 기준은 유의 수준 0.05 입니다. 

 

3) 검정통계량 계산

  : 주어진 자료로 부터 \(n\) = 9, \(\overline{X}\) = 1966.7, \(s\) = 69.6 이며, 검증통계량의 관측값은 다음과 같이 계산할 수 있습니다.

\[ T = \frac{\overline{x} - 1950}{s/\sqrt{n}} = \frac{1966.7 - 1950}{69.6/\sqrt{9}}=0.720\]

 

4) 검증통계량 관측확률 계산

t(8, 0.05) = 1.860 입니다.

 

5) 가설 판정

따라서 검정통계량 \(T\)는 t(8,0.05)=1.860 보다 작으므로, 귀무가설은 유의 수준에서 기각할 수 없고, 따라서 주어진 자료로는 회사측의 주장을 입증할 수 없습니다. 

 

3) 표본의 크기가 충분히 큰 경우 

마지막으로 표본의 크기 \(n\)이 충분히 큰 경우에 모평균 검정에 대해 생각해봅시다. 모분산이 알려진 임의의 모집단(정규모집단이 아니어도 상관없습니다)을오부터 표본 평균 \(\overline{X}\)에 대하여, n이 충분히 크면 근사적으로 정규분포를 적용할 수 있음을 배웠습니다. 즉,

 

\[ \frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) \quad (n\rightarrow \infty)\]

 

또한, 표본표준편차 S는 모표준편차의 일치추정량이므로, 모분산이 알려지지 않은 경우에도 \(sigma\) 대신 \(S\)를 대입하여 근사적으로 정규분포이론을 적용할 수 있습니다.

 

\[ \frac{\overline{X}-\mu}{S/\sqrt{n}} \sim N(0,1) \quad (n\rightarrow \infty)\]

따라서 검정법은 아래와 같이 정리할 수 있습니다. 

  • 모분산이 알려진 임의의 모집단에 대한 검정 통계량

\[ Z = \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \]

  • 모분산이 알려지지 않은 임의의 모집단에 대한 검정 통계량

\[ Z = \frac{\overline{X}-\mu_0}{S / \sqrt{n}} \]

  • 기각역
  귀무가설 대립가설 유의수준 \(\alpha\)인 기각역
(a) \( H_0\, :\, \mu \leq \mu_0 \) \( H_1\, :\, \mu > \mu_0 \) \(Z \geq z_{\alpha}\)
(b) \( H_0\, :\, \mu \geq \mu_0 \) \( H_1\, :\, \mu < \mu_0 \) \(Z \leq -z_{\alpha}\)
(c) \( H_0\, :\, \mu = \mu_0 \) \( H_1\, :\, \mu \neq \mu_0 \) \( \vert Z \vert \geq z_{\alpha/2}\)

 

 

   

'Statistics' 카테고리의 다른 글

통계분석 방법의 종류  (0) 2025.05.18
검정 : 모비율과 모분산  (0) 2025.05.16
검정의 원리  (0) 2025.05.12
구간추정  (0) 2025.05.07
점추정  (0) 2025.05.05