I. 모평균의 검정
1) 모분산을 아는 경우
모분산 \(\sigma^2\)이 알려진 정규모집단 \(N(\mu, \sigma^2)\)의 모평균 \(\mu\)에 관한 가설 검정에 대해 생각해 봅시다. 가설 검정은 귀무가설과 대립가설의 구간에 따라 우측 검정 (right-side test), 좌측 검정 (left-side test), 양측 검정 (two-side test)로 구분할 수 있습니다.
① 좌측 검정 (left-side test)
좌측검정은 귀무가설이 어떤값 보다 작거나 같다의 형태일 떄 사용합니다.
\[ (a) \quad H_0\,:\, \mu \leq \mu_0, \quad H_1\,:\, \mu > \mu_0 \]
위의 가설에 대해서는 크기 n인 확률표본으로부터의 표본 평균 \(\overline{X}\)의 값이 클수록 \(H_1\)이 참이라는 것이 명백해집니다. 따라서 기각역, 즉 귀무가설을 기각할 수 있는 영역은 다음과 같은 형태로 표현할수 있습니다.
\[R\,:\,\overline{X} \geq c\]
다음은 유의수준이 \(\alpha\)가 되는 c의 값을 찾아야 합니다. 표준정규 확률변수를 \(Z\)라 하면 이 검정법의 검정력 함수는 다음과 같습니다.
\begin{aligned} \gamma(\mu) &= P\{ \overline{X} \geq c \, | \, avg = \mu \} \\[8pt] &= P\{ \frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq\frac{c-\mu}{\sigma / \sqrt{n}} \} \\[8pt] &=P\{ Z \geq\frac{c-\mu}{\sigma / \sqrt{n}} \} \end{aligned}
\( \mu \) 값이 변함에 따라 검정력 함수의 값이 어떻게 변하는지 생각해 봅시다. 마지막 식의 우변의 값은 \( \mu \) 가 늘어남에 따라 값이 작아지고, 따라서 검정력, 즉 제 1종 오류를 범할 확률은 \( \mu \) 가 늘어남에 따라 늘어나게 됩니다. 따라서 귀무가설에서 제시하고 있는 실제 평균의 최대값인 \(\mu_0\) 일 때 제 1종 오류를 범할 확률은 최대가 되므로, 유의 수준을 \(\alpha\) 이려면
\[ \gamma(\mu_0) = \alpha, \quad \rightarrow \frac{c-\mu_0}{\sigma / \sqrt{n}}=z_{\alpha} \]
에 의해 c를 정하면 됩니다. 따라서 유의 수준 \(\alpha\)의 기각역은 아래와 같이 나타낼수 있습니다.
\[R\,:\,\overline{X} \geq \mu_0 + z_{\alpha} \frac{\sigma}{\sqrt{n}} \quad \text{or} \quad \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \geq z_{\alpha} \]
② 우측 검정 (right-side test)
우측 검정은 귀무가설이 어떤값 보다 크거나 같다의 형태일 때 사용합니다.
\[ (b) \quad H_0\,:\, \mu \geq \mu_0, \quad H_1\,:\, \mu < \mu_0 \]
일 떄는, 유의 수준인 기각역은 아래와 같이 주어집니다.
\[R\,:\,\overline{X} \leq \mu_0 - z_{\alpha} \frac{\sigma}{\sqrt{n}} \quad \text{or} \quad \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \leq -z_{\alpha} \]
③ 양측 검정 (two-side test)
양측 검정은 귀무가설이 어떤 값과 같다의 형태 일 때 사용합니다.
\[ (c)\quad H_0\,:\, \mu \geq \mu_0, \quad H_1\,:\, \mu \neq \mu_0 \]
이 때는 \(\overline{X}\)가 \( \mu_0 \)로 부터 멀리 떨어져 있을 수록 \(H_1\)이 사실이라는 증거가 커집니다. 따라서 이 경우 기각역은 다음과 같은 형태로 정의할 수 있습니다.
\[R\,:\, \left\vert \overline{X} - \mu_0 \right\vert \geq c \]
이 떄 1종 오류를 범할 확률은 아래와 같고,
\[ P\{ \left\vert \overline{X}-\mu_0 \right\vert \geq c \, \vert \, avg = \mu_0 \} = P\left\{ \frac{ \left\vert \overline{X} - \mu_0 \right\vert }{ \sigma / \sqrt{n}} \geq \frac{ c}{\sigma / \sqrt{n}} \right\} \]
기각역은 다음과 같이 주어집니다.
\[R\,:\, \left\vert \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \right\vert \geq z_{\alpha/2} \]
지금까지 정리한 내용을 요약하며 다음과 같습니다.
- 모분산이 알려진 정규모집단에 대한 검정 통계량
\[ Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \]
- 기각역
귀무가설 | 대립가설 | 유의수준 \(\alpha\)인 기각역 | |
(a) | \( H_0\, :\, \mu \leq \mu_0 \) | \( H_1\, :\, \mu > \mu_0 \) | \(Z \geq z_{\alpha}\) |
(b) | \( H_0\, :\, \mu \geq \mu_0 \) | \( H_1\, :\, \mu < \mu_0 \) | \(Z \leq -z_{\alpha}\) |
(c) | \( H_0\, :\, \mu = \mu_0 \) | \( H_1\, :\, \mu \neq \mu_0 \) | \( \vert Z \vert \geq z_{\alpha/2}\) |
예제입니다. 어떤 질병에 대한 기존 치료법의 치료 기간은 평균 15일, 표준편차 3일을 따른다고 합시다. 의료진은 새로운 치료법을 개발했으며, 이 치료법이 기존 대비 치료 기간을 단축 시킨다고 주장하고 있습니다. 이를 확인하기 위해 n 명의 환자를 랜덤하게 추출해 치료 기간을 기록하였습니다. 새로운 치료법의 치료기간도 표준편차가 3일인 정규분포를 따른다고 할 때 유의 수준 0.05인 검정법은 어떻게 될까요.
단계별로 생각해봅시다.
1) 가설 수립
\[ H_0\,:\, \mu \geq 15, \quad H_1\,:\, \mu < 15 \]
2) 확률분포와 검정기준 수립
: 확률분포는 정규분포라고 가정 했고, 검정 기준은 유의 수준 0.05 입니다.
: 기각역은 기존 치료 기간인 15일 보다 적게 잡는게 합리적이므로, 기각역은
\[R\,:\, \frac{\overline{X}-15}{3/\sqrt{n}} \leq -z_{0.05} = -1.645\]
: 따라서 표본평균의 범위는 다음과 같이 설정할 수 있습니다.
\[ \overline{X} \leq 15-4.935 / \sqrt{n} \]
2) 모분산을 모르는 경우
이번에는 모분산을 모르는 경우 입니다. 모분산이 알려지지 않은 정규모집단 \(N(\mu, \sigma^2)\)에 대해 크기 n인 확률표본으로 부터의 평균을 \(\overline{X}\), 표본분산은 \(S^2\) 이라 하면, 아래의 식이 성립합니다.
\[ \frac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1) \]
따라서 앞서 소개한 검정법의 검정통계량에서 \(\sigma\)대신 표본표준편차 \(S\)를 사용하여 검정을 하면 됩니다. 이 떄 검정법을 t 검정법 (t-test) 라고 하며, 아래와 같이 정리할 수 있습니다.
- 모분산이 알려지지 정규모집단에 대한 검정 통계량
\[ T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \]
- 기각역
귀무가설 | 대립가설 | 유의수준 \(\alpha\)인 기각역 | |
(a) | \( H_0\, :\, \mu \leq \mu_0 \) | \( H_1\, :\, \mu > \mu_0 \) | \(T \geq t(n-1, \, \alpha) \) |
(b) | \( H_0\, :\, \mu \geq \mu_0 \) | \( H_1\, :\, \mu < \mu_0 \) | \(T \geq -t(n-1, \, \alpha) \) |
(c) | \( H_0\, :\, \mu = \mu_0 \) | \( H_1\, :\, \mu \neq \mu_0 \) | \( \vert T \vert \geq t(n-1, \, \frac{\alpha}{2}) \) |
예제입니다. 어떤 전구회사에서 본인들의 제품의 수명시간의 분포는 정규분포이며, 평균 1950 시간 이상이라고 주장하고 있습니다. 이 주장의 참/거짓을 판단하기 위해 샘플 9개를 추출하였고, 평균 1966.7 시간 표준편차는 69.6 으로 계산되었습니다. 이 결과를 유의수준 0.05 에서 검정해봅시다.
이 문제 역시 단계별로 생각해봅시다.
1) 가설 수립
\[ H_0\,:\, \mu \leq 1950, \quad H_1\,:\, \mu > 1950 \]
2) 확률분포와 검정기준 수립
: 확률분포는 정규분포라고 가정 했고, 검정 기준은 유의 수준 0.05 입니다.
3) 검정통계량 계산
: 주어진 자료로 부터 \(n\) = 9, \(\overline{X}\) = 1966.7, \(s\) = 69.6 이며, 검증통계량의 관측값은 다음과 같이 계산할 수 있습니다.
\[ T = \frac{\overline{x} - 1950}{s/\sqrt{n}} = \frac{1966.7 - 1950}{69.6/\sqrt{9}}=0.720\]
4) 검증통계량 관측확률 계산
t(8, 0.05) = 1.860 입니다.
5) 가설 판정
따라서 검정통계량 \(T\)는 t(8,0.05)=1.860 보다 작으므로, 귀무가설은 유의 수준에서 기각할 수 없고, 따라서 주어진 자료로는 회사측의 주장을 입증할 수 없습니다.
3) 표본의 크기가 충분히 큰 경우
마지막으로 표본의 크기 \(n\)이 충분히 큰 경우에 모평균 검정에 대해 생각해봅시다. 모분산이 알려진 임의의 모집단(정규모집단이 아니어도 상관없습니다)을오부터 표본 평균 \(\overline{X}\)에 대하여, n이 충분히 크면 근사적으로 정규분포를 적용할 수 있음을 배웠습니다. 즉,
\[ \frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) \quad (n\rightarrow \infty)\]
또한, 표본표준편차 S는 모표준편차의 일치추정량이므로, 모분산이 알려지지 않은 경우에도 \(sigma\) 대신 \(S\)를 대입하여 근사적으로 정규분포이론을 적용할 수 있습니다.
\[ \frac{\overline{X}-\mu}{S/\sqrt{n}} \sim N(0,1) \quad (n\rightarrow \infty)\]
따라서 검정법은 아래와 같이 정리할 수 있습니다.
- 모분산이 알려진 임의의 모집단에 대한 검정 통계량
\[ Z = \frac{\overline{X}-\mu_0}{\sigma / \sqrt{n}} \]
- 모분산이 알려지지 않은 임의의 모집단에 대한 검정 통계량
\[ Z = \frac{\overline{X}-\mu_0}{S / \sqrt{n}} \]
- 기각역
귀무가설 | 대립가설 | 유의수준 \(\alpha\)인 기각역 | |
(a) | \( H_0\, :\, \mu \leq \mu_0 \) | \( H_1\, :\, \mu > \mu_0 \) | \(Z \geq z_{\alpha}\) |
(b) | \( H_0\, :\, \mu \geq \mu_0 \) | \( H_1\, :\, \mu < \mu_0 \) | \(Z \leq -z_{\alpha}\) |
(c) | \( H_0\, :\, \mu = \mu_0 \) | \( H_1\, :\, \mu \neq \mu_0 \) | \( \vert Z \vert \geq z_{\alpha/2}\) |
'Statistics' 카테고리의 다른 글
통계분석 방법의 종류 (0) | 2025.05.18 |
---|---|
검정 : 모비율과 모분산 (0) | 2025.05.16 |
검정의 원리 (0) | 2025.05.12 |
구간추정 (0) | 2025.05.07 |
점추정 (0) | 2025.05.05 |