귀무가설(null hypothesis), 대안가설(alternative hypothesis)

현재의 상태가 있다(귀무 가설) 어떤 새로운 상태가 과연 더 좋을까?(대안 가설)

두 상태를 비교해 어떤게 더 맞는지 검정(test)해보자.

ex. 현재 어떤 제품의 survive rate가 70%라고 하자 새로 나올 제품의 survive rate $\theta$가 70% 확률을 넘는 것을 목표로 한다

만약 테스트를 해봤을때 나온 $\theta > 0.7$이라면 신제품을 출시(대안 가설을 채택) 아니라면, 즉 현재인 70%보다도 못한 성적이 나온다면 그냥 그대로(귀무 채택)

테스트의 확률 분포는 $\theta$로 성공하는 개수를 세는 것이므로, $B(n,\theta)$를 따른다.

[가설 설정]

귀무 가설 H0: $\theta ≤ 0.7$

대안 가설 H1: $\theta > 0.7$

특정 c(critical value)와 관측값 X에 대하여 X≥c 라면 H0를 기각시키고 대안 가설을 수용( $\theta > 0.7$ 임을 증명) 한다.

[실험]

개수를 세거나 하는 등의 무언가를 한다

[결과]

Untitled

  1. H1 = True ; 값이 c개보다 많다 (대안가설이 맞음)
    1. 관측값이 c보다 크다 → H0를 기각시킨다(그리고 H1을 수용한다)
    2. 관측값이 c보다 작다 → H0를 수용한다(그리고 H1를 기각시킨다) → 오류 Type II error: 실제로 맞는데 아니라고 판단한 상황
  2. H0 = False; 값이 c개보다 적거나 같다 (귀무가설이 맞음)
    1. 관측값이 c보다 작다 → H1을 기각시킨다(그리고 H0를 수용한다)
    2. 관측값이 c보다 크다 → H1을 수용한다(그리고 H0를 기각시킨다) → 오류
      • Type I error: 실제로는 아닌데 맞다고 한 상황
      • 이때 error 확률을 $\alpha$로 표기, 유의수준 이라고 한다
      • 이 알파의 확률은, 관측 값이 c보다 클 확률과 같다.

만약 20개의 데이터에서 성공 확률이 70% 보다 크다는 것을 유의수준 0.25에서 증명하고 싶다