nan + nan = 2nan

[통계] 1종 오류, 2종 오류 본문

Statistics

[통계] 1종 오류, 2종 오류

2nan 2023. 5. 12. 14:31
728x90

지난 번, 가설 검정의 귀무가설과 대립가설에 대해 살펴보았다.

* 관련 글
- https://2nan.tistory.com/115

 

[통계] 귀무가설과 대립가설

데이터를 분석하는데 있어 중요한 부분은 무엇을 검증하기 위하냐가 문제일 것이다. 어떠한 데이터를 분석을 해야 한다면, 결론을 만들어야 할 것이고 그에 따른 가설을 세워야 한다. 그런 다음

2nan.tistory.com


이번엔 해당 가설들을 채택하는데 있어 고려하게 되는 오류들에 대해 살펴본다.

1종 오류와 2종 오류


지난 번 귀무가설과 대립가설을 설명할 때 들었던 예시를 다시 살펴보자.

귀무가설 "백신을 맞아도 코로나에 대한 면역 효과는 없다."
대립가설 "백신을 맞은 사람은 코로나에 대한 면역 효과가 있다."

이 때, 총 4가지의 상황이 발생할 수 있다.

  거짓
귀무가설 채택 True False (1종 오류)
귀무가설 기각 False (2종 오류) True

 

  1. 귀무가설이 이면서, 판별 결과도 일 경우
    -> 결과적으로 옳음 (True)
  2. 귀무가설이 인데, 판별 결과는 거짓일 경우
    -> 오류! (False)
  3. 귀무가설이 거짓인데, 판별 결과는 일 경우
    -> 오류! (False)
  4. 귀무가설이 거짓이면서, 판별 결과는 거짓일 경우
    -> 결과적으로 옳음 (True)

 

1종 오류

- 귀무가설이 이면서, 판별 결과는 거짓인 경우

- 백신을 맞아도 코로나 예방에 효과가 없는데, 효과가 있다고 판별

2종 오류

- 귀무가설이 거짓이면서, 판별 결과는 인 경우

- 백신을 맞으면 코로나 예방에 효과가 있지만, 효과가 없다고 판별

 

두 가지 오류를 비교했을 때, 어떤 오류가 더 심각한 결과를 초래할까?
답은 1종 오류일 것이다.

2종 오류의 경우, 백신이 효과가 있어도 없다고 판별하는 것도 물론 문제일 것이다.
하지만, 이는 백신으로 하여금 2차적인 부작용이나 다른 일들을 초래할 경우들을 줄

왜나면 1종 오류의 경우, 효과가 없는데 있다고 믿고 백신을 투여했지만 효과가 나타나지 않고
부작용 등 오히려 큰 문제를 야기시킬 수 있다. 
그렇기 때문에 2종 오류보다 더 심각한 오류인 1종 오류를 주로 통제하려고 한다.

앞서 이야기 한 p-value(p값)도 1종 오류를 통제하기 위해, 보통 0.05 혹은 0.01 미만으로 제한한다.
즉, 백신에 대한 효과가 없는데 효과가 있다고 판단할 확률(1종 오류일 확률)을 대략 5% 혹은 1% 미만일 때
해당 가설을 채택한다는 의미와 같다.

1종 오류는 실제로 일이 일어나지 않았지만, 일이 일어났다고 판단.
2종 오류는 실제로 일이 일어났음에도 불구하고, 일이 일어나지 않았다고 판단.

 

'Statistics' 카테고리의 다른 글

[통계] 귀무가설과 대립가설  (0) 2023.05.08
[통계] 중심극한정리  (0) 2023.05.02
[통계] 평균(Average)과 중위수(Median)  (0) 2023.04.16
[통계] MSE / MAE / RMSE  (0) 2022.05.27
[통계] 다중공선성(Multicollinearity)  (0) 2022.05.22
Comments