[통계] 1종 오류, 2종 오류
지난 번, 가설 검정의 귀무가설과 대립가설에 대해 살펴보았다.
* 관련 글
- https://2nan.tistory.com/115
[통계] 귀무가설과 대립가설
데이터를 분석하는데 있어 중요한 부분은 무엇을 검증하기 위하냐가 문제일 것이다. 어떠한 데이터를 분석을 해야 한다면, 결론을 만들어야 할 것이고 그에 따른 가설을 세워야 한다. 그런 다음
2nan.tistory.com
이번엔 해당 가설들을 채택하는데 있어 고려하게 되는 오류들에 대해 살펴본다.
1종 오류와 2종 오류
지난 번 귀무가설과 대립가설을 설명할 때 들었던 예시를 다시 살펴보자.
귀무가설은 "백신을 맞아도 코로나에 대한 면역 효과는 없다."
대립가설은 "백신을 맞은 사람은 코로나에 대한 면역 효과가 있다."
이 때, 총 4가지의 상황이 발생할 수 있다.
참 | 거짓 | |
귀무가설 채택 | True | False (1종 오류) |
귀무가설 기각 | False (2종 오류) | True |
- 귀무가설이 참이면서, 판별 결과도 참일 경우
-> 결과적으로 옳음 (True) - 귀무가설이 참인데, 판별 결과는 거짓일 경우
-> 오류! (False) - 귀무가설이 거짓인데, 판별 결과는 참일 경우
-> 오류! (False) - 귀무가설이 거짓이면서, 판별 결과는 거짓일 경우
-> 결과적으로 옳음 (True)
1종 오류
- 귀무가설이 참이면서, 판별 결과는 거짓인 경우
- 백신을 맞아도 코로나 예방에 효과가 없는데, 효과가 있다고 판별함
2종 오류
- 귀무가설이 거짓이면서, 판별 결과는 참인 경우
- 백신을 맞으면 코로나 예방에 효과가 있지만, 효과가 없다고 판별함
두 가지 오류를 비교했을 때, 어떤 오류가 더 심각한 결과를 초래할까?
답은 1종 오류일 것이다.
2종 오류의 경우, 백신이 효과가 있어도 없다고 판별하는 것도 물론 문제일 것이다.
하지만, 이는 백신으로 하여금 2차적인 부작용이나 다른 일들을 초래할 경우들을 줄
왜나면 1종 오류의 경우, 효과가 없는데 있다고 믿고 백신을 투여했지만 효과가 나타나지 않고
부작용 등 오히려 큰 문제를 야기시킬 수 있다.
그렇기 때문에 2종 오류보다 더 심각한 오류인 1종 오류를 주로 통제하려고 한다.
앞서 이야기 한 p-value(p값)도 1종 오류를 통제하기 위해, 보통 0.05 혹은 0.01 미만으로 제한한다.
즉, 백신에 대한 효과가 없는데 효과가 있다고 판단할 확률(1종 오류일 확률)을 대략 5% 혹은 1% 미만일 때
해당 가설을 채택한다는 의미와 같다.
1종 오류는 실제로 일이 일어나지 않았지만, 일이 일어났다고 판단.
2종 오류는 실제로 일이 일어났음에도 불구하고, 일이 일어나지 않았다고 판단.