본문 바로가기

Information/통계강의

2.2 가설 검정

반응형

가설 검정 (정확한 표현으로는 통계적 가설 검정)은, 표본의 정보를 이용해서 모집단의 실제의 값을 추정하는 통계적 추측 방법이다.

 

쉽게 얘기하면, 어떤 모집단에 대한 특성이 이러이러하다고 얘기하고 싶은데, 모집단은 덩치가 너무 커서 전부 조사할 수 없으니, 일부 표본을 샘플링해서 조사한 후, 그 표본이 이러이러한 특성을 가지니, 모집단도 이러할 것이다라는 것을 추론하는 것이다.

 

그런데, 가설검정의 방법은 좀 규격화되어 있다. 어떻게 규격화되어 있냐 하면,

1) 기각하고 싶은(=부정하고 싶은) 것을 귀무가설(null hypothesis)로 두고, 그 반대되는 것(=찬성하고 싶은 것)을 대립 가설로 둔다.

2) 표본에 대해 실험한다.

3) 귀무가설이 맞다고 했을 때, 실험처럼 나올 확률을 구한다.

4) 위 3번에서 구한 확률 값의 크기를 가지고, 귀무가설을 기각할지 여부를 판단한다. (예를 들어, 확률이 낮으면, 그런 결과가 나올 확률이 매우 낮기에, 귀무가설이 맞지 않다고 주장)

 

가설검정에서는 기각하고 싶은(=부정하고 싶은) 것을 귀무가설로 두고, 그 반대되는 것을 대립 가설로  해서 실험하고, 실험 결과가 귀무가설을 참으로 했을 때는 확률상으로 나오기 힘든 결과를 보인다면, 귀무가설을 기각하고 대립 가설이 맞다고 한다. 반면에, 실험 결과가 확률적으로 봤을 때 나올 수도 있는 범위의 값이라고 한다면, 귀무가설이 맞다고 보고 채택한다.

 

여기서 중요한 것은, 틀리다고 증명하고 싶은 것을 '귀무가설'로 세운다는 것이다.

 

귀무 가설(null hypothesis는 영국 통계학자인 로널드 피셔란 통계학자에 의해서 처음 사용된 용어인데 '실험에 의해 맞다고 증명할 수 없는 가설'이라는 의미에서 null hypothesis라고 했다 한다. 즉, 어떤 가설이 있는데 이를 통계적 실험으로 '맞다'는 것은 증명할 수 없고, 대신 '틀리다'는 것은 증명할 수 있다는 점에서 null hypothesis라고 했다는 거다. 

'숙녀들이 우유를 먼저 넣은 차인지 아닌지를 구분할 수 없다'라고 가설을 세웠다면, 이 가설이 맞다고 보고 실험을 한 후, 그 결과를 봤을 때 '가설이 맞다고 한 것'을 '부정'은 할 수 있는데, '가설이 맞다는 것(...차인지 구분할 수 없다)'는 것은 증명할 수 없다는 데서 null hypothesis라고 했다는 거다. 

그러나, 현대의 가설검정에서의 '귀무 가설'은 '대립 가설'의 반대 의미만을 가질 뿐, 결코 '증명하지 못할' 가설은 아니다. 실험의 결과로 귀무가설이 맞다고 얘기할 수 있다. (그렇지만 실험의 본 목적은 귀무가설이 틀리다는 것을 증명하려 함에는 변함이 없다)

 

  • 귀무가설(null hypothesis) :  틀리다는 것을 증명하고 싶은 가설
  • 대립 가설(alternative hypothesis): 귀무가설의 반대편에 있는 가설. 맞다고 증명하고픈 가설

가설 수립 예

 

어떤 국회의원이 "제안된 세법은 조세수입에 영향을 주지 않는다. 즉, 조세수입을 증가시키지도 감소시키지도 않는다"고 주장하고 있는데, 이 국회의원이 얘기한 것이 진짜 맞는지 검정하고 싶다. 

* "진짜 맞는지 검정하고 싶다"라고 했기에, 사실 맞지 않는 거 같다고 생각하는 것. 즉, 틀리다는 것을 증명하고픈 것.

 

  - 귀무가설: 제안된 세법은 조세수입을 증가시키지도 감소시키지도 않는다. 

  - 대립 가설: 제안된 세법은 조세수입을 변화시킨다. 즉, 증가 혹은 감소시킨다.

 

 


귀무가설에 대한 기각

 

가설검정은, 귀무가설이 맞다고 본 상태에서 실제 표본의 통계 값이 얼마나 비정상적인 값인가를 보여줌으로써, 원래의 귀무가설이 틀렸다는 것을 보이고자 하는 방법이라고도 할 수 있다.

 

"귀무가설이 맞다고 한다"는 의미는, 예를 들어 귀무가설이 "제품의 무게가 50g이다"라고 한다면 "그 제품들에 대해서 표본을 뽑아서 평균을 재면 50g을 기준으로 해서 정규분포를 그릴 것이다."라는 말과 같다. (앞 페이지에서 살펴본 '중심 극한 정리'에 의하면, 모집단의 분포와 상관없이, 표본 평균의 분포는 모평균을 중심으로 한 정규분포를 띤다)

 

즉, 귀무가설이 맞다면, 표본 평균들의 분포 곡선을 그려보면 아래와 같이 돼야 한다.

 

 

귀무가설에서 주장하는 50g을 중심으로 한 정규분포 모양이 돼야 한다. 표본을 뽑아서 평균을 구해보면, 대략 50g 언저리에 있을 가능성이 높다는 의미이다.

 

그런데 만일, 표본을 뽑아서 그 표본의 평균을 계산해봤더니, 50g 보다 매우 작은 값, 혹은 매우 큰 값이라면, 이는 가정 자체가 잘 못되었다고 보는 것이다. 즉, 관찰된 표본 평균이 위 그림에서 기각역에 해당하는 매우 이상한 값이라면, 이는 정상적으로 나올 수 없는 확률 값이기에, 원래 가정한 '50g을 중심으로 정규분포를 그릴 것이다'라는 것 자체가 잘못되었다는 것으로 유추하는 것이다. 결국 귀무가설이 잘 못 되었다는 것

 

p-value(유의 확률)

p-value는, 귀무가설이 맞다는 가정하에서, 표본에서 관찰되는 통계 값과 같거나 더 극단적인 값이 나올 수 있는 확률을 말한다. 위 그림에서는 '기각 역'의 합 면적에 해당하는 값이다. 만약 귀무가설을 채택할 수 있는 신뢰 수준을 95%로 했다면, 표본에 의해 관측된 통계 값이 신뢰구간 안에 있어야만이, 원래 주장된 귀무가설이 채택될 수 있는 것이고, 만약 그 통계 값이 존재할 확률(p-value)이 5% 미만이라면, 귀무가설을 기각하는 것이다.

 

따라서, 어떤 표본에 대해서 p-value를 구했을 때 아주 작은 값이면(95% 신뢰구간이면 5% 미만) 귀무가설을 기각하는 것이다.

 


지금까지 살펴본 가설검정을 이용해서, 크게 2가지 부류의 검정이 수행된다. 

하나는 어떤 자료의 평균을 검정하는 것. 다른 하나는 독립성, 정규성, 연관성 등 자료의 특성을 검정하는 것

 

이 두 가지에 대해서 다음 글에서 알아볼 것이다.


-끝-

 


다음 글: 2.3 평균에 대한 검정

 

반응형

'Information > 통계강의' 카테고리의 다른 글

2.3.1 Z-검정  (0) 2021.02.21
2.3 평균에 대한 검정  (0) 2021.02.17
2.1 분포 (예제 풀이)  (0) 2021.02.15
2.1 분포 (이론)  (0) 2021.02.14
2. 분포 및 가설검정  (0) 2021.02.14