본문 바로가기

Information/통계

평균과 기댓값

반응형
이 글은 예전에 작성해두었던 글을 좀 보완해서 재 작성하고, 설명 내용을 애니메이션으로 새롭게 만들어서 첨부한 글입니다.

설명글을 쭉 읽어도 되고, 이 페이지의 맨 밑에 있는 애니메이션 동영상만 봐도 됩니다.

 

평균기댓값은, 아마도 통계에서 가장 먼저 접하고, 가장 많이 쓰게 되는 용어일 것입니다.

 

그럼에도 불구하고, 종종 "평균과 기댓값은 같은 건가?"라는 질문을 받으면, 좀 헷갈립니다. 확실히 알아보겠습니다.

 

예전에는 '기대값'으로 표기했으나, 이제는 '기댓값'이 맞습니다.
2008년부터, 수학 용어들도 표준 맞춤법의 사이시옷 규칙에 맞게 표기하도록 교과서가 개정되었기 때문.

같은 이유로, '최댓값' '최솟값' '대푯값' '근삿값' '절댓값' 함숫값' 등이 맞는 표기입니다. 

 

평균

(산술)평균은, 어떤 자료가 있을 때, 이 자료를 대표하는 값 중의 하나로, 모든 자료의 값을 더한 것을 자료의 개수로 나눈 값입니다.

 

$N$개의 자료가 있고 $i$번 째 자료의 값을 $x_i$라고 할 때, 평균 m(mean)은 다음과 같이 표현됩니다.

 

$$ m = \frac{1}{N} \sum _{i=1}^{N}{ {x}_{i} } $$

 

- 자료를 대표하는 값으로 평균외에도 '중앙값' '최빈값'이 있습니다.
- 평균의 종류에는 '산술평균'외에 '기하평균' 조화 평균' 등이 있고, 또한 표본에 대한 평균이냐 아니면 모집단에 대한 평균이냐는 세세한 구분이 있을 수 있습니다.
- 여기서는, 표본/모집단에 대한 구분을 하지 않으며, 산술평균만을 설명합니다.

 

기댓값

기댓값은, 확률적 사건에 대한 평균으로, 전체 사건에 대해, 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 합한 값입니다.

 

$N$개의 사건이 있을 수 있고, i번째 사건의 값을 $x_i$라하고, $x_i$에 대한 확률값을 $P(x_i)$라고 할 때, 기댓값 $E(x)$ 는 다음과 같이 표현됩니다. 

(E:Expectation, P:Probability)

 

$$ E(x)= \sum _{ i=1 }^{ N }{ { x }_{ i }P({ x }_{ i }) } $$

 

평균기댓값의 수식 표현에 있어서 $x_i$가 동일하게 사용되었는데, 각각 의미가 다름에 주의합니다.

평균에 사용된 $x_i$는 $i$번째 자료의을 의미하고, 기댓값에서의 $x_i$는 자료의 값이 아닌 $i$번째 사건의 값을 의미합니다.

즉, 평균에서의 $x_i$는 i번째 주사위를 던졌을 때 나온 값이고, 기댓값에서는 주사위를 던졌을 때 나올 수 있는 사건인 {1, 2, 3, 4, 5, 6}이 $x_i$의 값이 됩니다.

 

평균과 기댓값 비교

 

위에서 살펴본 바와 같이, 평균은 '확률'이라는 개념이 들어가지 않은 개념입니다.

그냥, 자료값들이 있을 때, 이 값들을 전부 더해서 개수로 나눈 것입니다.

 

반면에, 기댓값은 '확률적인 사건'에 대해서 어떤 사건이 일어날 것에 대해 기대되는 값입니다.

 

그럼, '평균'과 '기댓값'은 같다는 걸까요? 아니면 다르다는 걸까요?

 

답은, 같은 값을 가지지만, 사용되는 성격과 정의가 다르다는 것입니다.

 

예제를 가지고 살펴보겠습니다.

 

예)
1. 주사위가 있다. 주사위를 한 번 던졌을 때 기대되는 값을 구하라. (주사위에는 1~6까지 수가 있고, 각 수가 나올 확률은 동일하다고 가정)

2. 주사위를 10번 던졌더니 다음과 같은 값이 나왔다. 기댓값과 평균을 구하라.
   1, 2, 3, 4, 5, 6, 1, 2, 3, 4

 

1번 문제 풀이

기댓값은, 모든 나올 수 있는 값에, 그 확률을 곱하면서 더하면 됩니다.

 

주사위를 던졌을 때 나올 수 있는 값은 (1, 2, 3, 4, 5, 6) 이렇게 6가지입니다. 각각에 대한 확률은 $ \quad {1}/{6} $ 

따라서, 기댓값을 $E$라고 하면,

 

$${ E=(1\times \frac { 1 }{ 6 } )+(2\times \frac { 1 }{ 6 } )+(3\times \frac { 1 }{ 6 } )+(4\times \frac { 1 }{ 6 } )+(5\times \frac { 1 }{ 6 } )+(6\times \frac { 1 }{ 6 } )=\frac { 21 }{ 6 } =3.5 }$$

 

 

2번 문제 풀이

1번 풀이와 마찬가지로, 기댓값은 나올 수 있는 값에 확률을 곱하면서 더하면 됩니다.

 

나올 수 있는 값은 1에서 6까지의 값이고 확률은 계산을 해야 합니다. (주사위이기에 각각 확률이 1/6이라고 생각하기 쉬운데, 여기서는 10번 던졌을 때 나온 사건만을 가지고 확률 계산을 하는 것입니다.)

 

확률 값은 "어던 사건이 나올 경우의 수를, 전체 경우의 수로 나눈 값"입니다. 따라서 각 수에 대해 나올 확률은,

 

1: 2/10 (두 번 나왔기에)

2: 2/10

3: 2/10

4: 2/10

5: 1/10 (한 번 나왔음)

6: 1/10

 

따라서 기댓값 E는,

 

$${ E=(1\times \frac { 2 }{ 10 } )+(2\times \frac { 2 }{ 10 } )+(3\times \frac { 2 }{ 10 } )+(4\times \frac { 2 }{ 10 } )+(5\times \frac { 1 }{ 10 } )+(6\times \frac { 1 }{ 10 } )=\frac { 21 }{ 6 } =\frac { (2+4+6+8+5+6) }{ 10 } =3.1 }$$

 

평균 m은, 모든 값을 더한 후 던진 횟수로 나누면 됩니다. 

 

$$ m = \frac { (1 + 2 + 3 + 4 + 5 + 6 + 1 + 2 + 3 + 4)} { 10 } = \frac {31} {10} = 3.1 $$

 

해석

1번 문제에서는 주사위를 던졌을 때 나올 수 있는 기댓값을 물어보고 있습니다.

 

계산된 값은 3.5.

 

즉, 주사위를 많이 던지면 평균적으로 3.5 정도의 값이 된다는 의미.

 

이때, '평균을 구하시오'라고 했다면 구할 수 있을까요?

 

엄밀하게 말하면 구할 수 없습니다. 왜냐면, 시행되는 횟수를 모르거나 무한대이기 때문입니다.

(정의대로 평균을 구하려면, 나온 값을 전부 더한 후, 시행된 횟수로 나눠야 하기에)

 

그러나, '무한하게 던졌을 때 기대되는 평균값을 구하시오'라고 했다면, 기대값을 구하라는 얘기이고, 이것은 구할 수 있습니다.(무한히 던졌을 때 예상되는 각 값의 확률이 1/6 임을 알 수 있기에)

 

 

2번 문제에서는, 주사위를 10번 던진 경우입니다. 이때 기댓값평균은 같은 값으로 3.1이 계산되었습니다.

 

즉, 이 경우, 기댓값과 평균이 같은 값이고, 같은 의미가 됩니다.

 

정리하면, 일반적으로 '평균'과 '기댓값'은 같은 값을 가집니다.

그러나, '평균'은 "조사된 값들에 대해서 평균이 얼마인가"처럼, 확률적인 개념이 없을 때 쓰이고,

'기댓값'은 각 사건들이 일어날 확률들을 가지고 있는 경우, 그 기대되는 값을 표현할 때 쓰입니다.

 

따라서, 확률 개념이 들어가는 통계에서는, 대부분 '평균'이라는 표현이 아닌 '기댓값'이라는 표현으로 사용됩니다.

 


위에서 설명한 평균과 기댓값에 대한 내용을 애니메이션으로 작성해봤습니다. 

이해하기가 보다 편할 것입니다. 

 

 

-끝-

반응형