1 개요

平均. Mean, Average

두 개 이상의 숫자의 중간 수치를 정하는 방법 중 하나로 일반적으로 산술평균, 기하평균, 조화평균 세 가지가 있다.

영어로는 average 혹은 mean이라고 하는데 average는 아래의 세 평균(mean) 이외의 중앙값(median)이나 최빈값(mode)를 포함하는 대표값이란 의미로 쓰이기도 한다. 통계학에서는 보통 뮤라는 그리스 대문자를 쓰지만, 추론통계학의 경우 그냥 m 이라고 쓴다. 경우에 따라서는 그냥 관찰값을 의미하는 알파벳 위에 선을 쭈욱 그어 놓기도 하는데, 이건 바(bar)라고 한다.

2 종류

양수에 대해서 산술 평균 ≥ 기하 평균 ≥ 조화 평균이 성립한다.

2.1 산술 평균

Arithmetic mean
[math]\displaystyle \text{AM}=\frac{1}{n} \sum_{i=1}^{n}a_{i}={a_{1}+a_{2}+\cdots+a_{n}\over n}[/math]

가장 일반적으로 사람들이 생각하는 평균으로 다 합쳐서 개수만큼 나눠서 얻을 수 있다.^[1] 각각의 관찰값들의 총합을 [math]n[/math]으로 나눈 값이라고 말하기도 한다. 어찌보면 당연한 사실이겠지만 모든 관찰값들에 동일하게 임의의 값을 더하거나, 빼거나, 곱하거나, 나눈 뒤 다시 평균을 내면 평균에도 동일한 값이 계산된 결과가 나온다.

산술 평균은 아래와 같은 4가지 특징을 가지고 있다.

1.극단적인 값에 민감하다. 보통 평균과 비교되는 중간값,최빈값과 비교하면 극단적인 값에 더 크게 영향을 받는다. 예를 들어 {1,2,3}에서 평균은 2이고 중간값도 2이다. 하지만 3을 96으로 바꾼 {1,2,96}의 경우에 중간값은 2로 변함없지만 평균은 33으로 매우 크게 변한다.

2.편차의 합이 0이 된다. 분산 참고.

3.분산이 가장 작다. 이 개념은 회귀분석을 배울 때에도 쓰인다. 최빈값 같은 다른 기준으로 분산을 구했을 때보다 항상 분산이 작게 나온다.

4.표본 값이 모집단의 그것과 크게 다르지 않다. 표본을 어떻게 뽑느냐에 따라 평균은 다르게 나올수 있다. 어쩌면 모집단의 평균과 한참 거리가 먼 값이 나올 수도 있다. 이것은 중간값,최빈값 등도 마찬가지이다. 그런데 산술평균은 중간값,최빈값과 비교해서 표본의 상태에 크게 영향을 받지 않는다. 그래서 다른 값들에 비해 모집단의 그것에서 크게 벗어나지 않는다.

2.2 기하 평균

Geometric mean
[math]\text{GM}=\sqrt[n]{{\displaystyle \prod_{i=1}^{n}}a_{i}}=\sqrt[n]{\left(a_{1}a_{2}\cdots a_{n}\right)}[/math]

숫자들을 모두 곱해서 [math]\sqrt[n]{\phantom{\cdots}}[/math] 을 취해서 얻는 평균.^[2]

기하 평균은 예를 들어 연간 경제성장률, 물가인상율, 연간 이자율, 감쇠/증폭율, 백분비, 크기 확대 비율 같이 표본들이 비율이나 배수이고 각 표본값이 연속성/연계성이 있어서 표본들을 곱한 값이 의미가 있는 경우에 주로 쓰인다. 예를 들어 한국의 2000 년 부터 2010년까지 평균경제성장률 등.

2.3 조화 평균

Harmonic mean
[math]\text{HM}=\left(\frac{1}{n}{\displaystyle \sum_{i=1}^{n}}a_{i}^{-1}\right)^{-1}=\frac{n}{\left(\frac{1}{a_{1}}+\frac{1}{a_{2}}+\cdots+\frac{1}{a_{n}}\right)}[/math]

숫자들의 역수의 산술평균을 구한 후 그것을 역수로 취한 평균.^[3] 역수를 취해야 하므로 숫자들 중에 0이 끼어있으면 계산할 수 없다. 또한 각 숫자들이 모두 양수여야만 의미있는 값이 얻어진다.

조화 평균은 기하평균과 같이 표본들이 비율이나 배수이지만 각 표본값은 독립적이고 표본끼리 곱한 값이 의미가 없을 때 그리고 효율이나 속도 처럼 역수가 의미가 있을 때 그리고 각 표본들이 비중이 같을 때 주로 쓰인다. 이런 표본값은 그냥 산술평균을 하면 값이 큰 쪽이 작은 쪽보다 부당하게 높은 비중을 차지하는 것을 시정하고 공정한 평균을 낼 수 있다. 성능이나 효율 속도 시간당 진도 통계 등에 그런 통계가 유효할 때가 많다. 예를 들어 여러 은행의 평균 이자율 이라든지 주식의 평균 주가수익률 이라든지 같은 것을 계산할 때 쓰는게 좋다. 각 표본값들이 비중이 다를 때는 가중조화평균을 사용해야 한다.

2.4 k차 평균

[math]\displaystyle M(k)=\left(\frac{1}{n}{\sum_{i=1}^{n}{a_i}^{k}}\right)^{\frac{1}{k}} \left(k \neq 0\right) ,\ M(0)=\lim_{k\to 0}M(k) [/math]

위 세가지 평균을 일반화한 것으로, 산술평균은 1차평균, 기하평균은 0차평균, 조화평균은 -1차평균이 된다.

2.5 기타 다른 평균들

위의 것들이 평균을 구하는 방법에서 차이가 난다면 여기의 평균들은 대체로 산술평균의 방법을 기본 베이스로 한다. 수식을 이미지로 넣어주실수 있는 분의 추가바람.

가중평균(weighted mean) : 개별 값에 각각 가중값을 곱하고 계산한 평균. 당신이 국어 40점 수학 50점일때 학과에 따라 한쪽에 10%의 가산점을 주고 평균하는 경우가 여기 속한다.
절사평균(trimmed mean) : 평균을 구할때 극단값을 빼고 계산한 평균. 평균을 낼 때 최고점/최저점이나 양 극단의 10% 정도를 잘라내는 것이 여기 속한다. 피겨 스케이팅, 싱크로나이즈드 스위밍, 리듬체조 등 예술적 가치가 높은 스포츠 종목에서 판정단이 점수를 내릴 때 최상위, 최하위 판정자 1명의 점수를 삭제하고 나머지 판정단의 점수로 평균을 내는 것이 이것이다. 물론 모집단 수는 2를 뺀다.

3 기타

400px
출처

심리학자들은 많은 사람들의 얼굴 사진을 하나로 모아서 컴퓨터로 평균을 냈을 때__ 완성되는 얼굴이 바로 가장 잘생긴/아름다운 얼굴이라고 사람들이 느낀다고 생각하고 있다. 즉 코의 위치의 평균, 눈썹 모양의 평균, 안면 윤곽의 평균 등을 모두 모아서 하나의 얼굴 사진으로 조합하면 된다는 것. 즉 못생긴 얼굴은 평균보다 심하게 광대뼈가 튀어나왔거나, 미간이 넓거나(…), 입술이 두껍거나 등등의 이유가 있기 때문이며, 이 때문에 못생긴 얼굴을 두고 개성있는 얼굴이라고 말하는 것은 나름의 과학적 이유가 있게 된다.(…)

위의 사진들을 보면서 많은 사람들이 "나는 평균을 깎아먹는 외모였구나, 미안하다"(…) 같은 반응을 보이곤 하는데, 좌절하지 말자. 상기했듯이 평균적인 외모 ≠ 보통 외모다. ~~반대로 잘생긴 연예인들이 "나는 딱 평균만큼만 잘생겼다고 생각해요" 라고 말하는 것은 "나는 존내 잘생겼어염 데헷" 이라는 뜻이다.~~ ~~대부분의 남자들이 자신의 얼굴이 평균 이상은 된다라고 생각 한다면 얼마나 잘생겼다고 생각하는 걸까~~

150px	250px
소녀시대 멤버 9명의 얼굴 평균	AKB48 멤버 59명의 얼굴 평균

출처 링크에 들어가면 ~~간단한 영어 지문과 함께~~ 카라, 브라운아이드걸스, 씨스타의 얼굴 평균도 볼 수있다.

물론 평균을 이용하지 않더라도 몽타주 프로그램을 활용하거나 설문조사를 하거나 심지어 황금비율을 활용하는 등 최고의 얼굴을 만드는 방법은 얼마든지 있다.

↑ 독립변수가 연속인 경우 확률변수를 확률측도에 대해 적분한 것으로 정의한다.
↑ 연속변수의 경우 확률변수에 p제곱을 한 뒤에 적분한 것을 다시 p제곱근을 취하고 나서 독립변수의 측도로 나눠준 뒤 p를 0으로 보내면 된다.
↑ 연속변수의 경우 확률변수에 역수를 취한 것을 확률측도에 대해 적분한 뒤 다시 역수를 취한 후 독립변수의 측도로 나눠주면 된다.

[1] 독립변수가 연속인 경우 확률변수를 확률측도에 대해 적분한 것으로 정의한다.

[2] 연속변수의 경우 확률변수에 p제곱을 한 뒤에 적분한 것을 다시 p제곱근을 취하고 나서 독립변수의 측도로 나눠준 뒤 p를 0으로 보내면 된다.

[3] 연속변수의 경우 확률변수에 역수를 취한 것을 확률측도에 대해 적분한 뒤 다시 역수를 취한 후 독립변수의 측도로 나눠주면 된다.

[1]

[2]

[3]

평균

목차