1 개요
자료값들이 대표값으로부터 어느정도 떨어져 있는지를 나타내는 수치 중의 하나.
2 산식
[math] \frac{{|x_1 -m|} + {|x_2 -m|} + \cdot \cdot \cdot + {|x_n -m|} }{n} [/math]
3 표준편차와 평균편차의 용도차이
중, 고교 수학시간에 표준편차에 대해서 배운다(평균편차에 대해서는 배우지 않는다).
이 때 수학적 센스가 있는 학생이라면 '왜 편차를 구할 때,[math] \frac{{|x_1 -m|} + {|x_2 -m|} + \cdot \cdot \cdot + {|x_n -m|} }{n} [/math] 으로 구하지 않고, 굳이 [math] \sqrt{ \frac{{(x_1 -m)}^{2} + {(x_2 -m)}^{2} + \cdot \cdot \cdot + {(x_n -m)}^{2} }{n} } [/math] 처럼 번거로운 식을 사용할까?'라는 의문을 가져본 경우가 있을 것이다. 사실 이러한 의문에 대해서 중고교에서 제대로 된 설명을 해주는 경우는 드물다. 물론 이러한 의문을 가지는 학생자체가 드물다(...) 이하에서는 이에 대한 설명을 하고자 한다.
우선 편차의 뜻을 알아야 한다. 편차란 자료값들이 특정값[1]으로부터 떨어진 정도를 나타내는 수치이다. 이를 구하는 방법에는 대표적으로 두가지가 있다. 각각의 자료값에서 특정값을 뺀 값의 제곱을 모두 더한 뒤 이의 평균을 구하는 방법[2]과, 각각의 자료값에서 특정값을 뺀 값의 절대값을 모두 더한 뒤 이의 평균을 구하는 방법[3]이다. 전자의 방법은 [math] \frac{{|x_1 -X|} + {x_2 -X|} + \cdot \cdot \cdot + {|x_n -X|} }{n} [/math] 으로 나타낼 수 있고, 후자의 방법은 [math] \sqrt{ \frac{{(x_1 -X)}^{2} + {(x_2 -X)}^{2} + \cdot \cdot \cdot + {(x_n -X)}^{2} }{n} } [/math] 로 나타낼 수 있다. (여기서 X는 특정값을 의미한다.)
편차의 뜻을 알았다면 이젠 대표값의 개념을 이해해야 한다. 대표값은 편차를 최소로 만드는 값을 말한다. 한편 편차를 전자의 방식으로 구한다면, 대표값은 평균(m), 즉 [math] \frac{x_1 + x_2 + \cdot \cdot \cdot + x_n } {n} [/math]이 된다. 반면 편차를 후자의 방식으로 구한다면, 이 때의 대표값은 중앙값(c)이 된다. (증명은 생략)
마지막으로 산포도의 개념을 이해해야 한다. 산포도란 자료값들이 대표값으로부터 떨어진 정도를 말한다. 즉 편차의 정의인 '자료값들이 특정값으로부터 떨어진 정도'에서 특정값 대신 대표값을 넣으면 그것이 산포도이다. 따라서 편차를 전자의 방식으로 구하고자 한다면, 그 때의 대표값은 평균값(m)이 되고, 이 때의 산포도는 [math] \frac{{|x_1 -m|} + {|x_2 -m|} + \cdot \cdot \cdot + {|x_n -m|} }{n} [/math] 이 된다. 이것이 바로 평균편차이다. 반면 편차를 후자의 방식으로 구하고자 한다면, 그 때의 대표값은 중앙값(c)이 되고, 이 때의 산포도는 [math] \sqrt{ \frac{{(x_1 -m)}^{2} + {(x_2 -m)}^{2} + \cdot \cdot \cdot + {(x_n -m)}^{2} }{n} } [/math] 이 된다. 이것이 바로 표준편차이다.
따라서 평균편차는 자료값들이 평균으로부터 떨어진 정도를 알아볼 때 이용하는 것이고, 표준편차는 자료값들이 중앙값으로부터 떨어진 정도를 알아볼 때 이용하는 것이다.