산포도

산포도의 반댓말은? 염기포도 죽은포도 바다포도 강포도 산포도를 영어로 하면? Mountain Grape 안나올 리가 없지 반에서 한 명은 기어코 이 개드립을 포기하질 않는다

Degree of scattering
散布度

1 개요

2 범위

3 사분편차

4 평균편차

5 분산과 표준편차

[math]\text{Var}=\sigma^{2}=\frac{\text{SS}}{N}=\frac{\sum_{i}\left(x_{i}-\mu\right)^{2}}{N}[/math][1]
[math]\sigma=\sqrt{\text{Var}}[/math]
통계학에서 평균과 표준편차는 기본적인 개념이다.
겁먹지 마 안물어[2]

분산은 쉽게 말하면 편차의 제곱의 평균이고, 표준편차(stdev; standard deviation)[3]는 짧게 말해서 분산에 루트를 씌운 것이다. 분산에서 왜 제곱을 하는지 알고 있다면, 표준편차에서 왜 루트를 씌우는지도 알 수 있다. 분산을 구하는 과정에서 마이너스 기호를 떨구기 위해 임의로 뻥튀기를 해 놓았으니, 이제 그 값을 도로 원상복구(…)시켜야 하는 것이다. 즉 제곱해서 커져 버린 값에 루트를 씌워서 도로 쪼그라들게 만들면 비로소 우리가 본래 알고 싶어하던 편차의 평균이 얻어지게 되는 것이다. 통계학자들은 쓸데없이 어려워 보이도록 시그마 소문자 기호로 표준편차를 표시하는데, 위에 서술한 바에 의해서 분산의 경우는 시그마 제곱으로 표현된다.

편차제곱을 먼저 합치고 루트씌운 것을 루트 자료개수로 나눈 것과, 편차제곱 각각을 루트씌운 다음에 합쳐서 자료개수로 나눈 것이 과연 같은지는 의문이다. 편차제곱 각각을 루트를 씌우면 그냥 편차가 되고 편차의 합은 0이니까 평균도 0이잖아 직접 해보면 될거아냐

표준편차의 경우, 모든 관찰값에 동일한 상수를 똑같이 더하거나 빼는 것은 영향을 받지 않지만, 똑같이 곱하거나 나누게 되면 표준편차도 동일하게 영향을 받는다. 모든 수에 2를 곱한다면 표준편차도 2가 곱해진 새로운 값으로 구해지게 된다.

6 변동계수

  1. [math]\mu[/math]는 산술평균이다.
  2. 위의 수식은 모집단에서의 분산과 표준편차를 다룬다.
  3. 표준오차(standard error)와는 다르다. 이쪽은 추론통계학에서 수많은 표본평균들의 편차를 구함으로써 모평균 "뮤" 를 추정할 때 쓰인다. 이 경우 시그마 소문자에다 아래첨자로 m 을 붙여서 표기하며, 루트 씌운 표본관측값의 수로 표본표준편차를 나누면 된다.