사진은 정규분포의 확률 밀도 함수.
목차
1 개요
연속 확률변수를 나타내는 함수. 확률 질량 함수의 연속형 version.
2 정의
(절대)연속확률변수 X에 대해서 [math] F(x) [/math]가 누적분포함수 일때
X의 확률밀도함수 [math] f (x) [/math]는
[math] F(x) =\int _{ -\infty }^{ x }{f(t)dt }[/math] 로 정의한다.
여기서 미분불가능한 지점은 기껏해야 셀 수 있어야 하며 그 지점에서의 f의 값은 어느값이어도 제한이 없으나 통상적으로
좌연속이거나 우연속이 되도록 지정해준다.
3 절대 연속 조건
보통의 이공계에서는 (절대)라는 조건을 생략하고 그냥 가르치는 경우가 많다. 하지만 위의 정의의 식이 말이되게하는 f가 존재할려면 반드시 F의 절대연속성이 보장되어야 한다. 따라서 절대연속의 개념을 첨부한다.
4 의미
어떤 확률변수X를 완벽하게 묘사하는 함수는 누적분포함수(CDF) [math] F(x) [/math]이다. 이는 X가 이산이든 연속이든 이산과 연속이 섞인 형태이든 변하지않는 진리이다. 하지만 실제 상황이나 문제에서는 CDF를 다루는 상황보다 확률밀도함수(pdf)를 다루는 경우가 훨씬 많다. 그러므로 확률밀도함수의 개념을 이해하는것은 매우 중요하다.
이 개념에 확률 '밀도' 함수라는 개념이 붙은 이유를 알아야 하는데 이는 확률 '질량'함수에서의 이유와 같다. 기본적으로 연속형 확률변수의 경우에는 개별 값들에 대한 확률값이 존재하지 않는다. 연속의 경우에는 반드시 구간단위로 확률이 존재할 수 밖에 없는데 확률밀도 함수는 특정 지점에대한 값을 말한다.
직관적으로 자연스럽게 pdf의 값은 x주변의 미소구간에서의 미소확률(질량)에대한 밀도값이라는것을 알 수 있다.
즉 밀도=질량/부피 와 동일하게 pdf=미소확률/dx 인 것이다. 여기서 미소구간길이dx가 부피에 해당된다.
그러므로 [math]f(x)=\lim _{ \Delta x\to 0 }{ \frac { P(x\le X\le x+\Delta x) }{ \Delta x } }=\lim _{ \Delta x\to 0 }{ \frac { F(x+\Delta x)-F(x) }{ \Delta x } }=\frac { dF }{ dx } [/math]이므로 정의의 그것과 일치한다.
한마디로 말하면 그냥 질량/부피 다.