미분

(연쇄 법칙에서 넘어옴)

혹시 f(x)을(를) 찾아오셨나요?

1 개요

微分(작을 미, 나눌 분)[1]/Differentiation
'쌀 미' 에 '가루 분' 이 아니다! 쌀가루?
미칠듯이 분노하는 것

한 지점의 변화율을 알기 위해 쓰이는 개념이다.
미분을 알기 위해서는 우선 몇 가지 개념들에 대한 이해가 필요하다.

2 변화율과 미분계수

변화율이란 어떤 변수들이 변화한 정도의 비이다. 예를 들어 함수 [math]y=x^{2}[/math]에서 [math]x[/math]의 값이 [math]1[/math]부터 [math]3[/math]까지 변하면 [math]y[/math]의 값은 [math]1[/math]부터 [math]9[/math]까지 변화한다. 이때 독립변수 [math]x[/math]의 변화량은 [math]2[/math]이며, 이를 [math]x[/math]의 증분이라 하고 그리스 문자 [math]\Delta[/math](델타, Delta)를 사용하여 [math]\Delta x[/math]로 나타낸다. 또, 종속변수 [math]y[/math]의 변화량인 [math]8[/math][math]\Delta x[/math]에 대한 [math]y[/math]의 증분이라 하고, [math]\Delta y[/math]로 나타낸다. 이때 [math]y[/math]의 증분 [math]\Delta y[/math][math]x[/math]의 증분 [math]\Delta x[/math]로 나눈 [math]\displaystyle{{\Delta y \over \Delta x}=4}[/math]를 닫힌 구간 [math]\left[1,3\right][/math]에서의 y의 평균변화율이라고 한다. 이때, 이 값은 [math]y=x^{2}[/math] 위의 두 점 [math]\left(1,1\right)[/math], [math]\left(3,9\right)[/math]를 지나는 직선의 기울기와 같다. 일반적인 평균변화율의 정의는 다음과 같다.

함수 [math]y=f\left(x\right)[/math]에서 [math]x[/math]의 값이 [math]a[/math]부터 [math]a+\Delta x[/math]까지 변할 때, [math]\displaystyle {\Delta y \over \Delta x} = {f\left(a+\Delta x\right)-f\left(a\right) \over \Delta x} [/math]를 구간 [math]\left[a,a+\Delta x\right][/math]에서의 [math]y[/math]평균변화율이라고 한다.

이때 평균변화율은 두 점 [math]\left(a, f\left(a\right)\right)[/math], [math]\left(a+\Delta x, f\left(a+\Delta x\right)\right)[/math]을 잇는 직선의 기울기와 같다. 만약 [math]x[/math]의 증분의 절댓값인 [math]\left|\Delta x\right|[/math]를 아주 작게 하면, 즉 [math]\Delta x\to 0[/math]일 때, 평균변화율 [math]\displaystyle \frac{\Delta y}{\Delta x}[/math]의 극한값을 생각할 수 있다. 이를 함수 [math]f\left(x\right)[/math][math]x=a[/math]에서의 순간변화율이라 한다.

x=a에서 연속하는 함수 [math]y=f\left(x\right)[/math]에 대해 [math]\displaystyle\lim_{\Delta x\to 0}\frac{\Delta y}{\Delta x} = \lim_{\Delta x\to 0}\frac{f\left(a+\Delta x\right)-f\left(a\right)}{\Delta x}[/math]의 값이 존재할 때, 함수 f(x)는 x=a에서 미분가능(Differentiable)하다고 하며, 이때 이 극한값을 함수 [math]f\left(x\right)[/math][math]x=a[/math]에서의 순간변화율, 변화율 또는 미분계수라 한다.

이를 기호 [math]f'\left(a\right)[/math], [math]\left.y'\right|_{x=a}[/math], [math]\displaystyle\left[ {dy \over dx} \right] _{x=a}[/math]로 나타낸다. 어떤 점에서의 순간변화율은 그 점에서의 접선의 기울기와 같다.

2.1 알기 쉬운 설명

어떤 그래프 [math]f\left(x\right)[/math]가 있다고 할때, x축에 [math]a[/math][math]b[/math]가 있어 그래프 상에서 점[math]A[/math], 점[math]B[/math]로 나타나며, 점[math]A=\left(a, f\left(a\right)\right)[/math][2][math]B=\left(b, f\left(b\right)\right)[/math]이고, 둘을 이은 직선이 있다면 [math]A[/math]부터 [math]B[/math]까지의 x증가량 분의 y증가량은 해당 직선의 기울기이다. 여기서 x증가량=[math]\Delta x[/math], y증가량=[math]\Delta y[/math]으로, 어떤 변수의 증가량을 나타내려면 델타를 붙여주자.
미분에서는 이 기울기를 변화율이라고 부르게 되는데 여기서 평균변화율=그래프 전체의 기울기이다.

그럼 어떻게 한점에서의 기울기를, 그러니까 순간변화율, 다른말로 미분계수를 구하느냐에 관한것이 위 개념, 미분의 기초라고 보면된다.

이제 미분계수를 구해보자. 아까의 직선에서 x의 증가량인 [math]\Delta x[/math][math]0[/math]으로 가까워지면, [math]f[/math]가 연속이라는 가정하에, 자연히 [math]B[/math]점이 [math]A[/math]로 다가가며[3] 직선이 짧아질거고, 이 [math]\Delta x[/math][math]\displaystyle\lim_{\Delta x\to 0}[/math]이 붙어 [math]0[/math]은 아니지만 [math]0[/math]으로 한없이 다가가게 된다면 [math]A[/math][math]B[/math]사이의 거리가 똑같이 [math]0[/math]은 아니지만 [math]0[/math]으로 한없이 가까워져 평균변화율을 구하던 식이 한 지점의 순간변화율을 구하는 식이 되기 때문이다.

한줄로 요약하자면, 평균변화율(직선의 기울기)를 구하던 식에 극한으로 꼼수를[4] 부려 순간변화율(직선의 길이가 [math]0[/math]에 한없이 가까워졌다.)을 구하는 식이 된 것이다.

2.1.1 미분가능성과 연속

간단하게 말해서 미분가능이면 연속이다. 이것을 다음과 같이 나타낼 수 있다.

[math]f'\left(c\right)[/math]가 존재하면 [math]f[/math][math]c[/math]에서 연속이다.

어떤 함수가 [math]x=c[/math] 에서 연속이라는 것은 [math]\displaystyle\lim_{x \to c}f\left(x\right)=f\left(c\right)[/math]이므로 이를 증명하면 된다.

[math] x \ne c[/math]일 때, [math]\displaystyle f \left( x \right) = f \left( c \right) + \left\{ \frac{ f \left( x \right) - f \left( c \right) }{ x - c } \right\}\left(x-c\right)[/math]이므로,

[math]\displaystyle\lim_{x \to c}f\left(x\right)=\lim_{x \to c}\left[ f\left(c\right)+{f\left(x\right)-f\left(c\right) \over x-c}\left(x-c\right) \right]=\lim_{x \to c}f\left(c\right)+\lim_{x \to c}{f\left(x\right)-f\left(c\right) \over x-c}\cdot \lim_{x \to c}\left( x-c \right)=f\left(c\right)+f'\left(c\right)\cdot 0=f\left(c\right)[/math]

이 정리의 역은 성립하지 않는다. 즉, [math]f[/math][math]c[/math]에서 연속이면 [math]f[/math][math]c[/math]에서 반드시 미분가능한 것은 아니다. 예를 들어 [math]y=\left|x\right|[/math] 같은 함수는 [math]x=0[/math]에서 연속이지만 좌우미분계수가 다르므로 [math]x=0[/math]에서 미분가능하지 않다.

미분가능하지 않은 점에는 연속이 아닌 점, 첨점(뽀족점), 접선의 기울기가 발산하는 점[5] 등이 있다.

2.2 도함수

위에서 정의한 미분계수를 일반화시킨 개념으로, 미분계수를 구하는 과정(특정한 [math]x[/math] 값에서의 평균변화율의 극한값)을 하나의 연산으로 보았을 때, 다음과 같이 도함수를 정의할 수 있다.
극한값 [math]\displaystyle m_x=\lim_{\Delta x\to 0}\frac{f\left(x+\Delta x\right)-f\left(x\right)}{\Delta x}[/math]가 존재하는 함수 [math]f[/math]의 정의역의 원소 [math]x[/math][math]m_x[/math]로 대응시키는 함수를 f의 도함수라 한다.

함수 [math]y=f\left(x\right)[/math]의 도함수를 기호 [math]y'[/math], [math]f'\left(x\right)[/math][6], [math]\displaystyle {dy \over dx}[/math][7], [math]\displaystyle {d \over dx} f(x)[/math] 등으로 나타낸다. 또한 도함수를 구하는 것을 미분한다(differentiate)고 한다. 어떤 함수의 도함수가 미분 가능할 때 이 도함수를 한 번 더 미분한 함수를 '이계도함수'라고 부르고, 어떤 함수가 n번 미분이 가능할 때 n번 미분하면 'n계도함수'라고 부른다. (단, n은 자연수) '이계도함수' 이상부터 통틀어서 '고계도함수'라고 부른다.

고등학교까지 배우는 미분은 사실 미분계수와 도함수에 관한 것이다. '미분계수'나 '도함수'가 아닌 '미분'이라는 것에 대한 정의를 과연 고등학교에서 배우는지 자세히 생각해 보자.

3 미분(differential)의 정의

미분이라는 용어는 서로 다른 두 개념 미분(differentiation)과 미분(differential)으로 동시에 쓰이기 때문에 이를 구분할 필요가 있다. Differentiation은 differentiate의 명사형이고, differentiate는 우리가 흔히 미분이라 부르는 도함수를 얻는 것을 말하는 동사이다. 또한 differential은 고등학교에 나오지 않는 개념으로, 원함수의 선형 근사 함수를 말한다. 가령 일변수 함수 [math]f(x)[/math]의 한 점 [math]a[/math]에서의 미분(differential)은[math]\mathrm df({\Delta x}) = f'(a){\Delta x}[/math]로 나타나는 선형함수를 말한다. 좀 더 일반적으로 [math]a[/math] 자체도 변수로 다루면서 [math]f(x)[/math]의 미분 [math]\mathrm df[/math][math]\mathrm d f(x,{\Delta x})=f'(x){\Delta x}[/math]의 이변수 함수로서 정의 한다. 여기서 [math]{\Delta x}[/math]는 단순히 변수의 표기에 불과하니 오해하지 말자.

왜 이러한 differential이라는 개념이 따로 필요한가는 다변수함수의 미분으로 가면 확실해진다. 일변수 함수에서는 변화하는 '방향'을 고려할 필요가 없기 때문에 평균변화율이나 순간변화율이 유일하게 결정되지만 이차원으로만 가도 서로다른 방향으로의 무수히 많은 변화율을 생각할수 있기 때문에 단순하게 일차원의 변화율(직선의 기울기)을 적용하기에는 애로사항이 존재하게 된다.따라서 미분의 개념에 대해 다른 방향으로 접근해야하고 그것이 바로 선형근사함수이다.(정확히는 방향을 고정하면 이런식의 미분값들을 생각할수는 있다. 방향도함수라고 하는데 편미분도 여기에 속한다. 하지만 모든 방향에 대해서 방향도함수값은 존재하지만 연속은 안되는 골때리는 상황도 존재하므로 다른 방향의 일반화를 생각하는 것이다.)

선형함수란 [math]L(ax+y)=aL(x)+L(y)[/math]의 성질을 가지는 함수를 말하며 일변수의 실수값함수에서는 원점을 지나는 직선으로 이변수의 실수값함수에서는 원점을 지나는 평면으로 나타나며 일반적으로 [math]R^n[/math]에서 [math]R^m[/math]으로 가는 함수의 경우에는 [math]L(x)=Ax[/math]로서 mxn행렬[math]A[/math]를 변수앞에 (변수를 column matrix의 형태로 간주하여)곱한 간단한 형태로서 나게 된다.

[math]\mathbb R^n[/math]에서 [math]\mathbb R^m[/math]으로 가는 함수 [math]f:\mathbb x\mapsto f(\mathbf x)[/math]에 대해 한 점 [math]\mathbf a[/math]를 고정시키고 이로 만든 새로운 함수 [math]f(\mathbf x)-f(\mathbf a)[/math]와 원점 근방에서 가장 원함수와 비슷한 선형 근사 함수는 유일하게 결정할 수 있게 되고,[8] 이러한 방향으로 생각한 일변수 함수에서의 미분의 확장은 타당하다 할 수 있다. 이때 [math]f(\mathbf x)[/math][math]\mathbf x=\mathbf a[/math]에서의 선형 근사 함수 [math]L(\mathbf x)=A\mathbf x[/math]가 위에서 말한 [math]\mathbf a[/math]에서의 미분(differential)이고 이러한 미분의 계수를 미분계수라고 하게 된다. (따라서 차원이 높아지면 이러한 '계수'는 하나의 수가 아닌 행렬로 나타난다.그게 바로 자코비안 행렬.) 모든 고등학생이 도함수의 값을 미분계수라고 부른다는걸 알고 있지만 정작 왜 미분계수라고 부르는지는 잘 모르는데 말그대로 미분(differential)의 계수(coefficient)이기 때문에 그렇게 부르는 것이다. [9]

이렇게 다변수로 가면 미분(differential)을 먼저 정의해야 그로서 미분계수라는 용어가 자연스럽게 나오고 그 미분계수와 해당하는 점을 이어주는 함수를 도함수(derivative)라고 정의할 수 있게 된다.

3.1 어림값

미분의 정의를 이용하면 미분가능한 함수에서 함숫값의 비교적 정확한 어림값을 쉽게 유추해낼 수 있다. 함수 [math]y=f\left(x\right)[/math]에 대해 [math]\Delta x[/math][math]x[/math]의 변화량이고 여기에 대응되는 [math]y[/math]의 변화량을 [math]\Delta y[/math]라 하면 [math]\Delta y[/math]의 어림값으로 [math]dy[/math]를 쓸 수 있다. 즉, 함수 [math]y=f\left(x\right)[/math]의 어림값은 다음과 같이 구할 수 있다.
[math]f\left(x+\Delta x\right)\approx f\left(x\right)+dy=f\left(x\right)+f'\left(x\right)\Delta x[/math]

예를 들어, [math]\sqrt {4.2}[/math]의 어림값을 구하려면, 우선 함수 [math]y=\sqrt {x}[/math]에서 [math]dy={1 \over 2\sqrt {x}}dx, x=4, dx=0.2[/math]이므로 [math]dy={1 \over 2\sqrt {4}}\cdot 0.2=0.05[/math]이다. 따라서 [math]\sqrt {4.2}=\sqrt {4+0.2}\approx \sqrt {4}+0.05=2.05[/math]이고, 이 값은 [math]\sqrt {4.2}=2.0493901532...[/math]에 근사하다.

4 도함수의 성질

여기서는 도함수를 미분연산자 [math]D[/math]를 이용하여 표현할 것이다. 즉, 함수 [math]\displaystyle y=f\left(x\right)[/math]의 도함수 [math]\displaystyle y'=f'\left(x\right)={dy \over dx}=Dy=Df\left(x\right)[/math]이다.

4.1 미분법의 기본 공식

각 함수의 도함수가 존재함을 전제로 한다.
(1) [math]y=c[/math](c는 상수)이면 [math]Dy=0[/math]

(2) [math]y=x^n[/math](n은 실수)이면 [math]Dy=nx^{n-1}[/math]
(3) 상수 [math]k[/math]에 대해 [math]D\left[ kf\left(x\right) \right]=kDf\left(x\right)[/math]
(4) [math]D\left[ f\left(x\right) \pm g\left(x\right) \right]=Df\left(x\right) \pm Dg\left(x\right)[/math]
(5) [math]y=f\left(x\right)\cdot g\left(x\right)[/math]이면 [math]Dy=f'\left(x\right)g\left(x\right)+f\left(x\right)g'\left(x\right)[/math]
(6) [math]\displaystyle y={f\left(x\right) \over g\left(x\right)}[/math](단, [math]g\left(x\right)\ne 0[/math]이면 [math]\displaystyle Dy={f'\left(x\right)g\left(x\right)-f\left(x\right)g'\left(x\right) \over \left\{ g\left(x\right) \right\}^2}[/math])

여기서 미분연산자 [math]D[/math]가 (3)와 (4)를 만족시키므로, [math]D[/math]선형연산자이다.

4.2 연쇄법칙

미분연산자 [math]D[/math]의 다른 표기법은 다음과 같다. [math]y[/math][math]x[/math]에 대한 함수이면, [math]y[/math]의 도함수를 [math]D_{x}y[/math]로 나타낸다. 예를 들어, [math]y=u^{10}, u=2x^2+10[/math]이면 [math]D_{u}y=10u^9[/math], [math]D_{x}u=4x[/math]이다. 그런데, [math]u=2x^2+10[/math][math]y=u^{10}[/math]에 대입하면 [math]y=\left(2x^2+10\right)^{10}[/math]이다. 이를 미분하면 [math]y'=D_{x}y=10\left(2x^2+10\right)^9\cdot 4x[/math]로, 이 값은 [math]D_{u}y[/math][math]D_{x}u[/math]를 곱한 값과 같다. 즉, 미분가능한 두 함수 [math]y=f\left(u\right)[/math], [math]u=g\left(x\right)[/math]에 의해 결정된 합성합수 [math]y=f\left(g\left(x\right)\right)[/math]에서, [math]y[/math][math]u[/math]보다 [math]D_{u}y[/math]배 만큼 변하고, [math]u[/math][math]x[/math]보다 [math]D_{x}u[/math]배 만큼 변한다. 따라서 [math]y[/math][math]x[/math]보다 [math]D_{u}y\cdot D_{x}u[/math]배 만큼 변한다. 이를 연쇄법칙(Chain Rule)이라고 한다.
[math]y[/math][math]u[/math]에 대한 함수이고, [math]u[/math][math]x[/math]에 대한 함수이며, 함수 [math]y[/math], [math]u[/math]가 각각 [math]u[/math], [math]x[/math]에서 미분가능하면 [math]y[/math][math]u[/math]의 합성함수는 [math]x[/math]에서 미분가능하고 [math]D_{x}y=D_{u}y\cdot D_{x}u[/math]이다.

역함수의 미분법은 연쇄법칙의 한 예로 볼 수 있다. 원함수와 역함수의 합성함수는 항등함수이다. 즉, 원함수 [math]y=f\left(x\right)[/math]의 역함수 [math]y=g\left(x\right)[/math]에 대해 [math]f\left(g\left(x\right)\right)=x[/math]이므로 각 변을 미분하면 [math]f'\left(g\left(x\right)\right)g'\left(x\right)=1[/math] 이므로 역함수의 도함수는 [math]\displaystyle g'\left(x\right)={1 \over f'\left(g\left(x\right)\right)}[/math] 이다.

이러한 연쇄법칙은 다변수함수의 미분에서도 성립한다.
두 미분가능한 다변수 함수 [math]F : \mathbb{R}^n \rightarrow \mathbb{R}^m[/math][math]G : \mathbb{R}^m \rightarrow \mathbb{R}^k[/math] 에 대해서 둘의 합성함수 [math]G \circ F[/math] 또한 미분가능하며 그 도함수값(미분계수)는 [math]D(G\circ F)(a)=DF(G(a))DG(a)[/math] 로 나타난다. 일반적으로 다변수의 도함수값은 행렬이므로 뒤의 곱은 행렬의 곱이다.

4.3 음함수의 미분법

원의 방정식 [math]x^2+y^2-1=0[/math]을 y에 대한 함수로 나타내면 [math]y=\pm \sqrt {1-x^2}[/math]이다. 이처럼 [math]y[/math][math]x[/math]에 대한 함수로 정의되면 [math]y[/math][math]x[/math]에 대한 양함수(explicit function, 陽函數)라 하고, 원의 방정식처럼 여러 개의 변수들의 관계식 즉 [math]F\left(x,y\right)=0[/math]의 꼴로 정의될 때 [math]y[/math][math]x[/math]에 대한 음함수(implicit fuction, 陰函數)라 한다. 관계식 [math]F\left(x,y\right)=0[/math][math]y[/math]에 대한 함수로 나타내어 미분하는 것이 쉽지 않은 경우가 많기 때문에, 관계식 [math]F\left(x,y\right)=0[/math]를 그대로 미분하되 [math]y[/math][math]x[/math]에 대한 식으로 표현됨에 유의하여 연쇄법칙을 적용한다. 예를 들어 [math]F\left(x,y\right)=x^2+y^2-1=0[/math][math]x[/math]에 대해 미분하면 [math]2x+2y\cdot {dy \over dx} =0[/math]이 되어 [math]{dy \over dx}=-{x \over y}[/math]가 된다.

사실 음함수의 미분'법'이라고 하는것은 chain rule에 의한 자명한 결과이다.이변수 함수 [math]f(x,y)[/math]와 일변수 함수 [math]g(x)[/math]가 각각 미분가능하면 두 함수로 만들어낸 새로운 일변수 함수[math]f(x,g(x))[/math]또한 미분가능하고 그 값은 chain rule에 의해 구할 수 있게 된다.

그럼에도 불구하고 많은 미적분학 책에서는 이를 따로 가르치고 있는데 이는 단순한 미분'법'을 가르치기 위해서가 아니라(사실 미분법은 chain rule에서 이미 가르쳤다.) y를 x에 대한 함수로 본다는 사실을 강조하기 위함을 보여진다. 즉 어떤 이변수 함수 이변수 함수 [math]f(x,y)[/math] 가 주어질때 [math]f(x,g(x))=0[/math] 을 만족시키는 미분가능한 [math]g(x)[/math]가 존재하는가? 라는 것을 강조하기 위함이다.

이러한 의문은 '음함수의 정리'가 만족시켜 주는데 기본적으로 미적분학책에서 나올정도의 함수는 대부분다 음함수 정리의 조건을 만족시키는 좋은 함수라고 할 수 있다.

4.4 편미분

주가 되는 변수 하나를 남겨두고 나머지 변수를 개박살내는 미분법이다. 다차원 함수식에서 워낙 중요한 연산자인지라 편미분된 함수를 편도함수라고 부르며, [math]\partial[/math][10]라는 기호를 따로 쓴다. 당연하지만 원시함수의 변수가 둘 이상이기 대문에, 제대로 풀려면 순수 해석학으로는 무리고 선형대수학을 동원해야 한다.

고등학교에서 기초적인 편미분을 배울 수 있는데 바로 '이계도함수'이다. 하지만 그것 말고도 함수가 더럽게 뒤엉켜있는 함수방정식과 도함수까지 나오는 미분방정식 중 고등학교 시험에 나오는 것들에 요긴하게 써먹을 수 있다.

4.5 전미분

편미분과는 반대로 미분꼴이 다수의 변수를 품은 형태이다. 일종의 연립방정식이라고 보면 될 듯. 미분연립방정식이 따로 있다는 건 제쳐 두자

5 도함수의 응용

미분법을 배우는 주된 이유 중 하나는 함수의 그래프를 그리기 위해서이다. 도함수로 원래함수의 상태를 알아내 형태를 그릴수 있기 때문. 함수의 형태와 특징을 알기 위해서는 도함수와 함께 몇가지 다른 개념들이 필요하다. 이 개념들을 이용하면 함수의 그래프를 그릴 수 있다.

5.1 최댓값과 최솟값

함수 [math]f[/math][math]S[/math]에서 정의되고 [math]c\in S[/math]라 하자.

1. 모든 [math]x\in S[/math]에 대하여 [math]f\left(c\right)\ge f\left(x\right)[/math]이면 [math]f\left(c\right)[/math][math]f[/math]의 최댓값(maximum value)이다.
2. 모든 [math]x\in S[/math]에 대하여 [math]f\left(c\right)\le f\left(x\right)[/math]이면 [math]f\left(c\right)[/math][math]f[/math]의 최솟값(minimum value)이다.

5.1.1 최대·최소의 정리

[math]f[/math]가 닫힌구간 [math]\left[a,b\right][/math]에서 정의된 연속함수이면, [math]f[/math]는 그 구간에서 최댓값과 최솟값을 갖는다.

자세한 내용은 연속함수 참조

5.1.2 임계점 정리

[math]f[/math][math]c[/math]를 포함하는 구간 [math]I[/math]에서 정의된 함수라 하자. [math]f\left(c\right)[/math]가 최대 또는 최솟값이면 [math]c[/math]는 다음 중 하나이다.

1. [math]I[/math]의 끝점 (예를 들어, 구간 [math]\left[a,b\right][/math]의 끝점은 [math]a[/math][math]b[/math]이며, 구간 [math]\left[a,b\right)[/math]의 끝점은 [math]a[/math]이다)
2. [math]f[/math]의 정점 ([math]f'\left(c\right)=0[/math] 인 점)
3. [math]f[/math]의 특이점 ([math]f'\left(c\right)[/math]가 존재하지 않는 점으로 그래프가 꺾인 점, 접선의 기울기가 발산하는 점, 불연속인 점이 있다)

위의 세 종류의 점을 임계점이라 한다.

5.2 단조성과 오목·볼록

[math]f[/math]가 구간 I에서 정의될 때 I 내의 임의의 두 점 [math]x_{1}[/math], [math]x_{2}[/math]에 대하여

1. [math]x_{1}\ltx_{2}[/math]일 때 [math]f\left(x_{1}\right)\ltf\left(x_{2}\right)[/math]이면 [math]f[/math]는 구간 [math]I[/math]에서 증가한다(increase)고 하고
2. [math]x_{1}\ltx_{2}[/math]일 때 [math]f\left(x_{1}\right)\gtf\left(x_{2}\right)[/math]이면 [math]f[/math]는 구간 [math]I[/math]에서 감소한다(decrease)고 하며
3. 함수 [math]f[/math]가 1 또는 2를 만족하면 [math]f[/math]는 구간 [math]I[/math]에서 단조롭다(monotone)고 한다.

5.2.1 단조성 정리

[math]f[/math]가 구간 [math]I[/math]에서 연속이며 [math]I[/math]의 모든 내점에서 미분가능할 때

1. [math]I[/math]의 모든 내점 [math]x[/math]에 대하여 [math]f'\left(x\right)\gt0[/math]이면 [math]f[/math][math]I[/math]에서 증가하며,
2. [math]I[/math]의 모든 내점 [math]x[/math]에 대하여 [math]f'\left(x\right)\lt0[/math]이면 [math]f[/math][math]I[/math]에서 감소한다.

이때 구간 [math]I[/math]의 모든 내점 [math]x[/math]에 대하여 증가 또는 감소임에 유의하자. 즉, 증가 또는 감소 구간은 양 끝점을 포함한다. 단조성 정리의 증명과 이로부터 도출되는 정리는 역도함수로 정의되는 부정적분에 있어 굉장히 중요한 의미를 갖는다. 이에 대한 내용은 평균값의 정리를 참조할 것.

5.2.2 오목성 정리

만약 접선이 그래프를 따라 왼쪽에서 오른쪽으로 이동할 때 반시계방향으로 회전하면 그래프는 위로 오목(concave up) 또는 아래로 볼록(convex down)이며, 시계방향으로 회전하면 아래로 오목(concave down) 또는 위로 볼록(convex up)이다.
정확한 정의는 다음과 같다. (반드시 미분 가능해야 할 필요는 없다.)
함수 [math]f[/math]가 열린구간 [math]\left(a,b\right)[/math]에서 연속일 때, 임의의 [math]0\lte\lt1[/math][math]\left(a,b\right)[/math]안의 모든 점 [math]x\lty[/math]에 대해 [math]f(ex+(1-e)y)\le ef(x)+(1-e)f(y)[/math]일 때 [math]f[/math]는 위로 오목(아래로 볼록)이며, [math]f(ex+(1-e)y)\ge ef(x)+(1-e)f(y)[/math]일 때 [math]f[/math]는 아래로 오목(위로 볼록)이다.
함수가 미분가능하다면, 도함수를 이용하여 다음과 같이 표현할 수 있다. (위의 정의로부터 어떤 함수가 위로 오목/아래로 오목이면 연속이며 만약 미분가능하다면 도함수가 증가/감소함수임을 보일 수 있다.)
함수 [math]f[/math]가 열린구간 [math]I=\left(a,b\right)[/math]에서 미분가능하다고 하자. [math]f'[/math][math]I[/math]에서 증가하면 [math]f[/math]는 위로 오목(아래로 볼록)이며 [math]f'[/math][math]I[/math]에서 감소하면 [math]f[/math]는 아래로 오목(위로 볼록)이다.
여기서 열린구간에서 미분가능한 함수임에 유의하자. 즉, 오목 또는 볼록 구간은 양 끝점을 포함하지 않는다. 또한[math]\ f''[/math]이 양수이면 [math]f'[/math]이 증가하고 [math]f''[/math]이 음수이면 f'이 감소하므로 다음의 오목성 정리가 성립한다.
[math]f[/math]를 열린구간 [math]\left(a,b\right)[/math]에서 두 번 미분가능한 함수라 하자. [math]\left(a,b\right)[/math]의 모든 점 [math]x[/math]에 대하여

1.[math]\ f''\left(x\right)\gt0[/math]이면 [math]f[/math][math]\left(a,b\right)[/math]에서 위로 오목(아래로 볼록)이고,
2.[math]\ f''\left(x\right)\lt0[/math]이면 [math]f[/math][math]\left(a,b\right)[/math]에서 아래로 오목(위로 볼록)이다.

[math]f[/math][math]c[/math]에서 연속인 함수라 할 때, [math]f[/math][math]c[/math]를 경계로 한쪽에서는 위로 오목(아래로 볼록)이고 다른 쪽에서는 아래로 오목(위로 볼록)이면 [math]\left(c,f\left(c\right)\right)[/math][math]f[/math]변곡점(inflection point)이라고 한다. 여기서 [math]f''\left(x\right)=0[/math]인 점이 항상 변곡점인 것은 아니라는 것에 유의하자. [math]\ f''\left(x\right)=0[/math]이면서 좌우의 [math]f''\left(x\right)[/math]의 부호가 반대인 점이 변곡점이며 또한 [math]f''\left(x\right)=0[/math]의 값이 존재하지 않는 점이 변곡점이 될 수도 있다.

5.3 극댓값과 극솟값

극댓값이란 주변값보다 큰 값을, 극솟값은 주변값보다 작은 값을 의미한다. 극댓값·극솟값의 정확한 정의는 다음과 같다.
[math]S[/math][math]f[/math]의 정의역이고, [math]c\in S[/math]라 하자.

1. [math]c[/math]를 포함하는 열린구간 [math]I[/math]가 존재하여 [math]f\left(c\right)[/math]가 집합 [math]I\cap S[/math]에서 [math]f[/math]의 최댓값이면 [math]f\left(c\right)[/math][math]f[/math]극댓값(local maximum value)이라고 한다.
2. [math]c[/math]를 포함하는 열린구간 [math]I[/math]가 존재하여 [math]f\left(c\right)[/math]가 집합 [math]I\cap S[/math]에서 [math]f[/math]의 최솟값이면 [math]f\left(c\right)[/math][math]f[/math]극솟값(local minimum value)이라고 한다.
3. [math]f\left(c\right)[/math]가 극댓값이거나 극솟값이면 [math]f\left(c\right)[/math][math]f[/math]의 극값(local extreme value)이라고 한다.

여기서 임계점 정리의 최대·최솟값을 극값으로 바꾸어도 성립한다. 즉 끝점, 정점 그리고 특이점이 극값이 될 수 있다. 이때 도함수를 이용하면 극값을 판정할 수 있다.

[math]f[/math]는 열린구간 [math]\left(a,b\right)[/math]에서 연속이고 임계점 [math]c[/math][math]\left(a,b\right)[/math]의 원소일 때,

1. [math]\left(a,c\right)[/math]의 임의의 점 [math]x[/math]에 대하여 [math]f'\left(x\right)\gt0[/math]이고, [math]\left(c,b\right)[/math]의 임의의 점 [math]x[/math]에 대하여 [math]f'\left(x\right)\lt0[/math]이면 [math]f\left(c\right)[/math][math]f[/math]의 극댓값이다.
2. [math]\left(a,c\right)[/math]의 임의의 점 [math]x[/math]에 대하여 [math]f'\left(x\right)\lt0[/math]이고, [math]\left(c,b\right)[/math]의 임의의 점 [math]x[/math]에 대하여 [math]f'\left(x\right)\gt0[/math]이면 [math]f\left(c\right)[/math][math]f[/math]의 극솟값이다.
3. [math]c[/math]의 양쪽에서 [math]f'\left(x\right)[/math]의 부호가 같으면 [math]f\left(c\right)[/math]는 극값이 아니다.

5.4 점근선

극한 참조

6 평균값의 정리

항목 참조

7 기타

영국 수학계는 라이프니츠 식이 나온 이후에도 뉴턴 식을 고집하다가 결국 유럽 대륙에 비해 수학의 발전이 약 1 ~ 200년 정도 뒤처지게 된다. 은근히 안습.

흔히 오해하는 것이 뉴턴과 라이프니츠가 완전히 최초라고 생각하는데 이미 미분과 비슷한 개념은 피에르 드 페르마가 좌표평면 비슷한 것을 만들면서 접선을 구할때 비슷한걸 생각해냈다.[11][12] 미분을 도입할때 곡선 상의 두 점에 대해 두 점을 잇는 직선인 할선을 생각한 후에, 한 점을 다른 한점에 극한으로 보내는 방식이 페르마가 생각했던 접선을 정의하는 방식이다.

물리 공부할 때에는 적분과 더불어 사실상 필수이다. 물론 고등학생 수준에서는 최저값/최고값 찾기에나 쓰지만, 배워 놓으면 꽤 편리할 뿐만 아니라 물리 개념 이해에 도움을 주기 때문에 배워놓는 것을 권장한다. [13] 상경계열 학생들에게도 필수다. 경제학에서 모형분석 시 자주 사용한다는 차원을 넘어서 경제원론의 탄력성, 한계효용 개념에서부터 미분 개념이 등장하기 때문에 못하면 매우 피곤하다. 공학에서도 공학수학의 기초 중 하나이기 때문에 필수다. 사실상 수식을 사용하는 거의 모든 학문에 필수로 들어간다고 보면 된다.

사실 적분에 비해서는 계산이 훨씬 쉬운 편이다. 곱의 형태나 분수 형태로 된 함수도 공식만 잘 적용하면 쉽게 계산이 가능한데다(참고로 곱이나 분수 형태의 함수를 적분하기 위한 일반적인 해법은 없다.[14]) 위에 설명한 chain rule의 존재로 인해 아무리 지수가 높아진 함수라도 계산이 복잡해질뿐 도함수를 아예 못 구하는 경우는 많지 않기 때문이다. [math]y=x^x[/math] 처럼 겉보기에는 절대로 도함수를 못 구할 것처럼 보이는 함수도 양쪽에 로그를 취하고 chain rule을 사용하면 도함수를 구할 수 있다. 단, 지수, 로그, 삼각함수[15] 같은 특수 함수의 도함수는 매번 극한을 써서 유도해내어 쓸 수 없으니 시험 잘 보려면 닥치고 외워야 한다(...)

보다 고급 과정으로 들어가면 연속함수가 아닌 함수의 미분을 생각할 수가 있다. 재미있게도 정의하는 과정에서 적분이 등장하는데, 제대로 이해하기 위해서는 사전에 측도론(measure theory)에 관한 지식이 필히 요구된다.[16]

8 참조 항목

  1. 미세하게 나눈다는 뜻이다. Differentiation Difficult(...)을 한자로 번역한 일본식 한자어라 고등학생들에게는 이해하기 어려울 수 있다. 대충 어떤 선에서 한 지점을 정해 놓고 그 지점을 극도로 확대시켜 나간다미세하게 쪼개간다라는 식으로 이해하면 된다.
  2. 혹여나 모를까봐 덧붙이자면, 변수 [math]a[/math]를 함수 [math]f\left(x\right)[/math]에 넣으면 [math]f\left(a\right)[/math]이며, 이걸 다른말로 [math]y[/math]값으로 부른다. 여기서는 [math]f\left(x\right)[/math]가 무슨 함수인지 정의하지 않았으므로 [math]y[/math]값을 나타내기 위해 [math]f\left(x\right)[/math]를 사용한것
  3. 그래프 상의 [math]A[/math], [math]B[/math]점의 위치를 결정하는 x축위 [math]b-a[/math]=x의 증가량이기 때문이다.
  4. [math]0[/math]은 아니지만 [math]0.000......001[/math]로 한없이 0에 가까워지니까 그냥 [math]0[/math]으로 쳐주라. 근데 [math]0[/math]은 아냐ㅎㅎ 하는 식
  5. 예를 들면 [math]\displaystyle\lim_{x \to 0^+}(\sqrt{x})'=\infty[/math]
  6. f 프라임 x 라고 읽는다.
  7. 디와이디엑스'라고 읽는다.
  8. 단 먼저 존재성을 따져야 한다. 이런 선형 근사 함수가 존재할 때 미분가능, 존재하지 않으면 미분 불가능이라 한다.
  9. 고등학교에서는 미분(differential)에 대해 가르치지 않기 때문에 미분계수라는 용어의 사용자체가 그다지 바람직하지는 않아 보인다. 고등학교 교육과정에서는 순간변화율이라는 용어가 더 적절할 듯하다.
  10. 라운드 디라고 읽는다. 아식스
  11. 그러나 페르마의 업적이 알려지지 않았던건 페르마는 애초부터 '취미'로 연구했던 것이고 페르마 스스로도 그렇게 좋아하진 않았던듯 하다.
  12. 좌표평면은 데카르트와 독자적으로 연구해서 '대수기하학'의 시초기도 하다.
  13. 사실 대학별 논술시험에서는 막 나온다.
  14. 곱의 형태로 된 함수를 적분하기 위해 부분적분이란 기법이 등장하긴 했지만 (부분적분의 기법 자체는 f(x)g(x) = f'(x)g(x) + f(x)g'(x) 의 양변을 적분해본 일반화된 공식에서 등장한다) 이 방법을 써도 풀리기는커녕 오히려 더 복잡해지는 함수가 훨씬 많다. 또 치환적분이란 테크닉이 있기도 하지만 치환적분은 이걸 이렇게 치환하면 계산이 편해지는구나~ 라고 이미 알고 있는 함수를 적분하기 위해서 쓰는 방법이다.
  15. 그나마 지수 같은 경우는 미분해 보았자 원함수에 ln(a)만 붙으니 그나마 외우기 쉽다.
  16. 이러한 정의에서는 함수값이 측도가 0인 집합에서 다른 것은 별 문제가 되지 않는다. 예를 들면 항등함수 0과 유리수에서 1, 무리수에서 0의 값을 갖는 함수는 같은 것으로 본다. 어차피 적분하면 0이므로.
  17. 스칼라 장의 변화, 벡터장의 발산, 회전 등을 나타내는 데 쓰이는 연산자이다.
  18. 왜인지는 항목 참조