제약 조건이 있는 극값 구하기
수학이야기/Calculus 2020. 5. 23. 20:20독립변수 여럿인 다변수 함수에서 극값을 구할 때, 일변수 함수에서는 일어나지 않는 새로운 형태를 가진 문제가 일어난다. 문제를 풀다 보면 사라지는 함수 조건(제약 constraint 또는 부가 조건 side condition)을 고려하여 함수 $f$의 극값을 구할 때 일어난다.
조건 $g(x,y)=0$에서 함수 $f(x,y)$를 극값을 구하는 문제는 먼저 방정식 $g(x,y)=0$에서 $y$를 $x$로 정리하여 $f(x,y)$에 대입하여 $x$만의 함수를 만들어서 해결할 수 있다. 하지만 많은 경우 이렇게 하기 어렵거나 불가능하기 때문에 새로운 접근을 시도해야 한다.
위 그림은 제약 조건 $g(x,y)=0$이 주어졌을 때, 함수 $f(x,y)=\sqrt{x^2 +y^2}$의 최솟값이나 최댓값을 구하는 그림이다. 방정식 $g(x,y)=0$가 그리는 그래프 위에 있는 점 가운데 원점으로부터 거리가 최소이거나 최대인 점을 찾으면 된다. 함수 $f$의 등위 곡선 $\sqrt{x^2 +y^2}=c$은 중심이 원점인 동심원(검은색)들이다. 곡선 $g(x,y)=0$의 그래프(붉은색)를 지나는 점은 함수 $f$의 등위 곡선과 안쪽이나 바깥쪽으로 가로지르게 된다. 그림과 같이 가로지르는 방향이 바뀌는 점에서 극값을 가지게 된다고 예측할 수 있다. 점 $A$는 $c$가 증가하는 방향에서 감소하는 방향으로 바뀌고 있고 두 점 $B$와 $C$는 $c$가 감소하는 방향에서 증가하는 방향으로 바뀌고 있다.
조금 더 일반적으로 살펴보자. 조금 흐릿한 선은 함수 $z=f(x,y)$의 등위 곡선들($f(x,y)=c$)이다. 진한 곡선이 제약 조건 $g(x,y)=0$이라고 하면 두 점 $A$와 $B$가 극값을 가지는 점임을 알 수 있다. $c$가 증가하는 방향이 원점을 향하는 방향이면 극댓값이고 반대라면 극솟값을 가진다.
곡선 $g(x,y)=0$와 등위 곡선 $f(x,y)=c_1$이 점 $A(a,b)$에서 접한다고 하면 두 곡선은 접선을 공유할 것이다. 접선의 방정식은 아래와 같다.
$$(x-a)f_x(a,b)+(y-b)f_y(a,b)=0$$
$$(x-a)g_x(a,b)+(y-b)g_y(a,b)=0$$
두 직선이 일치하려면 아래와 같은 식이 성립해야 한다.
$$f_x(a,b)+\lambda g_x(a,b)=0\tag{1}$$
$$f_y(a,b)+\lambda g_y(a,b)=0\tag{2}$$
점 $A$가 곡선 $g$에 있으므로 아래는 당연하다.
$$g(a,b)=0\tag{3}$$
세 방정식 (1), (2), (3)을 만족하는 미지수 $a,b,\lambda$를 찾으면 문제가 해결된다. 이 방법이 라그랑제 방법이고 $\lambda$를 승수 multiplier라 부른다. 이를 정리하면 아래와 같다.
정리
$E_n$ 안에 열린 영역 $D$에서 미분가능한 $f$와 $g$가 정의되었다고 하자. 조건 $g(\mathrm{P})=0$이 주어졌을 때 $f$가 $\mathrm{P_0} \in D$에서 $\nabla g \not = \mathrm{O}$이고 극값을 가질 필요조건은 아래 식을 모두 만족하는 $\lambda$가 존재하는 것이다.$$\nabla f(\mathrm{P_0})+\lambda(\mathrm{P_0})=\mathrm{O}$$
$$g(\mathrm{P_0})=0$$
증명 3차원인 경우를 증명하자.
가정 $\nabla g(\mathrm{P_0}) \not = \mathrm{O}$는 $g_x, g_y, g_z$가 $\mathrm{P_0}=(a,b,c)$에서 한꺼번에 $0$이 되지는 않음을 뜻한다. $g_z(a,b,c)\not=0$임을 가정하자. 방정식 $g(a,y,z)=0$를 정리하여 점 $(a,b)$와 가까운 곳에서 $\phi(a,b)=c$인 $z=\phi(x,y)$를 찾을 수 있다.
$a$에서 $a+h$로 변할 때 $f$는 아래와 같이 변화한다.
$$f(a+h,b,\phi(a+h,b))-f(a,b,\phi(a,b))$$
$h\rightarrow 0$일 때, 위에 있는 값도 $0$으로 수렴한다. 이를 다시 정리하면 아래와 같다.
$$f(a+h,b,\phi(a+h,b))-f(a+h,b,\phi(a,b))+f(a+h,b,\phi(a,b))-f(a,b,\phi(a,b))=0$$
이 값은 평균값 정리에 따라 아래를 만족하는 $\tilde{\phi},\tilde{a}$가 존재한다.
$$f_z(a+h,b,\tilde{\phi})(\phi(a+h,b)-\phi(a,b))+f_x(\tilde{a},b,\phi(a,b))h=0$$
따라서 $f(x,y,\phi(x,y))$는 아래 식을 만족하는 점 $(a,b)$에서 극값을 가진다.
$$f_x(a,b,\phi(a,b))+f_z(a,b,\phi(a,b))\phi_x(a,b)=0$$
$$f_y(a,b,\phi(a,b))+f_z(a,b,\phi(a,b))\phi_y(a,b)=0$$
$\phi(a,b)=c$이므로
$$f_x(a,b,c)+f_z(a,b,c)\phi_x(a,b)=0\tag{1}$$
$$f_y(a,b,c)+f_z(a,b,c)\phi_y(a,b)=0\tag{2}$$
한편 $(a,b)$ 가까운 곳에서 $g(x,y,\phi(x,y))=0$이므로 $g$는 아래를 만족한다.
$$g_x(a,b,c)+g_z(a,b,c)\phi_x(a,b)=0\tag{3}$$
$$g_y(a,b,c)+g_z(a,b,c)\phi_y(a,b)=0\tag{4}$$
이제 $\lambda$를 아래와 같이 정의하자.
$$\lambda=\frac{-f_z(a,b,c)}{g_z(a,b,c)}\tag{5}$$
(5)를 써서 (1),(2),(3),(4)에 있는 $\phi_x$와 $\phi_y$를 소거하면 아래와 같은 식을 얻는다.
$$f_x(a,b,c)+\lambda g_x(a,b,c)=0$$
$$f_y(a,b,c)+\lambda g_y(a,b,c)=0$$
(5)식을 달리 적으면 아래와 같다.
$$f_z(a,b,c)+\lambda g_z(a,b,c)=0$$
위에 있는 세 식은 아래와 같이 적을 수 있다.
$$\nabla f(\mathrm{P_0})+\lambda g(\mathrm{P_0})=\mathrm{O}$$
$\blacksquare$