제약 조건이 있는 극값 구하기

수학이야기/Calculus 2020. 5. 23. 20:20
반응형

독립변수 여럿인 다변수 함수에서 극값을 구할 때, 일변수 함수에서는 일어나지 않는 새로운 형태를 가진 문제가 일어난다.  문제를 풀다 보면 사라지는 함수 조건(제약 constraint 또는 부가 조건 side condition)을 고려하여 함수 $f$의 극값을 구할 때 일어난다. 

조건 $g(x,y)=0$에서 함수 $f(x,y)$를 극값을 구하는 문제는 먼저 방정식 $g(x,y)=0$에서 $y$를 $x$로 정리하여 $f(x,y)$에 대입하여 $x$만의 함수를 만들어서 해결할 수 있다. 하지만 많은 경우 이렇게 하기 어렵거나 불가능하기 때문에 새로운 접근을 시도해야 한다.

위 그림은 제약 조건 $g(x,y)=0$이 주어졌을 때, 함수 $f(x,y)=\sqrt{x^2 +y^2}$의 최솟값이나 최댓값을 구하는 그림이다. 방정식 $g(x,y)=0$가 그리는 그래프 위에 있는 점 가운데 원점으로부터 거리가 최소이거나 최대인 점을 찾으면 된다. 함수 $f$의 등위 곡선 $\sqrt{x^2 +y^2}=c$은 중심이 원점인 동심원(검은색)들이다. 곡선 $g(x,y)=0$의 그래프(붉은색)를 지나는 점은 함수 $f$의 등위 곡선과 안쪽이나 바깥쪽으로 가로지르게 된다. 그림과 같이 가로지르는 방향이 바뀌는 점에서 극값을 가지게 된다고 예측할 수 있다. 점 $A$는 $c$가 증가하는 방향에서 감소하는 방향으로 바뀌고 있고 두 점 $B$와 $C$는 $c$가 감소하는 방향에서 증가하는 방향으로 바뀌고 있다.

조금 더 일반적으로 살펴보자. 조금 흐릿한 선은 함수 $z=f(x,y)$의 등위 곡선들($f(x,y)=c$)이다. 진한 곡선이 제약 조건 $g(x,y)=0$이라고 하면 두 점 $A$와 $B$가 극값을 가지는 점임을 알 수 있다. $c$가 증가하는 방향이 원점을 향하는 방향이면 극댓값이고 반대라면 극솟값을 가진다.

곡선 $g(x,y)=0$와 등위 곡선 $f(x,y)=c_1$이 점 $A(a,b)$에서 접한다고 하면 두 곡선은 접선을 공유할 것이다. 접선의 방정식은 아래와 같다.

$$(x-a)f_x(a,b)+(y-b)f_y(a,b)=0$$

$$(x-a)g_x(a,b)+(y-b)g_y(a,b)=0$$

두 직선이 일치하려면 아래와 같은 식이 성립해야 한다.

$$f_x(a,b)+\lambda g_x(a,b)=0\tag{1}$$

$$f_y(a,b)+\lambda g_y(a,b)=0\tag{2}$$

점 $A$가 곡선 $g$에 있으므로 아래는 당연하다.

$$g(a,b)=0\tag{3}$$

세 방정식 (1), (2), (3)을 만족하는 미지수 $a,b,\lambda$를 찾으면 문제가 해결된다. 이 방법이 라그랑제 방법이고 $\lambda$를 승수 multiplier라 부른다. 이를 정리하면 아래와 같다.

정리  
$E_n$ 안에 열린 영역 $D$에서 미분가능한 $f$와 $g$가 정의되었다고 하자. 조건 $g(\mathrm{P})=0$이 주어졌을 때  $f$가 $\mathrm{P_0} \in D$에서 $\nabla g \not = \mathrm{O}$이고 극값을 가질 필요조건은 아래 식을 모두 만족하는 $\lambda$가 존재하는 것이다.

$$\nabla f(\mathrm{P_0})+\lambda(\mathrm{P_0})=\mathrm{O}$$

$$g(\mathrm{P_0})=0$$

증명 3차원인 경우를 증명하자.

가정 $\nabla g(\mathrm{P_0}) \not = \mathrm{O}$는 $g_x, g_y, g_z$가 $\mathrm{P_0}=(a,b,c)$에서 한꺼번에 $0$이 되지는 않음을 뜻한다. $g_z(a,b,c)\not=0$임을 가정하자. 방정식 $g(a,y,z)=0$를 정리하여 점 $(a,b)$와 가까운 곳에서 $\phi(a,b)=c$인 $z=\phi(x,y)$를 찾을 수 있다.

$a$에서 $a+h$로 변할 때 $f$는 아래와 같이 변화한다.

$$f(a+h,b,\phi(a+h,b))-f(a,b,\phi(a,b))$$

$h\rightarrow 0$일 때, 위에 있는 값도 $0$으로 수렴한다. 이를 다시 정리하면 아래와 같다.

$$f(a+h,b,\phi(a+h,b))-f(a+h,b,\phi(a,b))+f(a+h,b,\phi(a,b))-f(a,b,\phi(a,b))=0$$

이 값은 평균값 정리에 따라 아래를 만족하는 $\tilde{\phi},\tilde{a}$가 존재한다.

$$f_z(a+h,b,\tilde{\phi})(\phi(a+h,b)-\phi(a,b))+f_x(\tilde{a},b,\phi(a,b))h=0$$

따라서 $f(x,y,\phi(x,y))$는 아래 식을 만족하는 점 $(a,b)$에서 극값을 가진다.

$$f_x(a,b,\phi(a,b))+f_z(a,b,\phi(a,b))\phi_x(a,b)=0$$

$$f_y(a,b,\phi(a,b))+f_z(a,b,\phi(a,b))\phi_y(a,b)=0$$

$\phi(a,b)=c$이므로

$$f_x(a,b,c)+f_z(a,b,c)\phi_x(a,b)=0\tag{1}$$

$$f_y(a,b,c)+f_z(a,b,c)\phi_y(a,b)=0\tag{2}$$

한편 $(a,b)$ 가까운 곳에서 $g(x,y,\phi(x,y))=0$이므로 $g$는 아래를 만족한다.

$$g_x(a,b,c)+g_z(a,b,c)\phi_x(a,b)=0\tag{3}$$

$$g_y(a,b,c)+g_z(a,b,c)\phi_y(a,b)=0\tag{4}$$

이제 $\lambda$를 아래와 같이 정의하자.

$$\lambda=\frac{-f_z(a,b,c)}{g_z(a,b,c)}\tag{5}$$

(5)를 써서 (1),(2),(3),(4)에 있는 $\phi_x$와 $\phi_y$를 소거하면 아래와 같은 식을 얻는다.

$$f_x(a,b,c)+\lambda g_x(a,b,c)=0$$

$$f_y(a,b,c)+\lambda g_y(a,b,c)=0$$

(5)식을 달리 적으면 아래와 같다.

$$f_z(a,b,c)+\lambda g_z(a,b,c)=0$$

위에 있는 세 식은 아래와 같이 적을 수 있다.

$$\nabla f(\mathrm{P_0})+\lambda g(\mathrm{P_0})=\mathrm{O}$$

$\blacksquare$

반응형