Hledání extrémů funkcí více proměnných

Z Wikiknih

Přejít na: navigace, hledání

Na základě poznámek ze cvičení zpracoval Irigi

Algoritmy, které popíši fungují pro obecně n neznámých - ve všech textech ale budu psát pouze dvě souřadnice, i když napíšu, jak by se postupovalo pro souřadnic více.

Obsah

[editovat] Totální diferenciál

Totální diferenciál definuje limita

\lim_{(h_1,h_2)\rightarrow(0,0)} {{f(x+h_1,y+h_2)-f(x,y)-\vec{\mathrm{d}f}(x,y)\cdot(h_1,h_2)}\over{\sqrt{h_1^2+h_2^2}}}
\ \ \ (\clubsuit)

Nutnou podmínkou pro existenci totálního diferenciálu je existence prvních parciálních derivací, pokud neexistují, zjevně neexistuje ani (♣). Pokud existují první parciální derivace, potom platí

\vec{\mathrm{d}f}(x,y)\cdot(h_1,h_2)={{\partial{f}}\over{\partial{x}}}h_1+
{{\partial{f}}\over{\partial{y}}}h_2

Postačující podmínkou je buďto spojitost prvních parciálních derivací, nebo existence (♣).

[editovat] Příklad

Zjistěte zda a kde má funkce (xy)1 / 3 totální diferenciál.

{{\partial{f}}\over{\partial{x}}}={{x^{-2/3}y^{1/3}}\over{3}}
{{\partial{f}}\over{\partial{y}}}={{y^{-2/3}x^{1/3}}\over{3}}

Je vidět, že derivace jsou mimo osy spojité, tudíž mimo osy existuje totální diferenciál. Na osách je funkční hodnota (xy)1 / 3 = 0, ale první parciální derivace zde nejsou definovány (jsou v limitě nekonečné), proto na osách totální diferenciál není.

V počátku soustavy souřadnic jsou první parciální derivace nulové, protože

{{\partial{f}}\over{\partial{x}}}=\lim_{h\rightarrow 0}{{f(x+h,y)-f(x,y)}\over{h}}=\lim_{h\rightarrow 0}{{0}\over{h}}=0

a obdobně pro derivaci podle y.

Proto pokud totální diferenciál existuje, pak má hodnotu

\vec{df}(x,y)\cdot(h_1,h_2)=0

Ověříme jeho existenci dosazením do (♣). Přejdeme k polárním souřadnicím:

h_1=r\sin (\phi)\,
h_2=r\cos (\phi)\,

Tedy dosadím do (♣):

\lim_{r\rightarrow 0} {{{(h_1h_2)^{{1/3}}-0-0}}\over{\sqrt{h_1^2+h_2^2}}}=
\lim_{r\rightarrow 0} {{{(r\sin (\phi)r\cos (\phi))^{{1/3}}}}\over{r}}

Tato limita neexistuje (resp. závisí na úhlu φ), totální diferenciál tedy v počátku neexistuje.

Hledám-li extrém funkcí více proměnných f(x1,x2,...,xn), prohledávám jednak „kandidáty“ na extrém a jednak hledám extrém na okraji, což je extrém s vazbou.

[editovat] Lokální extrémy

1. Nutná podmínka pro to, aby funkce měla v bodě extrém je, aby první parciální

derivace byly nulové (nebo aby v něm neexistovaly):

{{\partial{f}}\over{\partial{x}}}=0, {{\partial{f}}\over{\partial{y}}}=0,
2. V těchto bodech může nastat jedna ze tří možností - je zde minimum, maximum

nebo sedlový bod. Označíme si členy v Jacobiho matici: }

J=
\begin{pmatrix}
{{\partial^2 f}\over{\partial x^2 }} &
{{\partial^2 f}\over{\partial x\partial y}} \\
{{\partial^2 f}\over{\partial y\partial x}} &
{{\partial^2 f}\over{\partial y^2}}
\end{pmatrix}
=\begin{pmatrix}
A & B 
\\ 
B & C
\end{pmatrix}

Podle Taylorova rozvoje do druhého řádu (první derivace jsou nulové) nám zbývá plocha určená jako:

{{\partial^2{f}}\over{\partial{x}^2 }}\,\mathrm{d}x^2+
2 {{\partial^2{f}}\over{\partial{x}\partial{y}}}\,\mathrm{d}x\,\mathrm{d}y
+
{{\partial^2{f}}\over{\partial{y}^2}}\,\mathrm{d}y^2 
= 
A\,\mathrm{d}x^2+
2 B\,\mathrm{d}x\ \mathrm{d}y
+
C\,\mathrm{d}y^2=K

Pro více proměnných se rozšiřuje kvadriku ve smyslu Taylorova rozvoje. V diskusi nezapomeňte, že funkce musí být ve zkoumaných bodech spojitá, aby byly smíšené derivace záměnné!

  • Je-li pro každé (x,y) \neq (0,0) K > 0\,, pak má funkce v tomto bodě lokální minimum (plocha je pozitivně definitní)
  • Je-li pro každé (x,y) \neq (0,0) K \geq 0, pak nadále nevíme (plocha je pozitivně semidefinitní)
  • Je-li pro každé (x,y) \neq (0,0) K < 0\,, pak má funkce v tomto bodě lokální maximum (plocha je negativní definitní)
  • Je-li pro každé (x,y) \neq (0,0) K \leq 0, pak nadále nevíme (plocha je negativně semidefinitní)
  • Střídá-li pro každé (x,y) \neq (0,0) K\, znaménko pak jde o sedlový bod (plocha je indefinitní)


Abychom zjistili, do které z těchto skupin kvadrika patří, použijeme Silvesterovo kritérium: vybereme z J subdeterminanty (zleva shora) o velikostech 1,2,...,n. Pro případ dvou proměnných tedy D1 = A,D2 = ACB2. Pak:

  • Jsou-li všechny Di kladné (A > 0,ACB2 > 0), pak je kvadrika pozitivně definitivní (lokální minimum).
  • Jsou-li Di střídavě záporné a kladné (A < 0,ACB2 > 0), pak je kvadrika negativně definitivní (lokální maximum).
  • Ve všech ostatních případech nevíme.

[editovat] Příklad

Hledejme extrémy f = x2 + y3x. Z podmínky o nulových prvních derivací:

{{\partial{f}}\over{\partial{x}}}=2x+y^3=0, {{\partial{f}}\over{\partial{y}}}=3y^2x=0 
\Rightarrow x=0,y=0

Nyní určíme z Taylorova rozvoje koeficienty A,B takto:

A=2,B=3y^2=0, C=6yx=0 \Rightarrow K=2\mathrm{d}\ x^2

Silvesterovo kritérium říká, že nevíme: A > 1,ACB2 = 0. Z kvadriky je vidět, že kvadrika je pozitivně semidefinitní (nikde není záporná a pro hodnoty (0,y) je nulová), proto nejsme schopni touto metodou extrém ověřit. (numericky: je to sedlo.)

[editovat] Extrémy s vazbou

Máme hledat extrémy funkce f(x1,x2,...,xn), kde zůstáváme na vazbách g1(x1,x2,...,xn),...,gh(x1,x2,...,xn), kde h < n.

Můžeme použít dvě metody:

A. Vyjádříme co nejvíce proměnných z podmínek gi(...)
B. Na zbylé podmínky použijeme Lagrangeovy multiplikátory.


Má-li funkce v bodě extrém s vazbou (pokud jsme vazbu ještě nevyloučili pomocí bodu A.), potom platí:

\nabla\left(f(\dots)-\sum\lambda_i  g_i(\dots)\right)=0 \ \ \ \ \ \  (\spadesuit)

Nyní potřebuji vyjádřit λ1,...,λh, čehož dosáhnu:

α. Vyjádřením x,y,... podle λi z (♠) a dosazením do gi(...) = 0.
β. Využitím diferenciálních vztahů pro gi(...) snížím počet nutných diferenciálů ve výsledné kvadrice (to je nutné pro správnost výsledku! - kvadrika musí mít stejný počet diferenciálů jako je stupňů volnosti na kterých se s řešením pohybujeme!):


[editovat] α.

Teď známe λi a x,y,..., tedy máme všechny „kandidáty na extrém“. Nyní se chceme opět přesvědčit, zda extrém je minimum, maximum, nebo není vůbec. To určíme tak, že rozepíšeme totální diferenciál druhého řádu funkce F = f − λigi

\mathrm{d}^2F  ={{\partial^2{(f-\sum\lambda_i g_i)}}\over{\partial{x^2}}}\mathrm{d}x^2+
2{{\partial^2{(f-\sum\lambda_i g_i)}}\over{\partial{x}\partial{y}}}\mathrm{d}x\,\mathrm{d}y+
{{\partial^2{(f-\sum\lambda_i g_i)}}\over{\partial{y^2}}}\mathrm{d}y^2

Do těchto vztahů dosadíme za λi a x,y,... (které známe). Získáme tedy kvadratickou plochu, pro jejíž pozitivní/negativní definitnost použijeme výše zmíněné Silvesterovo kritérium. Tím jsme problém vyřešili.

[editovat] β.

\mathrm{d}g_i={{\partial{{g_i}}}\over{\partial{x}}}\mathrm{d}x+
{{\partial{{g_i}}}\over{\partial{y}}}\mathrm{d}y+\dots = 0

(Z těchto rovnic vyjádříme h diferenciálů, čímž zjednodušíme problém určení definitnosti kvadriky -- toto je pouze zjednodušující trik, není pro zbytek postupu nutný)

[editovat] Příklad

Podívejme se na naši známou fci f = x2 + y3x s jednou vazbou g = x2 + y2 − 1 = 0. Použijeme podmínku (♠):

\nabla f(\dots)=\lambda \nabla g(\dots)
(2x+y^3,3y^2x)=\lambda (2x,2y)\,

Vyjádřit x,y jde - vyjde bod (0,0) a čtyři body (z nichž 2 jsou komplexní a vyloučíme je) v závislosti na λ.

 x=0 , y= 0,\,
 x= {{{\mathrm{i}   \sqrt{2}  {{{(\lambda^2-\lambda)}^{3\over 4}}}\over {3^{3/4} (1-\lambda )}}
}},
y= 
{{{\mathrm{i}   \sqrt{2}  {\sqrt[4]{\lambda^2-\lambda}}}}\over{{\sqrt[4]{3}}}}
x= {{{\sqrt{2}}  {{({{\lambda }^2}-\lambda )}^{3/4}}}\over{{3^{3/4}}  (1-\lambda )}},y= -{{{\sqrt{2}}\over 
{\sqrt[4]{{{\lambda }^2}-\lambda }}}}{{\sqrt[4]{3}}}
x= {{\mathrm{i}   {\sqrt{2}}  {{\lambda^2-\lambda)}^{3/4}}}\over{{3^{3/4}}  (\lambda -1)}},y=
-{{\mathrm{i}   {\sqrt{2}}  {\sqrt[4]{{{\lambda }^2}-\lambda }}}\over{{\sqrt[4]{3}}}}
x= 
{{{\sqrt{2}}  {{({{\lambda }^2}-\lambda )}^{3/4}}}\over{{3^{3/4}}  (\lambda -1)}},y= {{{\sqrt{2}} 
{\sqrt[4]{{{\lambda }^2}-\lambda }}}\over{{\sqrt[4]{3}}}}
\lambda = {{1}\over{8}}
 \left(4-{{13}\over{{\sqrt[3]{62-3
 {\sqrt{183}}}}}}-{\sqrt[3]{62-3 
{\sqrt{183}}}}\right)
\lambda = {{1}\over{2}}+{{13 
\left(1+\mathrm{i} 
 {\sqrt{3}}\right)}\over{16
 {\sqrt[3]{62-3
{\sqrt{183}}}}}}+{{1}\over{16}}
 \left(1-\mathrm{i} 
{\sqrt{3}}\right)
 {\sqrt[3]{62-3
 {\sqrt{183}}}}
\lambda = {{1}\over{2}}+{{13  \left(1-   {\sqrt{3}}\right)}\over{16  {\sqrt[3]{62-3 
{\sqrt{183}}}}}}+{{1}\over{16}}  \left(1+   {\sqrt{3}}\right)  {\sqrt[3]{62-3  {\sqrt{183}}}}

Reálné řešení vyjde jen pro reálné (první) λ. Dva body řešení lze zapsat jako

(x,y)=(\mathrm{Root}(16x^6-24x^4+13x^2-1,2),\mathrm{Root}(16x^6-24x^4+13x^2-4,2))\approx
(0.302339, 0.953201),

kde funkce Root(P(x),n) dává n-tý kořen polynomu P(x) pro reálné kořeny řazeny vzestupně.

Z numerického řešení už je vidět, který z těchto dvou bodů je minimum a který maximum, abych předvedl metodu, ukážu ještě určení z druhého diferenciálu pro řešení 2 - minimum.

Použijeme bodu 2.

2x\ \mathrm{d}x+2y\ \mathrm{d}y=0 \Rightarrow \mathrm{d}y=-{{2x}\over{2y}}\mathrm{d}x

Zároveň ze druhé složky rovnice z (♠) víme, že

3y^2x=2y\lambda \Rightarrow y={{2\lambda}\over{3x}}.

Tedy dosadíme do:

\mathrm{d}^2F  =A\,\mathrm{d}x^2+
2B\,\mathrm{d}x\ \mathrm{d}y+
C\,\mathrm{d}y^2
A=\mathrm{Root}(16 x^3 - 48x^2 + 9x - 8, 1)\approx+2.86457
{B\over 3}=\mathrm{Root}(16x^3 - 24 x^2 + 13 x - 4 , 1)\approx+0.908591
C=\mathrm{Root}(16x^3 - 48x^2 + 9x + 54 , 1)\approx-0.864568

Aplikujeme-li převodní vztah pro diferenciál dy:

\mathrm{d}^2F  = (A -2{{x}\over{y}}B+{{x^2}\over{y^2}}C)
=\mathrm{Root}(2x^3 + 3x^2 - 244 , 1)\mathrm{d}x^2
\approx 4.50672>0

Jde tedy skutečně o minimum.

[editovat] Původní verze článku

původní verze článku