Hesjan, macierz Hessego – macierz (kwadratowa) drugich pochodnych cząstkowych obliczonych dla funkcji wielu zmiennych o wartościach rzeczywistych dwukrotnie różniczkowalnej w punkcie, w którym liczone są te pochodne. Macierz Hessego charakteryzuje własności krzywizny wykresu funkcji w otoczeniu tego punktu. Dlatego m. im. jest wyznaczana w punktach krytycznych przy wyszukiwaniu ekstremów i punktów przegięcia / punktów siodłowych funkcji wielu zmiennych.
Macierz Hessego jest macierzą formy kwadratowej, utworzonej z wyrazów drugiego rzędu rozwinięcia funkcji wielu zmiennych w pobliżu punktu krytycznego w szereg Taylora[1]. Dlatego badanie określoności macierzy Hessego jest równoważne badaniu określoności odpowiadającej jej formy kwadratowej.
Czasem pod pojęciem hesjanu rozumie się wyznacznik macierzy Hessego.
Nazwę hesjanu wprowadził James Joseph Sylvester dla upamiętnienia niemieckiego matematyka Ottona Hessego (1811–1874)[2].
Spis treści
- 1 Definicja
- 2 Właściwości
- 2.1 1. Symetria macierzy Hessego
- 2.2 2. Określoność macierzy Hessego a rodzaj punktu krytycznego
- 2.3 3. Wartości własne macierzy Hessego a rodzaj punktu krytycznego
- 2.4 4. Kryterium Sylvestera w określaniu rodzaju punktów krytycznych
- 2.5 5. Kryterium drugiej pochodnej dla funkcji dwóch zmiennych
- 2.6 6. Zestawienie kryteriów w określaniu punktów krytycznych
- 2.7 6. Niesymetryczna macierz Hessego a punkty krytyczne
- 3 Przykłady
- 4 Zobacz też
- 5 Przypisy
- 6 Linki zewnętrzne
Definicja
edytujNiech 👁 {\displaystyle D}
będzie niepustym, otwartym podzbiorem w 👁 {\displaystyle n}
-wymiarowej przestrzeni współrzędnych rzeczywistych 👁 {\displaystyle \mathbb {R} ^{n}}
oraz 👁 {\displaystyle f\colon D\to \mathbb {R} }
- funkcja dwukrotnie różniczkowalna w punkcie 👁 {\displaystyle \mathbf {x} \in D,}
choć niekoniecznie mająca ciągłe drugie pochodne; 👁 {\displaystyle \mathbf {x} =[x_{1},x_{2},\dots ,x_{n}]}
- punkt w 👁 {\displaystyle D}
.
Macierzą Hessego funkcji 👁 {\displaystyle f}
w punkcie 👁 {\displaystyle \mathbf {x} }
nazywamy macierz
gdzie 👁 {\displaystyle {\frac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}(\mathbf {x} ),\quad i,j=1,2,\dots ,n}
- pochodne cząstkowe drugiego rzędu obliczone w punkcie 👁 {\displaystyle \mathbf {x} .}
Uwaga: Oznaczenia
- Punkt w przestrzeni 👁 {\displaystyle n}
-wymiarowej oznaczamy wytłuszczonym symbolem 👁 {\displaystyle \mathbf {x} }
, zaś współrzędne tego punktu oznaczamy zwykłą czcionką 👁 {\displaystyle x_{i},i=1,2,\dots ,n}
. - Macierz Hessego oznacza się też symbolami 👁 {\displaystyle \nabla ^{2}}
, 👁 {\displaystyle D^{2}}
, 👁 {\displaystyle \nabla \nabla }
lub 👁 {\displaystyle \nabla \otimes \nabla }
. - W przypadku funkcji dwóch zmiennych 👁 {\displaystyle f(x,y)}
pochodne cząstkowe oznacza się też symbolami 👁 {\displaystyle f_{x},f_{y}}
- pochodne cząstkowe 1-go rzędu, 👁 {\displaystyle f_{xx},f_{xy},f_{yx},f_{yy}}
- pochodne cząstkowe 2-go rzędu. Analogicznie dla funkcji 3 zmiennych 👁 {\displaystyle f(x,y,z)}
.
Właściwości
edytuj1. Symetria macierzy Hessego
edytujJeśli funkcja 👁 {\displaystyle f}
ma ciągłe drugie pochodne w punkcie 👁 {\displaystyle \mathbf {x} }
, to macierz Hessego obliczona w tym punkcie jest symetryczna, tzn.
Innymi słowy: Macierz Hessego 👁 {\displaystyle H(\mathbf {x} )}
jest symetryczna w punkcie 👁 {\displaystyle \mathbf {x} }
jeżeli funkcja jest klasy 👁 {\displaystyle C^{2}}
w tym punkcie.
2. Określoność macierzy Hessego a rodzaj punktu krytycznego
edytujPunkt krytyczny to punkt '👁 {\displaystyle \mathbf {x} }
', w którym gradient 👁 {\displaystyle \nabla f(\mathbf {x} )=\left[{\tfrac {\partial f(\mathbf {x} )}{\partial x_{1}}},{\tfrac {\partial f(\mathbf {x} )}{\partial x_{2}}},\dots ,{\tfrac {\partial f(\mathbf {x} )}{\partial x_{n}}}\right]}
jest równy zeru,
co jest równoważne warunkowi zerowania się wszystkich pochodnych cząstkowych w tym punkcie
W punktach krytycznych funkcja może mieć ekstremum, punkt przegięcia, punkt siodłowy. Słuszne są następujące kryteria:
- Jeśli macierz Hessego jest dodatnio określona, to w punkcie krytycznym jest minimum lokalne.
- Jeśli macierz Hessego jest ujemnie określona, to w punkcie krytycznym jest maksimum lokalne.
- Jeśli macierz Hessego jest nieokreślona, to punkt krytyczny jest punktem siodłowym.
- Jeśli macierz Hessego jest półokreślona lub zdegenerowana, to trzeba zanalizować wyższe pochodne funkcji lub dokonać analizy geometrycznej wykresu funkcji w bliskim otoczeniu punktu krytycznego.
3. Wartości własne macierzy Hessego a rodzaj punktu krytycznego
edytujJeżeli macierz Hessego jest symetryczna w punkcie krytycznym, to charakter tego punktu można określić na podstawie wartości własnych 👁 {\displaystyle \lambda _{1},\lambda _{2},\dots ,\lambda _{n}}
macierzy Hessego:
- jeśli 👁 {\displaystyle \lambda _{i}>0}
, to punkt krytyczny jest minimum lokalnym, - jeśli 👁 {\displaystyle \lambda _{i}<0}
, to punkt krytyczny jest maksimum lokalnym, - jeśli wartości 👁 {\displaystyle \lambda _{i},i=1,2,\dots n}
mają , to punkt krytyczny jest punktem siodłowym, - jeżeli co najmniej jedna wartość własna jest zerowa, 👁 {\displaystyle \lambda _{i}=0}
, to test za pomocą macierzy Hessego nie pozwala stwierdzić, jakiego rodzaju jest punkt krytyczny.
4. Kryterium Sylvestera w określaniu rodzaju punktów krytycznych
edytujJeżeli macierz Hessego jest symetryczna w punkcie krytycznym, to do określania charakter tego punktu można użyć też kryterium Sylvestera:
(1) Minory główne wiodące macierzy Hessego wskazują na minimum lokalne, gdy wszystkie są dodatnie, zaś sekwencja znaków 👁 {\displaystyle -+-+\dots }
tych minorów, począwszy od minora 1-go stopnia do n-tego stopnia, wskazuje na lokalne maksimum.
(2) Minory główne 1-go stopnia (tj. elementy macierzy Hessego leżące na jej przekątnej) takie że co najmniej dwa z nich mają różne znaki, wskazują na punkt siodłowy (pozostałe minory mogą być zerami).
Ogólnie: macierz Hessego jest nieokreślona, gdy licząc minory główne stopnia 👁 {\displaystyle 1,2,\dots ,n}
znajdziemy przynajmniej dwa minory tego samego stopnia, które mają różne znaki - wtedy mamy punkt siodłowy w punkcie krytycznym.
(3) Gdy wszystkie minory główne stopnia 👁 {\displaystyle 1,2\dots ,n}
są 👁 {\displaystyle \geqslant 0}
oraz istnieje przynajmniej jeden element macierzy Hessego, który jest niezerowy, to macierz Hessego jest dodatnio półokreślona.
(4) Gdy minory główne są 👁 {\displaystyle \leqslant 0}
dla stopni nieparzystych i 👁 {\displaystyle \geqslant 0}
dla stopni parzystych, oraz istnieje przynajmniej jeden element macierzy Hessego niezerowy, to macierz Hessego jest ujemnie półokreślona.
(5) Gdy wszystkie elementy macierzy Hessego są równe zeru, to macierz Hessego jest zdegenerowana.
W przypadkach (3), (4) i (5) kryterium macierzy Hessego nie rozstrzyga co do rodzaju punktu krytycznego; trzeba badać wyższe pochodne lub stosować metodę analizy geometrycznej wykresu funkcji w bliskim otoczeniu punktu krytycznego.
Uwaga: Dla dużej wartości 👁 {\displaystyle n}
wymiaru macierzy Hessego bardziej praktyczne może być liczenie wartości własnych tej macierzy, gdyż w skrajnie niekorzystnym przypadku metoda Sylvestera wymagałaby liczenia wszystkich minorów głównych, których jest 👁 {\displaystyle 2^{n}-1}
, czyli wielokrotnie więcej niż minorów głównych wiodących.
5. Kryterium drugiej pochodnej dla funkcji dwóch zmiennych
edytujKryterium to jest szczególnym przypadkiem kryterium Sylvestera.
(1) Jeżeli w punkcie 👁 {\displaystyle \mathbf {x} =(x,y)}
jest 👁 {\displaystyle {\text{det}}H(\mathbf {x} )>0}
, to funkcja 👁 {\displaystyle f(x,y)}
ma ekstremum w tym punkcie, przy czym:
- jeżeli 👁 {\displaystyle f_{xx}>0}
, to ma minimum lokalne
- jeżeli 👁 {\displaystyle f_{xx}<0}
, to ma maksimum lokalne
(2) Jeżeli jest 👁 {\displaystyle {\text{det}}H(\mathbf {x} )<0}
, to punkt 👁 {\displaystyle \mathbf {x} }
jest punktem siodłowym.
Uwaga 1: W przypadku punktu siodłowego 👁 {\displaystyle f_{xx}}
może mieć dowolną wartość, tj.👁 {\displaystyle f_{xx}>0,=0,<0}
.
Uwaga 2: Nie da się podać tak prostych warunków dla funkcji trzech i większej liczby zmiennych.
6. Zestawienie kryteriów w określaniu punktów krytycznych
edytujPoniżej w tabeli zebrano podsumowanie wyżej wymienionych kryteriów.
| Określoność macierzy Hessego | Rodzaj punktu krytycznego | Wartości własne | Minory główne wiodące i minory główne (kryterium Sylvestera) |
|---|---|---|---|
| Dodatnio określona | Minimum lokalne | Wszystkie 👁 {\displaystyle \lambda _{i}>0} |
Wszystkie główne minory wiodące 👁 {\displaystyle \Delta _{i}>0} |
| Ujemnie określona | Maksimum lokalne | Wszystkie 👁 {\displaystyle \lambda _{i}<0} |
Minory wiodące główne mają znaki naprzemienne 👁 {\displaystyle \Delta _{1}<0,\Delta _{2}>0,\Delta _{3}<0,\dots } zaczynając od minora 👁 {\displaystyle \Delta _{1}} o 1 elemencie |
| Nieokreślona | Punkt siodłowy | Część 👁 {\displaystyle \lambda _{i}>0} część 👁 {\displaystyle \lambda _{i}<0} |
Przynajmniej dwa minory główne (nie tylko wiodące) tego samego stopnia mają różne znaki |
| Półokreślona dodatnio | Test nie rozstrzyga | Wszystkie 👁 {\displaystyle \lambda _{i}\geqslant 0} , co najmniej jedno 👁 {\displaystyle \lambda _{i}=0} |
Wszystkie minory główne (nie tylko wiodące) stopnia od 1 do n są 👁 {\displaystyle \geqslant 0} oraz przynajmniej jeden minor dowolnego stopnia jest dodatni |
| Półokreślona ujemnie | Test nie rozstrzyga | Wszystkie 👁 {\displaystyle \lambda _{i}\leqslant 0} , co najmniej jedno 👁 {\displaystyle \lambda _{i}=0} |
Wszystkie minory główne stopnia nieparzystego są 👁 {\displaystyle \leqslant 0} , a stopnia parzystego są 👁 {\displaystyle \geqslant 0} oraz przynajmniej jeden minor dowolnego stopnia jest niezerowy |
| Zdegenerowana | Test nie rozstrzyga | Wszystkie 👁 {\displaystyle \lambda _{i}=0} |
Macierz Hessego jest zerowa |
Uwaga: Dla funkcji jednej zmiennej 👁 {\displaystyle f(x)}
macierz Hessego ma postać macierzy 👁 {\displaystyle 1\times 1}
, tj. 👁 {\displaystyle H(x):={\begin{bmatrix}f_{xx}(x)\end{bmatrix}}}
. Jeżeli 👁 {\displaystyle f_{x}(x)=0}
(warunek, że punkt 👁 {\displaystyle x}
jest punktem krytycznym), to z powyższej tabeli wynika, że:
a). gdy 👁 {\displaystyle \Delta _{1}=f_{xx}(x)>0}
, to w 👁 {\displaystyle x}
jest minimum
b). gdy 👁 {\displaystyle \Delta _{1}=f_{xx}(x)<0}
, to w 👁 {\displaystyle x}
jest maksimum
Są to dobrze znane warunki na ekstrema funkcji jednej zmiennej w punkcie krytycznym.
Z tabeli widać też, że dla funkcji 1 zmiennej kryterium nie stosuje się do rozstrzygania nt. punktów siodłowych (bo brak dwóch wartości własnych; punkty siodłowe mogą mieć dopiero funkcje 2 i większej liczby zmiennych).
6. Niesymetryczna macierz Hessego a punkty krytyczne
edytujJeżeli macierz Hessego nie jest symetryczna w punkcie krytycznym, to charakteru tego punktu nie da się określić za pomocą macierzy Hessego. Trzeba stosować inne metody - np. metody geometryczne (por. przykład dalej).
Przykłady
edytuj1. Funkcja z symetryczną macierzą Hessego. Extremum funkcji
edytujDla funkcji dwóch zmiennych:
oblicz (a). macierz Hessego, (b). jej wartości własne, (c). ekstrema funkcji.
Rozwiązanie:
(a). Punkt krytyczny wyznaczamy z warunku: 👁 {\displaystyle \nabla f=(0,\;0)}
. Ponieważ 👁 {\displaystyle \nabla f=(f_{x},\;f_{y})=(2x+y,\;x+2y)}
, to otrzymujemy 👁 {\displaystyle x=0,\;y=0.}
(b). Obliczamy pochodne cząstkowe pierwszego rzędu: 👁 {\displaystyle f_{x}=2x+y,\quad f_{y}=x+2y}
oraz pochodne cząstkowe drugiego rzędu:👁 {\displaystyle f_{xx}=2,\;f_{yy}=2,\;f_{xy}=f_{yx}=1.}
Stąd mamy: 👁 {\displaystyle H(x,y)={\begin{bmatrix}2&1\\[4pt]1&2\end{bmatrix}}}
(c). Równanie charakterystyczne: 👁 {\displaystyle \det(H_{f}-\lambda I)=(2-\lambda )^{2}-1=0\Rightarrow 2-\lambda =\pm 1,}
stąd mamy wartości własne 👁 {\displaystyle \lambda _{1}=1,\;\lambda _{2}=3.}
Obie wartości własne są dodatnie, więc macierz 👁 {\displaystyle H_{f}}
jest dodatnio określona - funkcja ma więc minimum w punkcie krytycznym. Wartość funkcji w minimum wynosi 👁 {\displaystyle f(0,0)=0}
. Punkt 👁 {\displaystyle (0,0)}
jest jedynym i globalnym minimum funkcji, ponieważ macierz 👁 {\displaystyle H(\mathbf {x} )}
jest dodatnio określona w całej dziedzinie funkcji (funkcja jest więc ściśle wypukła).
2. Funkcja z niesymetryczną macierzą Hessego. Punkt siodłowy
edytujw otoczeniu punktu👁 {\displaystyle (0,0)}
zmienia osiem razy znak - punkt ten jest punktem siodłowym.
Pokaż, że dla funkcji
gradient w punkcie 👁 {\displaystyle (0,0)}
zeruje się, ale pochodne mieszane w tym punkcie są różne, tj. 👁 {\displaystyle f_{xy}(0,0)\neq f_{yx}(0,0).}
Określ rodzaj punktu krytycznego funkcji.
(a). Pochodne pierwszego rzędu w punkcie 👁 {\displaystyle (0,0)}
Dla 👁 {\displaystyle y=0}
mamy 👁 {\displaystyle f(x,0)=0}
, więc
Analogicznie 👁 {\displaystyle f_{y}(0,0)=0}
. Wynika stąd, że gradient w punkcie 👁 {\displaystyle (0,0)}
zeruje się - punkt ten jest więc punktem krytycznym.
(b). Obliczenie pochodnej 👁 {\displaystyle f_{xy}(x,y)}
w punkcie 👁 {\displaystyle (0,0)}
Najpierw liczymy pochodną cząstkową względem 👁 {\displaystyle x}
wzdłuż osi 👁 {\displaystyle x=0}
dla 👁 {\displaystyle y\neq 0}
Dla 👁 {\displaystyle h\neq 0}
, 👁 {\displaystyle y\neq 0}
mamy
więc
Stąd
(c). Obliczenie pochodnej 👁 {\displaystyle f_{yx}(0,0)}
w punkcie 👁 {\displaystyle (0,0)}
Najpierw liczymy pochodną względem 👁 {\displaystyle y}
wzdłuż osi 👁 {\displaystyle y=0}
dla 👁 {\displaystyle x\neq 0}
Dla 👁 {\displaystyle k\neq 0}
, 👁 {\displaystyle x\neq 0}
mamy
więc
Stąd
(d). Wniosek
Pochodne mieszane w punkcie 👁 {\displaystyle (0,0)}
są różne:
Oznacza to, że funkcja nie należy do klasy 👁 {\displaystyle C^{2}}
w punkcie 👁 {\displaystyle (0,0)}
, a hesjan nie jest symetryczny. Punkt 👁 {\displaystyle (0,0)}
jest jednak punktem krytycznym. Aby określić jego charakter, nie można posłużyć się kryterium z wartościami własnym hesjanu (są de facto liczbami zespolonymi). Aby to rozstrzygnąć, wystarczy zauważyć, że przekroje wykresu funkcji poprowadzone przez punkt krytyczny zmieniają osiem razy krzywiznę z ujemnej na dodatnią przy obrocie o 👁 {\displaystyle 360}
stopni wokół tego punktu - oznacza to, że funkcja wokół 👁 {\displaystyle (0,0)}
przyjmuje wartości zarówno większe jak i mniejsze niż w punkcie 👁 {\displaystyle (0,0)}
, więc w punkcie tym mamy siodło.
3. Macierz Hessego zdegenerowana. Ale funkcja ma extremum w punkcie krytycznym
edytujDla funkcji 👁 {\displaystyle f(x,y)=x^{4}+y^{4}}
mamy
a). Punkt krytyczny:
👁 {\displaystyle \nabla f={\begin{pmatrix}4x^{3}\\4y^{3}\end{pmatrix}}=0\implies (x,y)=(0,0)}
b). Hesjan w punkcie krytycznym:
Wszystkie minory 👁 {\displaystyle =0}
, wszystkie wartości własne też są zerowe - macierz Hessego jest zdegenerowana. Kryterium drugiej pochodnej jest więc niewystarczające. Jednak problem da się łatwo rozwiązać; wystarczy zauważyć , że w punkcie 👁 {\displaystyle (0,0)}
funkcja zeruje się, natomiast dla wszystkich innych punktów 👁 {\displaystyle (x,y)}
z dziedziny funkcji wartość funkcji jest większa od zera; z definicji ekstremów wynika, że punkt 👁 {\displaystyle (0,0)}
jest minimum globalnym.
Zobacz też
edytujPrzypisy
edytuj- ↑ hesjan, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2022-02-18].
- ↑ 👁 publikacja w otwartym dostępie – możesz ją przeczytać
Jeff Miller, Hessian [w:] Earliest Known Uses of Some of the Words of Mathematics (D) (ang.), MacTutor History of Mathematics archive, University of St Andrews, mathshistory.st-andrews.ac.uk [dostęp 2022-02-18].
Linki zewnętrzne
edytujTeksty:
- Barbara Biły, Ekstremum funkcji wielu zmiennych, Katedra Matematyki, Politechnika Śląska [dostęp 2025-11-26]
- Eric W.E.W. Weisstein, Hessian, [w:] MathWorld, Wolfram Research (ang.). [dostęp 2023-06-01]
Filmy:
- Ekstremum funkcji wielu zmiennych, ekstrema warunkowe - rozwiązywanie zadań, kanał Matematyka Na Plus na YouTube
| pojęcia ogólne | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| pochodne funkcji | |||||||||||
| pojęcia definiowane pochodnymi |
| ||||||||||
| analiza wielo- -wymiarowa(inne języki) |
| ||||||||||
| równania różniczkowe | |||||||||||
| twierdzenia o funkcjach według liczby zmiennych |
| ||||||||||
| badacze według daty narodzin |
| ||||||||||
| inne wątki historyczne |
👁 Image
przykład prostej stycznej
