Hessische matrix (oder hesse)

Diese Seite ist sicherlich die umfassendste Erklärung der Hessischen Matrix, die es gibt. Hier wird das Konzept der Hesse-Matrix erklärt, wie man sie anhand von Beispielen berechnet und es gibt sogar mehrere gelöste Übungen zum Üben. Darüber hinaus erfahren Sie, wie die Maximal- und Minimalwerte einer multivariablen Funktion berechnet werden und ob es sich um eine konkave oder konvexe Funktion handelt. Und schließlich finden Sie dort auch die Dienstprogramme und Anwendungen der hessischen Matrix.

Was ist die Hessische Matrix?

Die Definition der hessischen (oder hessischen) Matrix lautet wie folgt:

Die Hesse-Matrix ist eine quadratische Matrix der Dimension n × n, die aus den partiellen zweiten Ableitungen einer Funktion von n Variablen besteht.

Diese Matrix ist auch als Hessische Matrix bekannt, oder in einigen Mathematikbüchern wird sie sogar als Diskriminante bezeichnet. Die gebräuchlichste Bezeichnung dafür ist jedoch die Hesse-Matrix.

Die Formel für die Hesse-Matrix lautet daher wie folgt:

Hessische oder hessische Matrixformel

Daher ist die Hesse-Matrix immer eine quadratische Matrix, deren Dimension gleich der Anzahl der Variablen in der Funktion ist. Wenn die Funktion beispielsweise drei Variablen hat, hat die Hesse-Matrix die Dimension 3×3.

Darüber hinaus besagt der Satz von Schwarz (oder der Satz von Clairaut), dass die Reihenfolge der Differenzierung keine Rolle spielt, dh teilweise zuerst in Bezug auf die Variable ableiten

x_1

dann in Bezug auf die Variable

x_2

kommt einer teilweisen Differenzierung in Bezug auf gleich

x_2

dann Respekt

x_1

.

\displaystyle \cfrac{\partial^2 f}{\partial x_i\partial x_j} = \cfrac{\partial^2 f}{\partial x_j\partial x_i}

Daher ist die Hesse-Matrix eine symmetrische Matrix, oder mit anderen Worten, sie hat eine Symmetrie, deren Achse ihre Hauptdiagonale ist.

Kurioserweise ist die Hessische Matrix nach Ludwig Otto Hesse benannt, einem deutschen Mathematiker des 19. Jahrhunderts, der sehr wichtige Beiträge auf dem Gebiet der linearen Algebra leistete.

Beispiel für die Berechnung der Hessischen Matrix

Sehen wir uns ein Beispiel an, wie man eine Hesse-Matrix mit der Dimension 2 × 2 findet:

  • Berechnen Sie die Hesse-Matrix am Punkt (1,0) der folgenden Funktion:

\displaystyle  f(x,y)=y^4+x^3+3x^2+ 4y^2 -4xy -5y +8

Zuerst müssen wir die partiellen Ableitungen erster Ordnung berechnen:

\displaystyle \cfrac{\partial f}{\partial x} = 3x^2 +6x -4y

\displaystyle \cfrac{\partial f}{\partial y} = 4y^3+8y -4x -5

Sobald wir die ersten Ableitungen bereits kennen, berechnen wir alle partiellen Ableitungen zweiter Ordnung:

\displaystyle \cfrac{\partial^2 f}{\partial x^2} = 6x +6

\displaystyle \cfrac{\partial^2 f}{\partial y^2} =12y^2 +8

\displaystyle \cfrac{\partial^2 f}{\partial x \partial y} = \cfrac{\partial^2 f}{\partial y \partial x}= -4

Daher können wir nun die Hesse-Matrix aus der Formel für 2 × 2-Matrizen ermitteln:

\displaystyle H_f (x,y)=\begin{pmatrix}\cfrac{\partial^2 f}{\partial x^2} & \cfrac{\partial^2 f}{\partial x \partial y} \\[4ex] \cfrac{\partial^2 f}{\partial y \partial x} & \cfrac{\partial^2 f}{\partial y^2} \end{pmatrix}

\displaystyle H_f (x,y)=\begin{pmatrix}6x +6 &-4 \\[2ex] -4 & 12y^2+8 \end{pmatrix}

Somit lautet die am Punkt (1,0) ausgewertete Hesse-Matrix:

\displaystyle H_f (1,0)=\begin{pmatrix}6(1) +6 &-4 \\[2ex] -4 & 12(0)^2+8 \end{pmatrix}

Sackleinen- oder Sackleinen-Stanzbeispiele

Probleme mit hessischen Matrizen gelöst

Übung 1

Berechnen Sie die Hesse-Matrix der folgenden Funktion mit 2 Variablen am Punkt (1,1):

\displaystyle  f(x,y)=x^2y+y^2x

Zuerst müssen wir die partiellen Ableitungen erster Ordnung der Funktion finden:

\displaystyle \cfrac{\partial f}{\partial x} = 2xy+y^2

\displaystyle \cfrac{\partial f}{\partial y} = x^2+2yx

Nachdem wir bereits die ersten Ableitungen berechnet haben, fahren wir mit der Lösung aller partiellen Ableitungen zweiter Ordnung fort:

\displaystyle \cfrac{\partial^2 f}{\partial x^2} = 2y

\displaystyle \cfrac{\partial^2 f}{\partial y^2} =2x

\displaystyle \cfrac{\partial^2 f}{\partial x \partial y} = \cfrac{\partial^2 f}{\partial y \partial x}=2x+2y

Somit ist die Hesse-Matrix wie folgt definiert:

Gelöste Übung der hessischen bzw. hessischen Matrix der Dimension 2x2

Abschließend bleibt nur noch die Auswertung der Hesse-Matrix bei Punkt (1,1):

\displaystyle H_f (1,1)=\begin{pmatrix}2\cdot 1 &2 \cdot 1+2\cdot 1 \\[1.5ex] 2\cdot 1+2\cdot 1 & 2\cdot 1 \end{pmatrix}

\displaystyle \bm{H_f (1,1)}=\begin{pmatrix}\bm{2} & \bm{4} \\[1.1ex] \bm{4} & \bm{2} \end{pmatrix}

Übung 2

Berechnen Sie den Hesse-Wert am Punkt (1,1) der folgenden Funktion in zwei Variablen:

\displaystyle  f(x,y)= e^{y\ln x}

Zuerst müssen wir die partiellen Ableitungen erster Ordnung der Funktion berechnen:

\displaystyle \cfrac{\partial f}{\partial x} = e^{y\ln x} \cdot \cfrac{y}{x}

\displaystyle \cfrac{\partial f}{\partial y} = e^{y\ln x} \cdot \ln x

Sobald wir die ersten Ableitungen haben, berechnen wir die partiellen Ableitungen zweiter Ordnung der Funktion:

\displaystyle \cfrac{\partial^2 f}{\partial x^2} = e^{y\ln x} \cdot \cfrac{y^2}{x^2} - e^{y\ln x} \cdot \cfrac{y}{x^2}

\displaystyle \cfrac{\partial^2 f}{\partial y^2} =e^{y\ln x} \cdot \ln ^2 x

\displaystyle \cfrac{\partial^2 f}{\partial x \partial y}=\cfrac{\partial^2 f}{\partial y \partial x} =e^{y\ln x} \cdot \cfrac{y}{x}\cdot \ln x + e^{y\ln x}\cdot \cfrac{1}{x}

Somit ist die Hesse-Matrix der Funktion eine quadratische Matrix der Dimension 2×2:

Gelöste Hesse-Übung oder Hesse-Matrix der Dimension 2x2

Abschließend bleibt nur noch die Auswertung der Hesse-Matrix bei Punkt (1,1):

\displaystyle H_f (1,1)=\begin{pmatrix} e^{1\ln (1)} \displaystyle \cdot \cfrac{1^2}{1^2} - e^{1\ln (1)} \cdot \cfrac{1}{1^2}& e^{1\ln (1)} \cdot \cfrac{1}{1}\cdot \ln (1) + e^{1\ln (1)}\cdot \cfrac{1}{1} \\[3ex] e^{1\ln (1)} \cdot \cfrac{1}{1}\cdot \ln (1) + e^{1\ln (1)}\cdot \cfrac{1}{1} & e^{1\ln (1)} \cdot \ln ^2 (1) \end{pmatrix}

\displaystyle H_f (1,1)=\begin{pmatrix}e^{0} \cdot 1 - e^{0} \cdot 1& e^{0} \cdot 1\cdot 0 + e^{0}\cdot 1 \\[2ex] e^{0} \cdot 1\cdot 0 + e^{0}\cdot 1 & e^{0} \cdot 0\end{pmatrix}

\displaystyle H_f (1,1)=\begin{pmatrix}1 - 1& 0+ 1 \\[1.5ex] 0 +1 & 1 \cdot 0\end{pmatrix}

\displaystyle \bm{H_f (1,1)}=\begin{pmatrix}\bm{0} & \bm{1} \\[1.1ex] \bm{1} & \bm{0} \end{pmatrix}

Übung 3

Finden Sie die Hesse-Matrix an diesem Punkt

(0,1,\pi)

der folgenden Funktion mit 3 Variablen:

\displaystyle  f(x,y,z)= e^{-x}\cdot \text{sen}(yz)

Zuerst berechnen wir die partiellen Ableitungen erster Ordnung der Funktion:

\displaystyle \cfrac{\partial f}{\partial x} = -e^{-x}\cdot \text{sen}(yz)

\displaystyle \cfrac{\partial f}{\partial y} = ze^{-x}\cdot \text{cos}(yz)

\displaystyle \cfrac{\partial f}{\partial z} = ye^{-x}\cdot \text{cos}(yz)

Sobald wir die ersten Ableitungen haben, berechnen wir die partiellen Ableitungen zweiter Ordnung der Funktion:

\displaystyle \cfrac{\partial^2 f}{\partial x^2} =e^{-x}\cdot \text{sen}(yz)

\displaystyle \cfrac{\partial^2 f}{\partial x \partial y}=\cfrac{\partial^2 f}{\partial y \partial x} =-ze^{-x}\cdot \text{cos}(yz)

\displaystyle \cfrac{\partial^2 f}{\partial x \partial z}=\cfrac{\partial^2 f}{\partial z \partial x} =-ye^{-x}\cdot \text{cos}(yz)

\displaystyle \cfrac{\partial^2 f}{\partial y^2} =-z^2e^{-x}\cdot \text{sen}(yz)

\displaystyle \cfrac{\partial^2 f}{\partial y \partial z}=\cfrac{\partial^2 f}{\partial z \partial y} =e^{-x}\cdot \text{cos}(yz)-yze^{-x}\cdot \text{sen}(yz)

\displaystyle \cfrac{\partial^2 f}{\partial^2 z} = -y^2e^{-x}\cdot \text{sen}(yz)

Damit ist die Hesse-Matrix der Funktion eine quadratische Matrix der Dimension 3×3:

Beispiel für Sackleinen oder Sackleinenmatrix mit der Abmessung 3x3

Abschließend ersetzen wir die Variablen durch ihre jeweiligen Werte an der Stelle

(0,1,\pi):

\displaystyle H_f(0,1,\pi)=\begin{pmatrix}e^{-0}\cdot \text{sen}(1\pi) & -\pi e^{-0}\cdot \text{cos}(1\pi) &-1e^{-0}\cdot \text{cos}(1\pi) \\[1.5ex] -\pi e^{-0}\cdot \text{cos}(1 \pi)&-\pi^2e^{-0}\cdot \text{sen}(1 \pi) &e^{-0}\cdot \text{cos}(1 \pi)-1 \pi e^{-0}\cdot \text{sen}(1 \pi) \\[1.5ex] -1e^{-0}\cdot \text{cos}(1 \pi)& e^{-0}\cdot \text{cos}(1 \pi)-1 \pi e^{-0}\cdot \text{sen}(1 \pi)& -1^2e^{-0}\cdot \text{sen}(1 \pi) \end{pmatrix}

\displaystyle H_f(0,1,\pi)=\begin{pmatrix}1\cdot 0 & -\pi \cdot 1 \cdot (-1)&-1\cdot 1 \cdot (-1) \\[1.5ex] -\pi \cdot 1 \cdot (-1) &-\pi^2\cdot 1\cdot 0 &1 \cdot (-1)-\pi \cdot 1\cdot 0 \\[1.5ex] -1\cdot 1 \cdot (-1) & 1\cdot (-1) - \pi \cdot 1\cdot 0 & -1\cdot 1 \cdot 0 \end{pmatrix}

Übung Schritt für Schritt gelöst zur hessischen bzw. hessischen Matrix der Dimension 3x3

Übung 4

Bestimmen Sie die Hesse-Matrix am Punkt (2,-1,1,-1) der folgenden Funktion mit 4 Variablen:

\displaystyle  f(x,y,z,w)= 2x^3y^4zw^2 - 2y^3w^4+ 3x^2z^2

Der erste Schritt besteht darin, die partiellen Ableitungen erster Ordnung der Funktion zu finden:

\displaystyle \cfrac{\partial f}{\partial x} =6x^2y^4zw^2 + 6xz^2

\displaystyle \cfrac{\partial f}{\partial y} =8x^3y^3zw^2 - 6y^2w^4

\displaystyle \cfrac{\partial f}{\partial z} = 2x^3y^4w^2 + 6x^2z

\displaystyle \cfrac{\partial f}{\partial w} =4x^3y^4zw - 8y^3w^3

Nun lösen wir die partiellen Ableitungen zweiter Ordnung der Funktion:

\displaystyle \cfrac{\partial^2 f}{\partial x^2} =12xy^4zw^2 + 6z^2

\displaystyle \cfrac{\partial^2 f}{\partial x \partial y}=\cfrac{\partial^2 f}{\partial y \partial x}=24x^2y^3zw^2

\displaystyle \cfrac{\partial^2 f}{\partial x \partial z}=\cfrac{\partial^2 f}{\partial z \partial x}=6x^2y^4w^2 + 12xz

\displaystyle \cfrac{\partial^2 f}{\partial x \partial w} = \cfrac{\partial^2 f}{\partial w \partial x}=12x^2y^4zw

\displaystyle \cfrac{\partial^2 f}{\partial y^2} =24x^3y^2zw^2 - 12yw^4

\displaystyle \cfrac{\partial^2 f}{\partial y \partial z}=\cfrac{\partial^2 f}{\partial y \partial z}=8x^3y^3w^2

\displaystyle \cfrac{\partial^2 f}{\partial y \partial w} = \cfrac{\partial^2 f}{\partial w \partial y}=16x^3y^3zw - 24y^2w^3

\displaystyle \cfrac{\partial^2 f}{\partial^2 z} =6x^2

\displaystyle \cfrac{\partial^2 f}{\partial z \partial w} = \cfrac{\partial^2 f}{\partial w \partial z}=4x^3y^4w

\displaystyle \cfrac{\partial^2 f}{\partial^2 w} =4x^3y^4z - 24y^3w^2

Somit ist der Ausdruck der 4×4-Hesse-Matrix, die durch Lösen aller partiellen Ableitungen erhalten wird, der folgende:

Beispiel Schritt für Schritt gelöst aus Sackleinen oder Sackleinenmatrix der Dimension 4x4

Schließlich ersetzen wir die Unbekannten durch ihre jeweiligen Punktwerte (2,-1,1,-1) und führen die Berechnungen durch:

Übung Schritt für Schritt gelöst zur hessischen bzw. hessischen Matrix der Dimension 4x4

Woher wissen Sie, wann die Hesse-Matrix positiv, negativ oder unbestimmt ist?

Wie wir später sehen werden, ist es sehr nützlich zu wissen, ob die Hessische Matrix eine positiv semidefinite, positiv definite, negative semidefinite, negativ definite oder unbestimmte Matrix ist. Mal sehen, wie wir das herausfinden können:

Kriterium der Eigenwerte (oder Eigenwerte)

Eine Möglichkeit herauszufinden, um welche Art von Matrix es sich handelt, besteht darin, die Eigenwerte (oder Eigenwerte) der Hesse-Matrix durchzugehen:

  • Die Hesse-Matrix ist positiv semidefinit, wenn sie Eigenwerte (oder Eigenwerte) gleich und größer als Null aufweist. Das heißt, es hat positive Eigenwerte und mindestens einen gleich 0:

\lambda \geq 0

  • Die Hesse-Matrix ist positiv definit , wenn alle ihre Eigenwerte (oder Eigenwerte) ausschließlich größer als 0 (positiv) sind:

\lambda > 0″ title=“Rendered by QuickLaTeX.com“ height=“14″ width=“43″ style=“vertical-align: -2px;“></p>
</p>
<ul>
<li> Die Hesse-Matrix ist <span style=negativ semidefinit, wenn sie Eigenwerte (oder Eigenwerte) gleich und kleiner als Null hat. Das heißt, es hat negative Eigenwerte und mindestens einen gleich 0:

\lambda \leq 0

  • Die Hesse-Matrix ist negativ definit , wenn alle ihre Eigenwerte (oder Eigenwerte) kleiner als 0 (negativ) sind:

\lambda < 0

  • Die Hesse-Matrix ist undefiniert , wenn sie positive und negative Eigenwerte (oder Eigenwerte) hat:

\lambda > 0 \qquad \lambda <0

Sylvester-Kriterium

Eine andere Möglichkeit herauszufinden, um welchen Typ es sich bei der Hessischen Matrix handelt, ist die Verwendung des Sylvester-Kriteriums. Dieser Satz lässt uns jedoch nur wissen, ob sie positiv definit, negativ definit oder unbestimmt ist. Aber manchmal kann die Verwendung viel schneller sein, da die Berechnungen im Allgemeinen einfacher sind.

Somit lautet das Sylvester-Kriterium wie folgt:

  • Wenn alle Hauptminorwerte der Hesse-Matrix größer als 0 sind, handelt es sich um eine positiv definite Matrix.
  • Wenn die Hauptminorwerte der Hesse-Matrix mit geradem Index größer als 0 und diejenigen mit ungeradem Index kleiner als 0 sind, handelt es sich um eine negativ definite Matrix.
  • Wenn alle Hauptminorwerte der hessischen Matrix ungleich 0 sind und keine der beiden vorherigen Bedingungen erfüllt ist, handelt es sich um eine unbestimmte Matrix.
Hauptminderjährige einer hessischen Matrix

Offensichtlich fällt das maximale Haupt-Moll der Hesse-Matrix immer mit seiner Determinante zusammen. Nur zu Informationszwecken wird die Determinante der Hesse-Matrix auch „die Hesse-Matrix“ genannt, obwohl wir dies hier nicht tun, um Verwirrung zu vermeiden.

So berechnen Sie ein Maximum oder Minimum einer Funktion mit der Hesse-Matrix

Sobald Sie wissen, wie man die Hesse-Matrix berechnet, fragen Sie sich wahrscheinlich: Und wofür wird diese Matrix verwendet?

Nun, eine der Anwendungen der Hessischen Matrix besteht darin, das Maximum oder Minimum einer Funktion mit mehr als einer Variablen zu finden. Hier finden Sie eine Schritt-für-Schritt-Erklärung zur Berechnung von Maxima und Minima:

  1. Zunächst werden die kritischen Punkte der multivariablen Funktion berechnet. Dazu berechnen wir den Gradienten bzw. die Jacobi-Matrix der Funktion, setzen diese gleich 0 und lösen die Gleichungen.
  2. Die hessische Matrix wird berechnet.
  3. Die in Schritt 1 gefundenen kritischen Punkte werden in die Hesse-Matrix eingesetzt. Wir erhalten somit so viele Hesse-Matrizen, wie kritische Punkte die Funktion haben.
  4. Wir schauen uns an, um welchen Matrixtyp es sich bei jeder hessischen Matrix handelt. Das heißt, wir schauen, ob es positiv definit, negativ definit, unbestimmt usw. ist.
    • Wenn die Hesse-Matrix positiv definit ist, ist der kritische Punkt ein relatives Minimum der Funktion.
    • Wenn die Hesse-Matrix negativ definit ist, ist der kritische Punkt ein relatives Maximum der Funktion.
    • Wenn die Hesse-Matrix undefiniert ist, ist der kritische Punkt ein Sattelpunkt .

Beispiel für die Berechnung von Maxima und Minima einer multivariablen Funktion

Um zu sehen, wie dies geschieht, finden Sie hier ein Beispiel für die Berechnung und Klassifizierung der relativen Extrema einer Funktion mithilfe der Hesse-Matrix:

  • Finden Sie alle relativen Extrema der folgenden multivariablen Funktion:

\displaystyle  f(x,y)=x^2-y^2+2xy+ 4x-4y

Als Erstes müssen wir die Jacobi-Matrix der Funktion berechnen, die in diesem Fall mit dem Gradienten übereinstimmt, da es sich um eine Skalarfunktion handelt:

\displaystyle \nabla f (x,y)=(2x+2y+4 \ , \ -2y+2x-4 )

Wir müssen nun die kritischen Punkte bestimmen, dazu gleichen wir die erhaltenen Gleichungen auf 0 aus und lösen das Gleichungssystem:

\displaystyle \nabla f (x,y)=0

\displaystyle \left. \begin{array}{l} 2x+2y+4 =0 \\[2ex] -2y+2x-4=0 \end{array}\right\} \longrightarrow \left. \begin{array}{c} x = 0 \\[1.1ex] y = -2 \end{array}\right\} \longrightarrow \ (0,-2)

Der kritische Punkt, den wir gefunden haben, ist also (0,-2).

Nachdem der kritische Punkt der Funktion gefunden wurde, müssen wir die Hessesche Matrix berechnen:

\displaystyle H_f (x,y)=\begin{pmatrix}2 & 2 \\[1.1ex] 2 & -2  \end{pmatrix}

Und natürlich ist die am kritischen Punkt ausgewertete Hesse-Matrix dieselbe:

\displaystyle H_f (0,-2)=\begin{pmatrix}2 & 2 \\[1.1ex] 2 & -2 \end{pmatrix}

Um zu sehen, um welche Art von Matrix es sich handelt, verwenden wir das Sylvester-Kriterium. Wir lösen daher die Hauptminorwerte der Matrix:

\displaystyle \begin{vmatrix}2 \end{vmatrix} = 2

\displaystyle \begin{vmatrix}2 & 2 \\[1.1ex] 2 & -2 \end{vmatrix} = -8

Haupt-Nebenzahl 1 (ungerade) ist positiv und Haupt-Nebenzahl 2 (gerade) ist negativ, sodass es sich nach Sylvesters Kriterium um eine unbestimmte Matrix handelt. Und daher ist der kritische Punkt (0,-2) ein Sattelpunkt.

Bestimmen der Konkavität oder Konvexität einer Funktion mit der Hesseschen Matrix

Eine andere Verwendung der Hesse-Matrix besteht darin, zu wissen, ob eine Funktion konkav oder konvex ist. Und dies lässt sich nach folgendem Satz ermitteln:

Sei

A \subseteq \mathbb{R}^n

eine offene Menge und

f \colon A \to \mathbb{R}

eine Funktion, deren zweite Ableitungen stetig sind, ihre Konkavität und Konvexität werden durch die Hesse-Matrix definiert:

  • Funktion

    f

    ist durchgehend konvex

    A

    genau dann, wenn ihre Hesse-Matrix an jedem Punkt der Menge positiv semidefinit ist.

  • Funktion

    f

    ist durchgehend streng konvex

    A

    genau dann, wenn ihre Hesse-Matrix an jedem Punkt der Menge positiv definit ist.

Daher, wenn

f

ist eine konvexe Funktion an einem Punkt, an dem auch die Jacobi-Matrix verschwindet. Dieser Punkt ist ein lokales Minimum .

  • Funktion

    f

    ist insgesamt konkav

    A

    genau dann, wenn ihre Hesse-Matrix an jedem Punkt der Menge negativ semidefinit ist.

  • Funktion

    f

    ist insgesamt streng konkav

    A

    genau dann, wenn ihre Hesse-Matrix an jedem Punkt der Menge negativ definit ist.

Daher, wenn

f

ist eine Funktion, die an einem Punkt konkav ist, an dem auch die Jacobi-Matrix verschwindet. Dieser Punkt ist ein lokales Maximum .

Unten sehen Sie ein Beispiel für eine konvexe Funktion und ein weiteres für eine konkave Funktion, dargestellt in einem dreidimensionalen Raum:

konvexe Funktion

Bestimmen Sie die konvexe oder konkave Funktion mit der Hesse-Matrix

konkave Funktion

Das Bild hat ein leeres ALT-Attribut; Der Dateiname lautet „concavity-and-convexity-of-a-function-with-the-hessian-matrix-1024x768.jpg“.

Weitere Anwendungen der Hessischen Matrix

Die Hauptverwendungen der Hesse-Matrix sind die, die wir bereits gesehen haben, sie hat jedoch auch andere Anwendungen. Wir erklären sie unten für die Neugierigsten.

Taylor-Polynom

Die Entwicklung des Taylor-Polynoms für Funktionen von zwei oder mehr Variablen am Punkt

a

fängt so an:

\displaystyle  T(x) = f(a) + (x-a)^T \nabla f(a) + \frac{1}{2}(x-a)^T \operatorname{H}_f(a)(x-a) + \ldots

Wie Sie sehen können, sind die Terme zweiter Ordnung der Taylor-Entwicklung durch die Hesse-Matrix gegeben, die am Punkt der Entwicklung des Polynoms ausgewertet wird.

Umrandete Sackleinen-Matrix

Eine weitere Verwendung der Hesse-Matrix besteht darin, die Minima und Maxima einer multivariaten Funktion zu berechnen

f(x,y)

auf eine andere Rolle beschränkt

g(x,y)

. Um dieses Problem zu lösen, wird die begrenzte Hesse-Matrix verwendet und wie folgt vorgegangen:

Schritt 1: Die Lagrange-Funktion wird berechnet, die durch den folgenden Ausdruck definiert ist:

\displaystyle L(x,y,\lambda) = f(x,y)+ \lambda \cdot g(x,y)

Schritt 2: Die kritischen Punkte der Lagrange-Funktion werden gefunden. Dazu berechnen wir die Steigung der Lagrange-Funktion, setzen die Gleichungen gleich 0 und lösen die Gleichungen.

\displaystyle \nabla L = 0

\displaystyle \cfrac{\partial L}{\partial x} = 0 \qquad \cfrac{\partial L}{\partial y}=0 \qquad \cfrac{\partial L}{\partial \lambda}=0

Schritt 3: Für jeden gefundenen Punkt berechnen wir den begrenzten Hesse-Wert, der durch die folgende Matrix definiert ist:

\displaystyle H(f,g) = \begin{pmatrix}0 & \cfrac{\partial g}{\partial x_1} & \cfrac{\partial g}{\partial x_2} & \cdots & \cfrac{\partial g}{\partial x_n} \\[4ex] \cfrac{\partial g}{\partial x_1} & \cfrac{\partial^2 f}{\partial x_1^2} & \cfrac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \cfrac{\partial^2 f}{\partial x_1\,\partial x_n} \\[4ex] \cfrac{\partial g}{\partial x_2} & \cfrac{\partial^2 f}{\partial x_2\,\partial x_1} & \cfrac{\partial^2 f}{\partial x_2^2} & \cdots & \cfrac{\partial^2 f}{\partial x_2\,\partial x_n} \\[3ex] \vdots & \vdots & \vdots & \ddots & \vdots \\[3ex] \cfrac{\partial g}{\partial x_n} & \cfrac{\partial^2 f}{\partial x_n\,\partial x_1} & \cfrac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \cfrac{\partial^2 f}{\partial x_n^2}\end{pmatrix}

Schritt 4: Wir ermitteln für jeden kritischen Punkt, ob es sich um ein Maximum oder ein Minimum handelt:

  • Dies ist ein lokales Maximum der Funktion

    f

    unter Funktionseinschränkungen

    g

    wenn die letzten nm (wobei n die Anzahl der Variablen und m die Anzahl der Einschränkungen ist) Hauptminorwerte der am kritischen Punkt ausgewerteten umrandeten Hesse-Matrix abwechselnde Vorzeichen haben, beginnend mit dem negativen Vorzeichen.

  • Dies ist ein lokales Minimum der Funktion

    f

    unter Funktionseinschränkungen

    g

    wenn die letzten nm (wobei n die Anzahl der Variablen und m die Anzahl der Einschränkungen ist) die Hauptminorwerte der am kritischen Punkt ausgewerteten scharfen Hesse-Matrix alle negative Vorzeichen haben.

Es ist zu beachten, dass die relativen Minima oder Maxima einer eingeschränkten Funktion zu einer anderen nicht unbedingt auch für die uneingeschränkte Funktion gelten müssen. Die umrandete Hesse-Matrix ist daher nur für diese Art von Problem nützlich.

Beziehung zu anderen Operationen

Schließlich ist die Hesse-Matrix auch mit anderen wichtigen Operationen oder Matrizen verknüpft, hauptsächlich mit der Jacobi-Matrix und mit dem Laplace-Operator.

Beziehung zur Jacobi-Matrix

Die Hessesche Matrix einer Funktion

f

ist die Jacobi-Matrix des Gradienten derselben Funktion:

\displaystyle H_f = J(\nabla f)

Laplace-Operator

Die Hesse-Matrix-Spur entspricht dem Laplace-Operator :

\displaystyle tr( H_f) = \Delta f

Diese Gleichheit lässt sich leicht beweisen, da die Definition des Laplace-Operators die Divergenz des Gradienten einer Funktion ist:

\displaystyle  \Delta f =\nabla \cdot (\nabla f) = (\nabla \cdot \nabla )f = \nabla^2 f

Sein Ausdruck lautet daher:

\displaystyle \Delta f = \cfrac{\partial ^2 f}{\partial^2 x_1} +\cfrac{\partial ^2 f}{\partial^2 x_2} + \cfrac{\partial ^2 f}{\partial^2 x_3}+ \ldots +\cfrac{\partial ^2 f}{\partial^2 x_n}

Und diese Summe ist nur die Spur der Hesse-Matrix, also ist die Äquivalenz bewiesen.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen