Cette page est sûrement l’explication la plus complète de la matrice Hessienne qui existe. Ici, le concept de la matrice de Hesse est expliqué, comment le calculer avec des exemples et il y a même plusieurs exercices résolus à pratiquer. De plus, vous pourrez apprendre comment les valeurs maximales et minimales d’une fonction à plusieurs variables sont calculées, ainsi que savoir s’il s’agit d’une fonction concave ou convexe. Et enfin, vous trouverez également les utilitaires et applications de la matrice hessienne.
Qu’est-ce que la matrice de Hesse ?
La définition de la matrice hessoise (ou hessienne) est la suivante :
La matrice hessienne est une matrice carrée de dimension n × n composée des dérivées secondes partielles d’une fonction de n variables.
Cette matrice est également connue sous le nom de Hessian, ou même dans certains livres de mathématiques, elle est nommée Discriminant. Mais la façon la plus courante de l’appeler est la matrice de Hesse.
La formule de la matrice hessienne est donc la suivante :
Par conséquent, la matrice hessienne sera toujours une matrice carrée dont la dimension sera égale au nombre de variables de la fonction. Par exemple, si la fonction a 3 variables, la matrice Hessienne aura la dimension 3×3.
De plus, le théorème de Schwarz (ou théorème de Clairaut) dit que l’ordre de différenciation n’a pas d’importance, c’est-à-dire dériver partiellement d’abord par rapport à la variable
puis par rapport à la variable revient à différencier partiellement par rapport à puis respecter .
Par conséquent, la matrice hessienne est une matrice symétrique , ou en d’autres termes, elle a une symétrie dont l’axe est sa diagonale principale.
Par curiosité, la matrice de Hesse porte le nom de Ludwig Otto Hesse, un mathématicien allemand du XIXe siècle qui a apporté des contributions très importantes au domaine de l’algèbre linéaire.
Exemple de calcul de la matrice Hessienne
Voyons un exemple de comment trouver une matrice hessienne de dimension 2 × 2 :
- Calculez la matrice hessienne au point (1,0) de la fonction suivante :
Tout d’abord, nous devons calculer les dérivées partielles du premier ordre :
Une fois que nous connaissons déjà les dérivées premières, nous calculons toutes les dérivées partielles du second ordre :
Par conséquent, nous pouvons maintenant trouver la matrice hessienne à partir de la formule des matrices 2 × 2 :
Ainsi la matrice Hessienne évaluée au point (1,0) sera :
Problèmes résolus des matrices de Hesse
Exercice 1
Calculer la matrice hessienne de la fonction suivante à 2 variables au point (1,1) :
Tout d’abord, il faut trouver les dérivées partielles du premier ordre de la fonction :
Une fois que nous avons déjà calculé les dérivées premières, nous procédons à la résolution de toutes les dérivées partielles du second ordre :
Ainsi la matrice Hessienne est définie comme suit :
Enfin, il ne reste plus qu’à évaluer la matrice hessienne au point (1,1) :
Exercice 2
Calculez le hessien au point (1,1) de la fonction suivante à deux variables :
Tout d’abord, nous devons calculer les dérivées partielles du premier ordre de la fonction :
Une fois que nous avons les dérivées premières, nous calculons les dérivées partielles du second ordre de la fonction :
Ainsi la matrice hessienne de la fonction est une matrice carrée de dimension 2×2 :
Enfin, il ne reste plus qu’à évaluer la matrice hessienne au point (1,1) :
Exercice 3
Trouver la matrice hessienne au point
de la fonction suivante à 3 variables :
Tout d’abord, nous calculons les dérivées partielles du premier ordre de la fonction :
Une fois que nous avons les dérivées premières, nous calculons les dérivées partielles du second ordre de la fonction :
Si bien que la matrice hessienne de la fonction est une matrice carrée de dimension 3×3 :
Enfin, nous remplaçons les variables par leurs valeurs respectives au point
Exercice 4
Déterminer la matrice hessienne au point (2,-1,1,-1) de la fonction suivante à 4 variables :
La première étape consiste à trouver les dérivées partielles du premier ordre de la fonction :
Maintenant, nous résolvons les dérivées partielles du second ordre de la fonction :
Ainsi l’expression de la matrice hessienne 4×4 obtenue en résolvant toutes les dérivées partielles est la suivante :
Enfin, on substitue les inconnues à leurs valeurs ponctuelles respectives (2,-1,1,-1) et on fait les calculs :
Comment savoir quand la matrice hessienne est positive, négative ou indéfinie ?
Comme nous le verrons plus loin, savoir si la matrice hessienne est une matrice semi-définie positive, définie positive, semi-définie négative, définie négative ou indéfinie est très utile. Voyons donc comment nous pouvons le savoir :
Critère de valeurs propres (ou valeurs propres)
Une façon de savoir de quel type de matrice il s’agit est de passer par les valeurs propres (ou valeurs propres) de la matrice hessienne :
- La matrice hessienne est semi-définie positive si elle a des valeurs propres (ou valeurs propres) égales et supérieures à zéro. C’est-à-dire qu’il a des valeurs propres positives et au moins une égale à 0 :
- La matrice hessienne est définie positive si toutes ses valeurs propres (ou valeurs propres) sont exclusivement supérieures à 0 (positives) :
- La matrice de Hesse est semi-définie négative si elle a des valeurs propres (ou des valeurs propres) égales et inférieures à zéro. C’est-à-dire qu’il a des valeurs propres négatives et au moins une égale à 0 :
- La matrice hessienne est définie négative si toutes ses valeurs propres (ou valeurs propres) ne sont inférieures à 0 (négatives) :
- La matrice hessienne est indéfinie lorsqu’elle a des valeurs propres (ou valeurs propres) positives et négatives :
Critère de Sylvester
Une autre façon de savoir de quel type est la matrice hessienne est d’utiliser le critère de Sylvester, bien que ce théorème nous permette seulement de savoir si elle est définie positive, définie négative ou indéfinie. Mais parfois, il peut être beaucoup plus rapide à utiliser car les calculs sont généralement plus faciles.
Ainsi, le critère de Sylvester se lit comme suit :
- Si tous les principaux mineurs de la matrice hessienne sont supérieurs à 0, c’est une matrice définie positive .
- Si les principaux mineurs de la matrice hessienne à index pair sont supérieurs à 0 et ceux à index impair sont inférieurs à 0, il s’agit d’une matrice définie négative .
- Si tous les principaux mineurs de la matrice hessienne sont différents de 0 et qu’aucune des deux conditions précédentes n’est remplie, c’est une matrice indéfinie .
Évidemment, le mineur principal maximum de la matrice hessienne coïncidera toujours avec son déterminant. A titre informatif uniquement, le déterminant de la matrice Hessienne est également appelé “le Hessien”, bien que nous ne le ferons pas ici pour éviter toute confusion.
Comment calculer un maximum ou un minimum d’une fonction avec la matrice Hessienne
Une fois que vous savez comment calculer la matrice Hessienne, vous vous demandez sûrement : et à quoi sert cette matrice ?
Eh bien, l’une des applications de la matrice hessienne est de trouver le maximum ou le minimum d’une fonction avec plus d’une variable. Voici une explication étape par étape de la méthode de calcul des maximums et des minimums :
- Tout d’abord, les points critiques de la fonction multivariable sont calculés. Pour ce faire, on calcule le gradient ou la matrice jacobienne de la fonction, on le met égal à 0 et on résout les équations.
- La matrice de Hesse est calculée.
- Les points critiques trouvés à l’étape 1 sont substitués dans la matrice hessienne. On obtiendra ainsi autant de matrices hessiennes que de points critiques ont la fonction.
- Nous regardons quel type de matrice est chaque matrice hessienne. Autrement dit, nous regardons pour voir s’il est défini positif, défini négatif, indéfini, etc.
- Si la matrice hessienne est définie positive, le point critique est un minimum relatif de la fonction.
- Si la matrice hessienne est définie négative, le point critique est un maximum relatif de la fonction.
- Si la matrice hessienne est indéfinie, le point critique est un point selle .
Exemple de calcul des maximums et des minimums d’une fonction multivariable
Pour voir comment cela se fait, voici un exemple de calcul et de classification des extrema relatifs d’une fonction à l’aide de la matrice hessienne :
- Trouvez tous les extrema relatifs de la fonction multivariable suivante :
La première chose que nous devons faire est de calculer la matrice jacobienne de la fonction, qui dans ce cas coïncidera avec le gradient car il s’agit d’une fonction scalaire :
Il faut maintenant déterminer les points critiques, pour cela on égalise les équations obtenues à 0 et on résout le système d’équations :
Donc le point critique que nous avons trouvé est (0,-2).
Une fois le point critique de la fonction trouvé, il faut calculer la matrice hessienne :
Et, évidemment, la matrice hessienne évaluée au point critique est la même :
Pour voir de quel type de matrice il s’agit, nous utiliserons le critère de Sylvester. On résout donc les principaux mineurs de la matrice :
Le principal mineur 1 (impair) est positif et le principal mineur 2 (pair) est négatif, donc selon le critère de Sylvester, il s’agit d’une matrice indéfinie. Et, par conséquent, le point critique (0,-2) est un point selle.
Déterminer la concavité ou la convexité d’une fonction avec la matrice hessienne
Une autre utilité de la matrice Hessienne est de savoir si une fonction est concave ou convexe. Et cela peut être déterminé selon le théorème suivant :
Être
un ensemble ouvert et une fonction dont les dérivées secondes sont continues, sa concavité et sa convexité sont définies par la matrice hessienne :
- La fonction est convexe sur l’ensemble si et seulement si sa matrice hessienne est semi-définie positive en tout point de l’ensemble.
- La fonction est strictement convexe sur l’ensemble si et seulement si sa matrice hessienne est définie positive en tout point de l’ensemble.
✓ Par conséquent, si
est une fonction convexe en un point où la matrice jacobienne s’annule également, ce point est un minimum local .
- La fonction est concave dans l’ensemble si et seulement si sa matrice hessienne est semi-définie négative en tout point de l’ensemble.
- La fonction est strictement concave dans l’ensemble si et seulement si sa matrice hessienne est définie négative en tout point de l’ensemble.
✓ Par conséquent, si
est une fonction concave en un point où la matrice jacobienne s’annule également, ce point est un maximum local .
Ci-dessous vous avez un exemple de fonction convexe et un autre de fonction concave représentée dans un espace à 3 dimensions :
fonction concave
Plus d’applications de la matrice de Hesse
Les principales utilités de la matrice hessienne sont celles que nous avons déjà vues, cependant, elle a aussi d’autres applications. Nous les expliquons ci-dessous pour les plus curieux.
Polynôme de Taylor
Le développement du polynôme de Taylor pour les fonctions de 2 variables ou plus au point
commence comme ça :
Comme vous pouvez le voir, les termes du second ordre du développement de Taylor sont donnés par la matrice hessienne évaluée au point de développement du polynôme.
Matrice de toile de jute bordée
Une autre utilisation de la matrice Hessienne est de calculer les minima et les maxima d’une fonction multivariée
restreint à un autre rôle . Pour résoudre ce problème, la matrice de Hesse bordée est utilisée et la procédure suivante est suivie :
Etape 1 : La fonction de Lagrange est calculée, qui est définie par l’expression suivante :
Étape 2 : Les points critiques de la fonction de Lagrange sont trouvés. Pour ce faire, nous calculons le gradient de la fonction de Lagrange, définissons les équations égales à 0 et résolvons les équations.
Étape 3 : Pour chaque point que nous avons trouvé, nous calculons la Hessienne bordée, qui est définie par la matrice suivante :
Etape 4 : On détermine pour chaque point critique s’il s’agit d’un maximum ou d’un minimum :
- Ce sera un maximum local de la fonction sous contraintes de fonction si les nm derniers (où n est le nombre de variables et m le nombre de contraintes) principaux mineurs de la matrice hessienne bordée évalués au point critique ont des signes alternés commençant par le signe négatif.
- Ce sera un minimum local de la fonction sous contraintes de fonction si les nm derniers (où n est le nombre de variables et m le nombre de contraintes) principaux mineurs de la matrice hessienne tranchante évalués au point critique ont tous des signes négatifs.
Il faut garder à l’esprit que les minima ou maxima relatifs d’une fonction contrainte à une autre ne doivent pas nécessairement l’être pour la fonction non restreinte. La matrice de Hesse bordée n’est donc utile que pour ce type de problème.
Relation avec les autres opérations
Enfin, la matrice hessienne est également liée à d’autres opérations ou matrices importantes, principalement avec la matrice jacobienne et avec l’opérateur de Laplace.
Relation avec la matrice jacobienne
La matrice hessienne d’une fonction
est la matrice jacobienne du gradient de la même fonction :
Opérateur de Laplace
La trace matricielle hessienne est équivalente à l’ opérateur de Laplace :
Cette égalité peut être facilement prouvée, puisque la définition de l’opérateur de Laplace est la divergence du gradient d’une fonction :
Son expression est donc :
Et cette somme n’est que la trace de la matrice hessienne, donc l’équivalence est prouvée.