Esta página é certamente a explicação mais completa da matriz Hessiana que existe. Aqui é explicado o conceito de matriz Hessiana, como calculá-la com exemplos e há ainda vários exercícios resolvidos para praticar. Além disso, você poderá aprender como são calculados os valores máximo e mínimo de uma função multivariável, bem como se é uma função côncava ou convexa. E, finalmente, você também encontrará os utilitários e aplicativos da matriz Hessiana.
Qual é a matriz Hessiana?
A definição da matriz Hessiana (ou Hessiana) é a seguinte:
A matriz Hessiana é uma matriz quadrada de dimensão n × n composta pelas segundas derivadas parciais de uma função de n variáveis.
Essa matriz também é conhecida como Hessiana, ou mesmo em alguns livros de matemática é chamada de Discriminante. Mas a forma mais comum de chamá-la é a matriz Hessiana.
A fórmula para a matriz Hessiana é, portanto, a seguinte:
Portanto, a matriz Hessiana será sempre uma matriz quadrada cuja dimensão será igual ao número de variáveis da função. Por exemplo, se a função tiver 3 variáveis, a matriz Hessiana terá dimensão 3×3.
Além disso, o teorema de Schwarz (ou teorema de Clairaut) diz que a ordem de diferenciação não importa, ou seja, deriva parcialmente primeiro em relação à variável
então em relação à variável
equivale a diferenciar parcialmente em relação a
então respeite
.
Portanto, a matriz Hessiana é uma matriz simétrica , ou seja, possui uma simetria cujo eixo é a sua diagonal principal.
A título de curiosidade, a matriz Hessiana leva o nome de Ludwig Otto Hesse, um matemático alemão do século XIX que fez contribuições muito importantes ao campo da álgebra linear.
Exemplo de cálculo da matriz Hessiana
Vejamos um exemplo de como encontrar uma matriz Hessiana de dimensão 2 × 2:
- Calcule a matriz Hessiana no ponto (1,0) da seguinte função:
Primeiro, precisamos calcular as derivadas parciais de primeira ordem:
Uma vez que já conhecemos as primeiras derivadas, calculamos todas as derivadas parciais de segunda ordem:
Portanto, podemos agora encontrar a matriz Hessiana a partir da fórmula para matrizes 2 × 2:
Assim a matriz Hessiana avaliada no ponto (1,0) será:
Problemas resolvidos de matrizes Hessianas
Exercício 1
Calcule a matriz Hessiana da seguinte função com 2 variáveis no ponto (1,1):
Primeiro, precisamos encontrar as derivadas parciais de primeira ordem da função:
Depois de já termos calculado as primeiras derivadas, procedemos à resolução de todas as derivadas parciais de segunda ordem:
Assim a matriz Hessiana é definida da seguinte forma:
Finalmente, resta avaliar a matriz Hessiana no ponto (1,1):
Exercício 2
Calcule o Hessian no ponto (1,1) da seguinte função em duas variáveis:
Primeiro, precisamos calcular as derivadas parciais de primeira ordem da função:
Assim que tivermos as primeiras derivadas, calculamos as derivadas parciais de segunda ordem da função:
Assim, a matriz Hessiana da função é uma matriz quadrada de dimensão 2×2:
Finalmente, resta avaliar a matriz Hessiana no ponto (1,1):
Exercício 3
Encontre a matriz Hessiana no ponto
da seguinte função com 3 variáveis:
Primeiro, calculamos as derivadas parciais de primeira ordem da função:
Assim que tivermos as primeiras derivadas, calculamos as derivadas parciais de segunda ordem da função:
Para que a matriz Hessiana da função seja uma matriz quadrada de dimensão 3×3:
Por fim, substituímos as variáveis pelos seus respectivos valores no ponto
Exercício 4
Determine a matriz Hessiana no ponto (2,-1,1,-1) da seguinte função com 4 variáveis:
O primeiro passo é encontrar as derivadas parciais de primeira ordem da função:
Agora resolvemos as derivadas parciais de segunda ordem da função:
Assim, a expressão da matriz Hessiana 4×4 obtida resolvendo todas as derivadas parciais é a seguinte:
Por fim, substituímos as incógnitas pelos seus respectivos valores de pontos (2,-1,1,-1) e fazemos os cálculos:
Como saber quando a matriz Hessiana é positiva, negativa ou indefinida?
Como veremos mais tarde, saber se a matriz Hessiana é uma matriz positiva semidefinida, positiva definida, negativa semidefinida, negativa definida ou indefinida é muito útil. Então, vamos ver como podemos descobrir:
Critério de autovalores (ou autovalores)
Uma forma de saber que tipo de matriz é é percorrer os autovalores (ou autovalores) da matriz Hessiana:
- A matriz Hessiana é positiva semidefinida se tiver autovalores (ou autovalores) iguais e maiores que zero. Ou seja, possui autovalores positivos e pelo menos um igual a 0:
- A matriz Hessiana é positiva definida se todos os seus autovalores (ou autovalores) forem exclusivamente maiores que 0 (positivo):
negativa semidefinida se tiver autovalores (ou autovalores) iguais e menores que zero. Ou seja, possui autovalores negativos e pelo menos um igual a 0:
- A matriz Hessiana é definida negativa se todos os seus autovalores (ou autovalores) forem menores que 0 (negativos):
- A matriz Hessiana é indefinida quando possui autovalores positivos e negativos (ou autovalores):
Critério de Sylvester
Outra forma de saber de que tipo é a matriz Hessiana é utilizar o critério de Sylvester, embora este teorema apenas nos permita saber se é definida positiva, definida negativa ou indefinida. Mas às vezes pode ser muito mais rápido de usar porque os cálculos geralmente são mais fáceis.
Assim, o critério de Sylvester é o seguinte:
- Se todos os menores principais da matriz Hessiana forem maiores que 0, é uma matriz definida positiva .
- Se os principais menores da matriz Hessiana com índice par forem maiores que 0 e aqueles com índice ímpar forem menores que 0, é uma matriz definida negativa .
- Se todos os menores principais da matriz Hessiana forem diferentes de 0 e nenhuma das duas condições anteriores for atendida, é uma matriz indefinida .
Obviamente, o máximo menor principal da matriz Hessiana coincidirá sempre com o seu determinante. Apenas para fins informativos, o determinante da matriz Hessiana também é chamado de “o Hessiano”, embora não o façamos aqui para evitar confusão.
Como calcular o máximo ou mínimo de uma função com a matriz Hessiana
Depois de saber como calcular a matriz Hessiana, você provavelmente está se perguntando: e para que serve essa matriz?
Pois bem, uma das aplicações da matriz Hessiana é encontrar o máximo ou mínimo de uma função com mais de uma variável. Aqui está uma explicação passo a passo de como calcular máximos e mínimos:
- Primeiro, são calculados os pontos críticos da função multivariável. Para isso, calculamos o gradiente ou a matriz Jacobiana da função, igualamos-o a 0 e resolvemos as equações.
- A matriz Hessiana é calculada.
- Os pontos críticos encontrados na etapa 1 são substituídos na matriz Hessiana. Obteremos assim tantas matrizes Hessianas quantos pontos críticos a função tiver.
- Vemos que tipo de matriz é cada matriz Hessiana. Ou seja, procuramos ver se é definido positivo, definido negativo, indefinido, etc.
- Se a matriz Hessiana for positiva definida, o ponto crítico é um mínimo relativo da função.
- Se a matriz Hessiana for definida negativa, o ponto crítico é um máximo relativo da função.
- Se a matriz Hessiana for indefinida, o ponto crítico é um ponto de sela .
Exemplo de cálculo de máximos e mínimos de uma função multivariável
Para ver como isso é feito, aqui está um exemplo de cálculo e classificação dos extremos relativos de uma função usando a matriz Hessiana:
- Encontre todos os extremos relativos da seguinte função multivariável:
A primeira coisa que precisamos fazer é calcular a matriz Jacobiana da função, que neste caso coincidirá com o gradiente por ser uma função escalar:
Devemos agora determinar os pontos críticos, para isso igualamos as equações obtidas a 0 e resolvemos o sistema de equações:
Portanto, o ponto crítico que encontramos é (0,-2).
Uma vez encontrado o ponto crítico da função, devemos calcular a matriz Hessiana:
E, obviamente, a matriz Hessiana avaliada no ponto crítico é a mesma:
Para ver que tipo de matriz é, usaremos o critério de Sylvester. Portanto, resolvemos os principais menores da matriz:
O menor principal 1 (ímpar) é positivo e o menor principal 2 (par) é negativo, portanto, pelo critério de Sylvester, é uma matriz indefinida. E, portanto, o ponto crítico (0,-2) é um ponto de sela.
Determinando a concavidade ou convexidade de uma função com a matriz Hessiana
Outro uso da matriz Hessiana é saber se uma função é côncava ou convexa. E isso pode ser determinado pelo seguinte teorema:
Ser
um conjunto aberto e
uma função cujas segundas derivadas são contínuas, sua concavidade e convexidade são definidas pela matriz Hessiana:
- Função
é convexo em toda parte
se e somente se sua matriz Hessiana for positiva semidefinida em todos os pontos do conjunto.
- Função
é estritamente convexo em todo
se e somente se sua matriz Hessiana for positiva definida em todos os pontos do conjunto.
✓ Portanto, se
é uma função convexa em um ponto onde a matriz Jacobiana também desaparece, este ponto é um mínimo local .
- Função
é côncavo em geral
se e somente se sua matriz Hessiana for negativa semidefinida em todos os pontos do conjunto.
- Função
é estritamente côncavo em geral
se e somente se sua matriz Hessiana for negativa definida em todos os pontos do conjunto.
✓ Portanto, se
é uma função côncava em um ponto onde a matriz Jacobiana também desaparece, este ponto é um máximo local .
Abaixo você tem um exemplo de função convexa e outro de função côncava representada em um espaço tridimensional:
função convexa
função côncava
Mais aplicações da matriz Hessiana
Os principais usos da matriz Hessiana são os que já vimos, porém, ela também possui outras aplicações. Explicamos-los abaixo para os mais curiosos.
Polinômio de Taylor
A expansão do polinômio de Taylor para funções de 2 ou mais variáveis no ponto
começa assim:
Como você pode ver, os termos de segunda ordem da expansão de Taylor são dados pela matriz Hessiana avaliada no ponto de expansão do polinômio.
Matriz de serapilheira com bordas
Outro uso da matriz Hessiana é calcular os mínimos e máximos de uma função multivariada
restrito a outra função
. Para resolver este problema, utiliza-se a matriz Hessiana limitada e segue-se o seguinte procedimento:
Passo 1: Calcula-se a função de Lagrange, que é definida pela seguinte expressão:
Passo 2: Os pontos críticos da função de Lagrange são encontrados. Para fazer isso, calculamos o gradiente da função de Lagrange, igualamos as equações a 0 e resolvemos as equações.
Etapa 3: Para cada ponto encontrado, calculamos o Hessiano limitado, que é definido pela seguinte matriz:
Etapa 4: Determinamos para cada ponto crítico se é máximo ou mínimo:
- Este será um máximo local da função
sob restrições de função
se o último nm (onde n é o número de variáveis em o número de restrições) os principais menores da matriz Hessiana com borda avaliada no ponto crítico têm sinais alternados começando com o sinal negativo.
- Este será um mínimo local da função
sob restrições de função
se o último nm (onde n é o número de variáveis em o número de restrições), os principais menores da matriz Hessiana acentuada avaliada no ponto crítico têm todos sinais negativos.
Deve-se ter em mente que os mínimos ou máximos relativos de uma função restrita para outra não precisam necessariamente ser assim para a função irrestrita. A matriz Hessiana com borda é, portanto, útil apenas para este tipo de problema.
Relacionamento com outras operações
Por fim, a matriz Hessiana também está ligada a outras operações ou matrizes importantes, principalmente com a matriz Jacobiana e com o operador de Laplace.
Relação com a matriz Jacobiana
A matriz Hessiana de uma função
é a matriz Jacobiana do gradiente da mesma função:
Operador Laplace
O traço da matriz Hessiana é equivalente ao operador Laplace :
Esta igualdade pode ser facilmente comprovada, pois a definição do operador de Laplace é a divergência do gradiente de uma função:
Sua expressão é portanto:
E esta soma é apenas o traço da matriz Hessiana, então a equivalência está provada.