A variância é uma medida estatística que nos diz quão bem os dados estão distribuídos em torno da média . É como medir o quão “dispersos” os dados estão a partir do valor médio.
Imagine que você tem uma lista de números, como pontuações em um teste. A variação ajuda você a entender o quão diferentes essas pontuações são umas das outras . Se as pontuações estiverem muito próximas umas das outras, a variância será baixa. Mas se houver muitas diferenças entre as pontuações, a variação será alta.
De modo geral, a variância é uma ferramenta útil para compreender adispersão dos dados em um conjunto de valores. Se a variância for alta, significa que os dados estão mais espalhados, enquanto se for baixa, significa que os dados estão mais próximos.
Como a lacuna é calculada?
Para calcular a variância, você precisa seguir alguns passos matemáticos, mas não se preocupe, é mais fácil do que parece. Primeiro, você precisa calcular a média ou média dos dados. Em seguida, subtraia cada dado da média e eleve ao quadrado cada diferença. Então você soma todos esses quadrados e divide pela quantidade de dados. É a variação.
Para entender isso um pouco melhor, vejamos um exemplo de cálculo de variância, abaixo:
Etapa 1: obtenha os dados
Suponha que você tenha os seguintes dados: 5, 7, 9, 11, 13. Esses são os valores de uma amostra de dados para os quais você deseja calcular a variância.
Passo 2: Calcule a média
Some todos os valores e divida pela quantidade total de dados para obter a média:
Média = (5 + 7 + 9 + 11 + 13) ÷ 5 = 45 ÷ 5 = 9
A média dos dados é 9.
Etapa 3: subtraia a média de cada ponto de dados
Subtraia a média obtida na etapa anterior de cada item de dados da lista:
5 – 9 = -4
7 – 9 = -2
9 – 9 = 0
11 – 9 = 2
13 – 9 = 4
Etapa 4: eleve cada diferença ao quadrado
Eleve ao quadrado cada uma das diferenças obtidas na etapa anterior:
(-4) 2 = 16
(-2) 2 = 4
0 2 = 0
2 2 = 4
4 2 = 16
Etapa 5: adicione os quadrados das diferenças
Some todos os resultados obtidos na etapa anterior:
16 + 4 + 0 + 4 + 16 = 40
Etapa 6: divida pela quantidade de dados
Divida a soma dos quadrados das diferenças pela quantidade total de dados (neste caso, 5):
Desvio = 40 ÷ 5 = 8
A variância dos dados é 8 .
Qual é a fórmula da variância?
Antes de analisar este ponto, é importante mencionar que a variância é de grande importância para as estatísticas. Apesar de ser uma medida bastante simples, fornece informações interessantes baseadas em uma variável específica.
A unidade de medida será sempre aquela que corresponde aos dados, mas ao quadrado. Adicionalmente, deve-se observar que a variância é sempre igual ou maior que zero. Isso ocorre porque os resíduos são sempre elevados ao quadrado, portanto, em termos matemáticos, é impossível que haja uma variância negativa.
Tendo isso em mente, a seguir mostramos a fórmula de variância:
S2 = lacuna
x i = termo do conjunto de dados
X̄ = medição da amostra
∑ = soma
n = tamanho da amostra
O que é alta e baixa variância?
A variância é considerada alta quando os dados de uma amostra estatística ou população são raros e estão longe da média . Isso significa que os valores individuais nos dados são amplamente distribuídos e há grande variabilidade nos dados.
Em contraste, a variância é considerada baixa quando os dados de uma amostra ou população estão mais próximos da média e há pouca dispersão entre os valores individuais. Isso implica que os dados são mais consistentes e têm menos variabilidade.
Quais são os principais usos da variância?
A variância é uma medida estatística amplamente utilizada em diversas áreas devido à sua capacidade de avaliar a dispersão ou variabilidade dos dados em uma amostra. Alguns dos principais usos da variação são:
Na estatística descritiva – para descrever a dispersão dos dados numa amostra, ajudando a compreender como os valores individuais se desviam da média e como estão distribuídos dentro da amostra.
Na estatística inferencial – estimar a variabilidade dos dados de uma população a partir de uma amostra, permitindo fazer inferências sobre a população como um todo.
Em finanças : na análise de risco e retorno de investimento, onde maior variância indica maior risco e menor variância indica menor risco em uma carteira de investimentos.
Na pesquisa científica – Analise a variabilidade dos dados em estudos científicos, como pesquisa médica, biologia, psicologia e outras disciplinas, para compreender a variabilidade dos resultados e a consistência dos dados.
No controle de qualidade de processos : no controle de qualidade de processos industriais para medir a variabilidade dos produtos ou serviços fabricados, o que permite identificar problemas de consistência e qualidade do processo.
Em econometria : na modelagem e análise de dados econômicos para compreender a variabilidade das variáveis econômicas e avaliar a confiabilidade dos modelos econométricos.
Qual é o significado da variação?
A variância é importante porque permite compreender a variabilidade dos dados em uma amostra . Se a variância for alta, significa que os dados são esparsos e há muita variabilidade. Isto é relevante para a tomada de decisões informadas em áreas como investimento, gestão de risco e análise de dados.
Além disso, a variância ajuda a compreender a consistência dos dados em uma amostra ou população. Uma variância baixa indica que os dados são consistentes e têm pouca variabilidade, enquanto uma variância alta indica que os dados são menos consistentes e têm mais variabilidade.
O desvio padrão e a variância são iguais?
O desvio padrão e a variância são duas medidas estatísticas relacionadas que descrevem a dispersão, ou variabilidade, dos dados em uma amostra ou população. A principal diferença entre eles é a unidade de medida e a interpretação dos resultados.
A variância é uma medida que representa a dispersão dos dados em relação à sua média, calculada como a soma dos quadrados dos desvios dos valores individuais da média, dividida pelo número total de dados.
É calculado elevando ao quadrado as diferenças entre cada valor e a média, somando-as e dividindo-as pela amostra ou tamanho da população. A variância é expressa em unidades quadradas e pode ser difícil de interpretar diretamente porque está numa escala diferente dos dados originais.
Por outro lado, o desvio padrão nada mais é do que a raiz quadrada da variância . É calculado como a raiz quadrada positiva da variância. O desvio padrão é expresso nas mesmas unidades dos dados originais e é uma medida mais intuitiva da dispersão dos dados.
Um desvio padrão mais alto indica maior dispersão ou variabilidade nos dados, enquanto um desvio padrão mais baixo indica menos dispersão ou variabilidade.
Lacuna para dados agrupados
A variância para dados agrupados refere-se ao cálculo da variabilidade ou dispersão dos dados agrupados em intervalos ou classes . Em vez de ter dados individuais, como no caso de variação para dados desagrupados, você tem intervalos ou intervalos nos quais os dados se enquadram.
O cálculo da variação para dados agrupados é feito usando uma fórmula ligeiramente diferente. Primeiramente é calculado o ponto médio de cada intervalo, que é a média dos limites inferior e superior de cada intervalo. Em seguida, calcula-se a média ponderada dos pontos médios, utilizando como pesos as frequências relativas ou absolutas dos intervalos.
A partir desta média ponderada, a variância é calculada de acordo com a mesma fórmula dos dados não agrupados , ou seja, como a média dos quadrados das diferenças entre os valores individuais e a média ponderada.
A variação de dados agrupados é útil ao trabalhar com conjuntos de dados apresentados como intervalos ou classes, como dados demográficos, dados econômicos ou qualquer outro tipo de dados agrupados em categorias ou intervalos.
Propriedades de variação
A variância é uma medida estatística que possui várias propriedades importantes. Algumas das principais propriedades de variância são:
- É sempre um valor não negativo , pois é definido como a média dos quadrados das diferenças entre os dados individuais e a média.
- É sensível a valores extremos ou discrepantes nos dados , pois é o quadrado das diferenças.
- Possui unidades ao quadrado , o que implica que está na mesma unidade ao quadrado dos dados originais.
- Pode ser afetado por valores discrepantes ou dados extremos, o que pode torná-lo uma medida não robusta da variabilidade dos dados.
- Se os dados forem independentes e não correlacionados entre si, a variância da soma de dois conjuntos de dados é igual à soma das variâncias dos dois conjuntos de dados .
Exemplos de desvio
Agora que entendemos o conceito de variância e sua importância, vejamos um exemplo prático para entender melhor como funciona.
Suponha que temos os seguintes dados sobre o resultado económico de uma empresa em milhões de dólares nos últimos cinco anos: 8, 12, 6, -4, 10. Queremos calcular a variância deste conjunto de dados utilizando a fórmula mencionada anteriormente.
Passo 1: Calcule a média aritmética
Primeiro, calculamos a média aritmética dos dados somando-os e dividindo pelo número total de dados (neste caso, 5):
Média aritmética (X̄) = (8 + 12 + 6 – 4 + 10) ÷ 5 = $ 6,4 milhões
Etapa 2: use a fórmula de variância
A seguir, usamos a fórmula de variância para calcular o quadrado das diferenças entre cada ponto de dados e a média aritmética e, em seguida, somamos-os:
Onde x i é cada elemento de dados, X̄ é a média aritmética e n é o número total de elementos de dados.
Substituímos os dados e a média aritmética na fórmula de variância:
Desvio (Var(X)) = [(8 – 6,4) 2 + (12 – 6,4) 2 + (6 – 6,4) 2 + (-4 – 6,4) 2 + (10 – 6,4) 2 ] ÷ (5 – 1)
Etapa 3: Resolver Operações
Agora vamos resolver as operações para obter o valor da variância:
Desvio (Var(X)) = [1,6 2 + 5,6 2 + 0,16 2 + (-10,4) 2 + 3,6 2 ] ÷ 4
Desvio (Var(X)) = [2,56 + 31,36 + 0,0256 + 108,16 + 12,96] ÷ 4
Desvio (Var(X)) = 155,072 ÷ 4
Variância (Var(X)) = 38,768 milhões ao quadrado
A variância deste conjunto de dados é de 38,768 milhões ao quadrado, o que nos dá uma medida da dispersão ou variabilidade dos dados em relação à média aritmética.