O desvio padrão ou padrão é uma medida estatística que indica a que distância os pontos de dados individuais estão da média ou média de um conjunto de dados. É uma medida de dispersão usada para entender o quanto os dados variam em relação à média do conjunto.
Em termos mais complexos, o padrão ou desvio padrão é a raiz quadrada da variância . A variância é calculada como a média das diferenças quadradas entre cada item de dados e a média geral. Tirar a raiz quadrada da variância dá o desvio padrão, que está nas mesmas unidades dos dados originais.
Vale ressaltar que esta é uma medida importante nas estatísticas. Graças a ele é possível quantificar a dispersão dos dados e entender como eles estão distribuídos em relação à média. Um desvio padrão baixo indica que os dados tendem a estar próximos da média. Por outro lado, um desvio padrão elevado indica que os dados estão mais dispersos ou distantes da média.
Em geral, o desvio padrão é usado para compreender a variabilidade dos dados em um conjunto e para fazer comparações.
Para que é usado o desvio padrão?
O desvio padrão é uma ferramenta estatística que possui diversas aplicações na análise de dados. Alguns dos utilitários mais conhecidos são:
- Medida de dispersão : quantifica a que distância os dados individuais estão da média ou média do todo. Um desvio padrão alto indica maior dispersão ou variabilidade nos dados, enquanto um desvio padrão baixo indica menor dispersão.
- Comparação de conjuntos de dados – pode ser usada para comparar a variabilidade entre diferentes conjuntos de dados. Um conjunto com um desvio padrão maior terá dados mais espalhados do que um conjunto com um desvio padrão menor.
- Identificação de valores discrepantes – Isso também pode ajudar a identificar valores discrepantes ou extremos em um conjunto de dados. Se um ponto de dados estiver a vários desvios padrão da média, isso pode indicar que se trata de um valor incomum ou discrepante.
- Avaliando a precisão de um modelo – Em alguns casos, o desvio padrão é usado como medida da precisão de um modelo ou estimativa. Por exemplo, em estatísticas inferenciais, o desvio padrão pode ser usado para calcular intervalos de confiança ou realizar testes de hipóteses.
Propriedades do desvio padrão
O desvio padrão tem várias propriedades importantes que merecem ser mencionadas:
- O desvio padrão é uma medida de distância, portanto é sempre um valor não negativo .
- Se todos os dados do conjunto tiverem o mesmo valor, o desvio padrão será zero .
- É afetado por valores discrepantes e pode ser significativamente influenciado no conjunto de dados.
- É sensível à escala dos dados . Se os dados forem de grande escala, o desvio padrão também será grande e vice-versa.
- Esta é uma medida de dispersão relativa , pois é expressa nas mesmas unidades dos dados originais.
Qual é a fórmula do desvio padrão?
A fórmula matemática para o desvio padrão é:
Ouro:
σ: Representa o desvio padrão.
Σ: Indica a soma.
xi: Estes são os valores individuais do conjunto de dados.
Média: Esta é a média ou média do conjunto de dados.
n é o número total de dados no conjunto.
O desvio padrão é uma medida de dispersão que nos permite entender o quanto os dados de um conjunto diferem de sua média ou média. É obtido calculando a raiz quadrada da soma dos quadrados das diferenças entre cada valor do conjunto e a média do conjunto, dividida pelo número total de dados do conjunto.
Como o desvio padrão é calculado?
O desvio padrão é calculado usando as seguintes etapas:
1. Calcule a média ou média do conjunto de dados
A média é obtida somando todos os valores do conjunto de dados e dividindo o resultado pelo valor total dos dados. Matematicamente, é expresso por:
Onde xi é cada um dos valores do conjunto de dados, n é o número de itens de dados no conjunto e Σ representa a soma.
2. Subtraia a média de cada um dos valores do conjunto de dados
Para obter as diferenças entre cada valor do conjunto de dados e a média, a média (calculada na etapa anterior) é subtraída de cada um dos valores do conjunto de dados. Isso nos permite identificar a que distância os dados estão da média.
3. Eleve ao quadrado cada uma das diferenças obtidas na etapa anterior
As diferenças obtidas na etapa anterior são elevadas ao quadrado. Esta etapa é realizada para evitar que diferenças positivas e negativas se anulem e para enfatizar os valores mais distantes da média.
4. Calcule a média dos valores obtidos na etapa anterior
É calculada a média dos valores obtidos na etapa anterior. Esta média representa a soma dos quadrados das diferenças dividida pelo número total de dados. Matematicamente, é expresso por:
Diferenças médias quadráticas = Σ((xi – média)²) ÷ n
5. Obtenha a raiz quadrada do valor obtido na etapa anterior
A última etapa é obter a raiz quadrada do valor obtido na etapa anterior. Isto fornece o desvio padrão, que é uma medida da dispersão dos dados em relação à média.
Como o desvio padrão é interpretado?
É importante ressaltar que a interpretação do desvio padrão depende do contexto e da natureza dos dados estudados.
Portanto, é essencial compreender totalmente o significado do desvio padrão e utilizá-lo em conjunto com outras medidas estatísticas para obter uma compreensão completa e precisa da variabilidade dos dados. Vejamos alguns exemplos abaixo.
Análise de variabilidade
O desvio padrão é utilizado para avaliar a variabilidade ou dispersão dos dados em um conjunto . Se o desvio padrão for baixo, indica que os dados estão próximos da média e apresentam pouca variabilidade. Por outro lado, se o desvio padrão for alto, indica que os dados estão mais dispersos e apresentam maior variabilidade.
comparação de dados
É útil para comparar a variabilidade entre diferentes conjuntos de dados . Por exemplo, se for comparado o desvio padrão da renda de dois países, pode-se inferir qual deles apresenta maior variabilidade na renda de sua população.
Identificando valores discrepantes
Ajuda a identificar valores discrepantes ou dados incomuns em um conjunto . Dados que estão a mais de 1 ou 2 desvios padrão da média podem ser considerados valores discrepantes.
Avaliação da precisão da medição
Também é usado como medida de precisão ou confiabilidade de uma medição ou estimativa . Por exemplo, se você estiver fazendo pesquisas e obtiver medições com um desvio padrão alto, isso pode indicar que as medições são menos precisas e é necessário ter mais cuidado ao coletar os dados.
Avaliação da normalidade dos dados
O desvio padrão é utilizado em conjunto com outras medidas para avaliar se os dados seguem uma distribuição normal . Se os dados apresentarem um pequeno desvio padrão da média, isso pode indicar que os dados estão distribuídos aproximadamente de acordo com uma distribuição normal.
Exemplos Numéricos de Desvio Padrão
Embora seja verdade que, de um modo geral, pode ser complexo, o desvio padrão é entendido de forma simples. Para esclarecer dúvidas, compartilhamos abaixo alguns exemplos, utilizando dois métodos diferentes.
raiz quadrada da variância
Suponha que temos os seguintes dados: 9, 3, 8, 9 e 16.
Etapa 1: Calcule a média aritmética:
Média aritmética = (9 + 3 + 8 + 9 + 16) ÷ 5 = 9.
Etapa 2: aplique a fórmula de variância:
Desvio = [(9 – 9) 2 + (3 – 9) 2 + (8 – 9) 2 + (9 – 9) 2 + (16 – 9) 2 ] ÷ 5 = 86 ÷ 5 = 17,2.
Etapa 3: calcule a raiz quadrada da variância:
Desvio padrão = √(17,2) ≈ 4,14.
Soma dos desvios e divisão pelo número total de observações
Suponha que temos os seguintes dados: 2, 4, 2, 4, 2 e 4.
Etapa 1: Calcule a média aritmética:
Média aritmética = (2 + 4 + 2 + 4 + 2 + 4) ÷ 6 = 3.
Passo 2: Calcule o desvio padrão somando os desvios e dividindo pelo número total de observações:
Desvio padrão = [(2 – 3) + (4 – 3) + (2 – 3) + (4 – 3) + (2 – 3) + (4 – 3)] ÷ 6 = (1 + 1 + 1 + 1 + 1 + 1) ÷ 6 = 1.
Em ambos os casos obtemos um desvio padrão de aproximadamente 4,14 e 1 respectivamente, utilizando diferentes métodos de cálculo. Isto ilustra como o desvio padrão pode ser obtido utilizando a raiz quadrada da variância ou somando os desvios e dividindo pelo número total de observações.