O que são parâmetros estatísticos?

Parâmetros estatísticos são valores numéricos que resumem características importantes de um conjunto de dados e nos ajudam a compreender e descrever as informações nele encontradas. Em termos simples, podemos dizer que são “rótulos” que nos permitem compreender melhor os dados e tomar decisões com base neles.

Em outras palavras, parâmetros estatísticos são medidas especiais usadas por matemáticos e cientistas para descrever dados de maneira simples . Basicamente, são ferramentas que nos ajudam a compreender os números com mais facilidade e clareza.

Por exemplo, digamos que você tenha um saco cheio de doces e queira saber quantos doces existem no total. É aqui que entram os parâmetros estatísticos. A média é a quantidade média de doces , que se obtém somando todos os doces e dividindo pela quantidade total. Isso lhe dá uma ideia do número médio de doces que você pode esperar encontrar.

Mas tem mais, outro parâmetro importante é o desvio padrão , que ajuda a entender o quão longe os doces estão da média . Mostra o quão diferentes os doces são em comparação com o número médio.

O interessante é que os parâmetros estatísticos também podem ser usados para fazer previsões . Por exemplo, se quiser saber quantos doces haverá na sacola depois de uma semana, você pode usar parâmetros estatísticos para estimá-los. Você calcula o número médio de doces que tem agora e usa o desvio padrão para ter uma ideia de como essa média muda ao longo de uma semana.

Que tipos de parâmetros estatísticos existem?

Nas estatísticas, existem dois tipos principais de parâmetros: parâmetros de tendência central e parâmetros de dispersão.

Parâmetros de Tendência Central

Os parâmetros de tendência central nos dizem qual valor é típico ou representativo em um conjunto de dados . Entre os parâmetros de tendência central temos três medidas importantes:

  • Média : A média é o valor da razão da população (amostra).
  • Mediana : por outro lado, temos a mediana cuja função é dividir a amostra em duas partes, uma superior e outra inferior. Em termos simples, ele divide os dados em dois.
  • Moda : Finalmente, a moda nada mais é do que o valor mais frequente na amostra.

Usaremos um exemplo numérico para explicar os parâmetros de tendência central usando média, mediana e moda.

Suponha que você tenha as seguintes idades de um grupo de pessoas: 25, 30, 32, 35, 40, 40, 42, 45, 50.

A média é a idade média . Para calculá-lo, somamos todas as idades e depois dividimos pelo número total de idades. Neste caso, somamos 25 + 30 + 32 + 35 + 40 + 40 + 42 + 45 + 50 = 339 e depois dividimos por 9 (qual é o número total de idades). A média é então 339 ÷ 9 = 37,67 anos.

A mediana é o valor médio quando as idades são ordenadas da menor para a maior. Neste caso, as idades ordenadas seriam: 25, 30, 32, 35, 40, 40, 42, 45, 50. Como existe um número ímpar de idades, a mediana seria o valor na posição intermediária, que é 40 anos.

A moda é o valor que aparece com mais frequência no conjunto de dados . Nesse caso, a moda é 40 anos, pois aparece duas vezes, enquanto as demais idades aparecem apenas uma vez.

Então, resumindo, a média é 37,67 anos, a mediana é 40 anos e a moda também é 40 anos.

Parâmetros de dispersão

Por outro lado,os parâmetros de dispersão nos dizem quão dispersos ou variados são os dados em um conjunto . Os mais comuns são a variância e o desvio padrão.

Variância

A variância mede o quanto os dados podem desviar-se do quadrado . Neste caso, você deve primeiro elevar ao quadrado e depois calcular a média em questão. Vejamos o exemplo a seguir para entender melhor a explicação:

Suponha que você tenha as seguintes notas em testes para cinco alunos: 80, 85, 90, 95, 100. Primeiro, encontramos a média somando todas as notas e dividindo pelo número total de alunos: (80 + 85 + 90 + 95 + 100) ÷ 5 = 90.

Em seguida, para calcular a variância, subtraímos a média de cada classificação e elevamos ao quadrado os resultados. Em seguida, calculamos a média dos resultados quadrados. Neste caso, os cálculos seriam:

(80 – 90) 2 = 100

(85 – 90) 2 = 25

(90 – 90) 2 = 0

(95 – 90) 2 = 25

(100 – 90) 2 = 100

Adicionamos os resultados: 100 + 25 + 0 + 25 + 100 = 250. E então dividimos pelo número total de pontos de dados (5) para obter a média: 250 ÷ 5 = 50.

A variância neste caso é, portanto, 50 . Isto diz-nos que, em média, as pontuações desviam-se em média 50 unidades quadradas da média, o que representa a dispersão ou variabilidade dos dados em relação à média.

Desvio padrão

Como estudamos anteriormente, o desvio padrão é simplesmente definido como o resultado da raiz quadrada da variância . Vale ressaltar que este tipo de parâmetro de dispersão é muito mais eficiente para fazer estimativas em comparação ao desvio médio no caso de uma distribuição normal.

Vejamos o exemplo anterior de notas de testes: 80, 85, 90, 95, 100. Já calculamos a variância e é 50. Para obter o desvio padrão, simplesmente extraímos a raiz quadrada da variância.

√50 ≈ 7,07

O desvio padrão neste caso é, portanto, aproximadamente 7,07 . Isto diz-nos que, em média, as pontuações estão cerca de 7,07 unidades distantes da média, mas na mesma unidade de medida das pontuações originais. Esta é uma medida mais fácil de interpretar e comparar com os dados originais porque está na mesma escala.

quantil

Além das medições acima, também consideramos parâmetros de dispersão. A função quantil é a divisão da amostra n em seções equivalentes . Graças a isso é possível estimar as faixas em que há maior concentração de valores. Dependendo do valor de n, os quantis são definidos de diferentes maneiras.

  • Decis : são responsáveis por separar o conjunto de dados em dez seções iguais.
  • Quartis : Funciona da mesma forma que o modelo anterior, exceto que a casa de dez é dividida em quatro seções.
  • Percentis – Finalmente, os percentis são usados para separar os dados de um conjunto em 100 seções idênticas.

Para que são usados os parâmetros estatísticos?

Como mencionamos anteriormente, os parâmetros estatísticos são muito importantes e a sua utilização é bastante ampla. A seguir apresentamos algumas de suas aplicações mais importantes.

Economia

Parâmetros estatísticos são utilizados para analisar indicadores econômicos, como PIB, taxa de desemprego, inflação , entre outros. Estes parâmetros permitem medir a saúde económica de um país ou região, identificar tendências e fazer previsões para a tomada de decisões de política económica.

Ciências da Saúde

Neste caso, são utilizados em estudos clínicos e epidemiológicos para analisar dados de saúde , como a prevalência de uma doença, a eficácia de um tratamento, o impacto dos fatores de risco, entre outros. Esses parâmetros são essenciais para a tomada de decisões na prevenção, diagnóstico e tratamento de doenças.

Ciências Sociais

Por outro lado, os parâmetros estatísticos são úteis em disciplinas como psicologia, sociologia, educação, entre outras, para analisar dados sobre comportamento humano, atitudes, opiniões , entre outros. Esses parâmetros permitem obter informações e fazer inferências sobre a população estudada.

Marketing e publicidade

Além do acima exposto, no mundo da publicidade eles também são muito importantes. Neste caso, são utilizados para analisar dados de mercado , como segmentação de clientes, análise de preferências e comportamento do consumidor, avaliação de campanhas publicitárias, entre outros. Essas métricas ajudam na compreensão e na tomada de decisões informadas em estratégias de marketing e publicidade.

Investigação científica

Além disso, são utilizados em diversos campos da pesquisa científica, como biologia, física, química, entre outros, para analisar dados experimentais, fazer inferências e validar resultados . Esses parâmetros são essenciais para o rigor e a validade da pesquisa científica.

Finança

Também são utilizados para analisar dados financeiros, como a rentabilidade de um investimento, a volatilidade de um ativo, avaliação de risco , entre outros. Esses parâmetros são utilizados para tomada de decisões em gestão de investimentos, planejamento financeiro e avaliação de riscos.

Engenharia

Por fim, são ideais em diversas áreas da engenharia, como engenharia da qualidade, engenharia de processos, engenharia de sistemas, entre outras, para analisar produção, qualidade, desempenho e otimização de processos . Esses parâmetros são utilizados para melhoria contínua e tomada de decisões em gerenciamento de projetos e otimização de sistemas.

Exemplo de parâmetros estatísticos

Dadas as informações acima, é hora de usar um exemplo para reforçar melhor o que foi aprendido. Vamos ver então.

1. Exemplo de média (média)

Digamos que você tenha uma lista de cinco notas de alunos em uma prova de matemática: 7, 8, 9, 6 e 10. Para encontrar a média, somamos todas as notas e depois dividimos pelo número de alunos:

7 + 8 + 9 + 6 + 10 = 40

Média = 40 ÷ 5 = 8

Portanto, a nota média ou média desses 5 alunos é 8.

2. Exemplo mediano

Digamos que você tenha uma lista de idades para um grupo de 7 pessoas: 12, 14, 15, 13, 12, 16 e 18. Para encontrar a mediana, primeiro ordenamos as idades em ordem crescente: 12, 12, 13, 14, 15, 16, 18

A seguir encontramos o valor mediano da lista, que neste caso é de 14 anos. Portanto, a idade média deste grupo de pessoas é de 14 anos.

3. Exemplo de moda

Digamos que você tenha uma lista de cores de camisas usadas por um grupo de 10 pessoas: vermelho, azul, verde, vermelho, amarelo, azul, verde, verde, vermelho, azul. A moda é o valor que aparece com mais frequência na lista. Nesse caso, a cor verde aparece 3 vezes, enquanto as demais cores aparecem apenas 2 vezes ou menos. Por isso, a moda das cores das camisetas é o verde.

4. Exemplo de percentis

Suponha que você tenha um conjunto de dados que represente as alturas em centímetros de um grupo de 20 alunos do ensino médio. Você deseja encontrar o percentil 75, que é o valor abaixo do qual caem 75% das alturas. Após ordenar os dados, você vê que o valor correspondente ao percentil 75 é 168 cm. Isso significa que 75% dos alunos têm 168 cm ou menos.

5. Exemplo de desvio

Digamos que você tenha um conjunto de dados que representa o número de horas que um grupo de 10 alunos estuda para uma prova todos os dias. Os dados são: 2, 3, 4, 2, 5, 3, 4, 1, 2, 3. Para encontrar a variância, você deve primeiro encontrar a média, que é 2,7 horas. Então você subtrai a média de cada valor, eleva ao quadrado e soma tudo. Finalmente, você divide a soma pelo número de pontos de dados:

((2-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (2-2,7) 2 + (5-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (1-2,7) 2 + (2-2,7) 2 + ( 3-2,7 ) 2 ) ÷ 10 = 1,61

Portanto, a variância de horas de estudo para esse grupo de alunos é de 1,61.

6. Exemplo de desvio padrão

Continuando com o exemplo anterior, para encontrar o desvio padrão, basta tirar a raiz quadrada da variância:

√1,61 ≈ 1,27

Portanto, o desvio padrão das horas de estudo para esse grupo de alunos é de aproximadamente 1,27 horas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima