Parâmetros estatísticos são valores numéricos que resumem características importantes de um conjunto de dados e nos ajudam a compreender e descrever as informações nele encontradas. Em termos simples, podemos dizer que são “rótulos” que nos permitem compreender melhor os dados e tomar decisões com base neles.
Em outras palavras, parâmetros estatísticos são medidas especiais usadas por matemáticos e cientistas para descrever dados de maneira simples . Basicamente, são ferramentas que nos ajudam a compreender os números com mais facilidade e clareza.
Por exemplo, digamos que você tenha um saco cheio de doces e queira saber quantos doces existem no total. É aqui que entram os parâmetros estatísticos. A média é a quantidade média de doces , que se obtém somando todos os doces e dividindo pela quantidade total. Isso lhe dá uma ideia do número médio de doces que você pode esperar encontrar.
Mas tem mais, outro parâmetro importante é o desvio padrão , que ajuda a entender o quão longe os doces estão da média . Mostra o quão diferentes os doces são em comparação com o número médio.
O interessante é que os parâmetros estatísticos também podem ser usados para fazer previsões . Por exemplo, se quiser saber quantos doces haverá na sacola depois de uma semana, você pode usar parâmetros estatísticos para estimá-los. Você calcula o número médio de doces que tem agora e usa o desvio padrão para ter uma ideia de como essa média muda ao longo de uma semana.
Que tipos de parâmetros estatísticos existem?
Nas estatísticas, existem dois tipos principais de parâmetros: parâmetros de tendência central e parâmetros de dispersão.
Parâmetros de Tendência Central
Os parâmetros de tendência central nos dizem qual valor é típico ou representativo em um conjunto de dados . Entre os parâmetros de tendência central temos três medidas importantes:
- Média : A média é o valor da razão da população (amostra).
- Mediana : por outro lado, temos a mediana cuja função é dividir a amostra em duas partes, uma superior e outra inferior. Em termos simples, ele divide os dados em dois.
- Moda : Finalmente, a moda nada mais é do que o valor mais frequente na amostra.
Usaremos um exemplo numérico para explicar os parâmetros de tendência central usando média, mediana e moda.
Suponha que você tenha as seguintes idades de um grupo de pessoas: 25, 30, 32, 35, 40, 40, 42, 45, 50.
A média é a idade média . Para calculá-lo, somamos todas as idades e depois dividimos pelo número total de idades. Neste caso, somamos 25 + 30 + 32 + 35 + 40 + 40 + 42 + 45 + 50 = 339 e depois dividimos por 9 (qual é o número total de idades). A média é então 339 ÷ 9 = 37,67 anos.
A mediana é o valor médio quando as idades são ordenadas da menor para a maior. Neste caso, as idades ordenadas seriam: 25, 30, 32, 35, 40, 40, 42, 45, 50. Como existe um número ímpar de idades, a mediana seria o valor na posição intermediária, que é 40 anos.
A moda é o valor que aparece com mais frequência no conjunto de dados . Nesse caso, a moda é 40 anos, pois aparece duas vezes, enquanto as demais idades aparecem apenas uma vez.
Então, resumindo, a média é 37,67 anos, a mediana é 40 anos e a moda também é 40 anos.
Parâmetros de dispersão
Por outro lado,os parâmetros de dispersão nos dizem quão dispersos ou variados são os dados em um conjunto . Os mais comuns são a variância e o desvio padrão.
Variância
A variância mede o quanto os dados podem desviar-se do quadrado . Neste caso, você deve primeiro elevar ao quadrado e depois calcular a média em questão. Vejamos o exemplo a seguir para entender melhor a explicação:
Suponha que você tenha as seguintes notas em testes para cinco alunos: 80, 85, 90, 95, 100. Primeiro, encontramos a média somando todas as notas e dividindo pelo número total de alunos: (80 + 85 + 90 + 95 + 100) ÷ 5 = 90.
Em seguida, para calcular a variância, subtraímos a média de cada classificação e elevamos ao quadrado os resultados. Em seguida, calculamos a média dos resultados quadrados. Neste caso, os cálculos seriam:
(80 – 90) 2 = 100
(85 – 90) 2 = 25
(90 – 90) 2 = 0
(95 – 90) 2 = 25
(100 – 90) 2 = 100
Adicionamos os resultados: 100 + 25 + 0 + 25 + 100 = 250. E então dividimos pelo número total de pontos de dados (5) para obter a média: 250 ÷ 5 = 50.
A variância neste caso é, portanto, 50 . Isto diz-nos que, em média, as pontuações desviam-se em média 50 unidades quadradas da média, o que representa a dispersão ou variabilidade dos dados em relação à média.
Desvio padrão
Como estudamos anteriormente, o desvio padrão é simplesmente definido como o resultado da raiz quadrada da variância . Vale ressaltar que este tipo de parâmetro de dispersão é muito mais eficiente para fazer estimativas em comparação ao desvio médio no caso de uma distribuição normal.
Vejamos o exemplo anterior de notas de testes: 80, 85, 90, 95, 100. Já calculamos a variância e é 50. Para obter o desvio padrão, simplesmente extraímos a raiz quadrada da variância.
√50 ≈ 7,07
O desvio padrão neste caso é, portanto, aproximadamente 7,07 . Isto diz-nos que, em média, as pontuações estão cerca de 7,07 unidades distantes da média, mas na mesma unidade de medida das pontuações originais. Esta é uma medida mais fácil de interpretar e comparar com os dados originais porque está na mesma escala.
quantil
Além das medições acima, também consideramos parâmetros de dispersão. A função quantil é a divisão da amostra n em seções equivalentes . Graças a isso é possível estimar as faixas em que há maior concentração de valores. Dependendo do valor de n, os quantis são definidos de diferentes maneiras.
- Decis : são responsáveis por separar o conjunto de dados em dez seções iguais.
- Quartis : Funciona da mesma forma que o modelo anterior, exceto que a casa de dez é dividida em quatro seções.
- Percentis – Finalmente, os percentis são usados para separar os dados de um conjunto em 100 seções idênticas.
Para que são usados os parâmetros estatísticos?
Como mencionamos anteriormente, os parâmetros estatísticos são muito importantes e a sua utilização é bastante ampla. A seguir apresentamos algumas de suas aplicações mais importantes.
Economia
Parâmetros estatísticos são utilizados para analisar indicadores econômicos, como PIB, taxa de desemprego, inflação , entre outros. Estes parâmetros permitem medir a saúde económica de um país ou região, identificar tendências e fazer previsões para a tomada de decisões de política económica.
Ciências da Saúde
Neste caso, são utilizados em estudos clínicos e epidemiológicos para analisar dados de saúde , como a prevalência de uma doença, a eficácia de um tratamento, o impacto dos fatores de risco, entre outros. Esses parâmetros são essenciais para a tomada de decisões na prevenção, diagnóstico e tratamento de doenças.
Ciências Sociais
Por outro lado, os parâmetros estatísticos são úteis em disciplinas como psicologia, sociologia, educação, entre outras, para analisar dados sobre comportamento humano, atitudes, opiniões , entre outros. Esses parâmetros permitem obter informações e fazer inferências sobre a população estudada.
Marketing e publicidade
Além do acima exposto, no mundo da publicidade eles também são muito importantes. Neste caso, são utilizados para analisar dados de mercado , como segmentação de clientes, análise de preferências e comportamento do consumidor, avaliação de campanhas publicitárias, entre outros. Essas métricas ajudam na compreensão e na tomada de decisões informadas em estratégias de marketing e publicidade.
Investigação científica
Além disso, são utilizados em diversos campos da pesquisa científica, como biologia, física, química, entre outros, para analisar dados experimentais, fazer inferências e validar resultados . Esses parâmetros são essenciais para o rigor e a validade da pesquisa científica.
Finança
Também são utilizados para analisar dados financeiros, como a rentabilidade de um investimento, a volatilidade de um ativo, avaliação de risco , entre outros. Esses parâmetros são utilizados para tomada de decisões em gestão de investimentos, planejamento financeiro e avaliação de riscos.
Engenharia
Por fim, são ideais em diversas áreas da engenharia, como engenharia da qualidade, engenharia de processos, engenharia de sistemas, entre outras, para analisar produção, qualidade, desempenho e otimização de processos . Esses parâmetros são utilizados para melhoria contínua e tomada de decisões em gerenciamento de projetos e otimização de sistemas.
Exemplo de parâmetros estatísticos
Dadas as informações acima, é hora de usar um exemplo para reforçar melhor o que foi aprendido. Vamos ver então.
1. Exemplo de média (média)
Digamos que você tenha uma lista de cinco notas de alunos em uma prova de matemática: 7, 8, 9, 6 e 10. Para encontrar a média, somamos todas as notas e depois dividimos pelo número de alunos:
7 + 8 + 9 + 6 + 10 = 40
Média = 40 ÷ 5 = 8
Portanto, a nota média ou média desses 5 alunos é 8.
2. Exemplo mediano
Digamos que você tenha uma lista de idades para um grupo de 7 pessoas: 12, 14, 15, 13, 12, 16 e 18. Para encontrar a mediana, primeiro ordenamos as idades em ordem crescente: 12, 12, 13, 14, 15, 16, 18
A seguir encontramos o valor mediano da lista, que neste caso é de 14 anos. Portanto, a idade média deste grupo de pessoas é de 14 anos.
3. Exemplo de moda
Digamos que você tenha uma lista de cores de camisas usadas por um grupo de 10 pessoas: vermelho, azul, verde, vermelho, amarelo, azul, verde, verde, vermelho, azul. A moda é o valor que aparece com mais frequência na lista. Nesse caso, a cor verde aparece 3 vezes, enquanto as demais cores aparecem apenas 2 vezes ou menos. Por isso, a moda das cores das camisetas é o verde.
4. Exemplo de percentis
Suponha que você tenha um conjunto de dados que represente as alturas em centímetros de um grupo de 20 alunos do ensino médio. Você deseja encontrar o percentil 75, que é o valor abaixo do qual caem 75% das alturas. Após ordenar os dados, você vê que o valor correspondente ao percentil 75 é 168 cm. Isso significa que 75% dos alunos têm 168 cm ou menos.
5. Exemplo de desvio
Digamos que você tenha um conjunto de dados que representa o número de horas que um grupo de 10 alunos estuda para uma prova todos os dias. Os dados são: 2, 3, 4, 2, 5, 3, 4, 1, 2, 3. Para encontrar a variância, você deve primeiro encontrar a média, que é 2,7 horas. Então você subtrai a média de cada valor, eleva ao quadrado e soma tudo. Finalmente, você divide a soma pelo número de pontos de dados:
((2-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (2-2,7) 2 + (5-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (1-2,7) 2 + (2-2,7) 2 + ( 3-2,7 ) 2 ) ÷ 10 = 1,61
Portanto, a variância de horas de estudo para esse grupo de alunos é de 1,61.
6. Exemplo de desvio padrão
Continuando com o exemplo anterior, para encontrar o desvio padrão, basta tirar a raiz quadrada da variância:
√1,61 ≈ 1,27
Portanto, o desvio padrão das horas de estudo para esse grupo de alunos é de aproximadamente 1,27 horas.