Les paramètres statistiques sont des valeurs numériques qui résument les caractéristiques importantes d’un ensemble de données et nous aident à comprendre et à décrire les informations qui s’y trouvent. En termes simples, nous pouvons dire que ce sont des “étiquettes” qui nous permettent de mieux comprendre les données et de prendre des décisions en fonction de celles-ci.
En d’autres termes, les paramètres statistiques sont des mesures spéciales utilisées par les mathématiciens et les scientifiques pour décrire les données de manière simple . Fondamentalement, ce sont des outils qui nous aident à comprendre les chiffres plus facilement et plus clairement.
Par exemple, supposons que vous ayez un sac plein de bonbons et que vous vouliez savoir combien il y a de bonbons au total. C’est là que les paramètres statistiques entrent en jeu. La moyenne est le nombre moyen de bonbons , qui est obtenu en additionnant tous les bonbons et en divisant par le montant total. Cela vous donne une idée du nombre moyen de bonbons que vous pouvez vous attendre à trouver.
Mais il y a plus, un autre paramètre important est l’ écart-type , qui vous aide à comprendre à quel point les bonbons sont éloignés de la moyenne . Il vous montre à quel point les bonbons sont différents par rapport au nombre moyen.
Ce qui est intéressant, c’est que les paramètres statistiques peuvent également être utilisés pour faire des prédictions . Par exemple, si vous voulez savoir combien de bonbons il y aura dans le sac après une semaine, vous pouvez utiliser les paramètres statistiques pour l’estimer. Vous calculez le nombre moyen de bonbons que vous avez maintenant et utilisez l’écart type pour avoir une idée de l’évolution de cette moyenne en une semaine.
Quels types de paramètres statistiques existe-t-il ?
En statistique, il existe deux grands types de paramètres : les paramètres de tendance centrale et les paramètres de dispersion.
Paramètres de tendance centrale
Les paramètres de tendance centrale nous indiquent quelle valeur est typique ou représentative dans un ensemble de données . Parmi les paramètres de tendance centrale nous avons trois mesures importantes :
- Moyenne : La moyenne est la valeur du ratio de la population (échantillon).
- Médiane : d’autre part, on a la médiane dont la fonction est de diviser l’échantillon en deux parties, une supérieure et une inférieure. En termes simples, il sépare les données en deux.
- Mode : enfin, le mode n’est rien d’autre que la valeur la plus fréquente dans l’échantillon.
Nous allons utiliser un exemple numérique pour expliquer les paramètres de tendance centrale en utilisant la moyenne, la médiane et le mode.
Supposons que vous ayez les âges suivants d’un groupe de personnes : 25, 30, 32, 35, 40, 40, 42, 45, 50.
La moyenne est la moyenne des âges . Pour le calculer, on additionne tous les âges puis on divise par le nombre total d’âges. Dans ce cas, on additionne 25 + 30 + 32 + 35 + 40 + 40 + 42 + 45 + 50 = 339, puis on divise par 9 (quel est le nombre d’âges dans l’ensemble). La moyenne est alors de 339 ÷ 9 = 37,67 ans.
La médiane est la valeur médiane lorsque les âges sont classés du plus petit au plus grand. Dans ce cas, les âges ordonnés seraient : 25, 30, 32, 35, 40, 40, 42, 45, 50. Puisqu’il y a un nombre impair d’âges, la médiane serait la valeur en position médiane, soit 40 ans.
Le mode est la valeur qui apparaît le plus fréquemment dans l’ensemble de données . Dans ce cas, le mode est de 40 ans, puisqu’il apparaît deux fois, alors que les autres âges n’apparaissent qu’une seule fois.
Donc, en résumé, la moyenne est de 37,67 ans, la médiane est de 40 ans et le mode est également de 40 ans.
Paramètres de dispersion
D’autre part, les paramètres de dispersion nous indiquent à quel point les données sont dispersées ou variées dans un ensemble . Les plus courants sont la variance et l’écart-type.
Variance
La variance mesure de combien les données peuvent s’écarter du carré . Dans ce cas, il faut d’abord mettre au carré puis calculer la moyenne en question. Voyons l’exemple suivant pour mieux comprendre l’explication :
Supposons que vous ayez les scores suivants à un test pour cinq étudiants : 80, 85, 90, 95, 100. Tout d’abord, nous trouvons la moyenne en additionnant tous les scores et en divisant par le nombre total d’étudiants : (80 + 85 + 90 + 95 + 100) ÷ 5 = 90.
Ensuite, pour calculer la variance, nous soustrayons la moyenne de chaque note et mettons les résultats au carré. Nous faisons ensuite la moyenne des résultats au carré. Dans ce cas, les calculs seraient :
(80 – 90) 2 = 100
(85 – 90) 2 = 25
(90 – 90) 2 = 0
(95 – 90) 2 = 25
(100 – 90) 2 = 100
Nous additionnons les résultats : 100 + 25 + 0 + 25 + 100 = 250. Et puis nous divisons par le nombre total de points de données (5) pour obtenir la moyenne : 250 ÷ 5 = 50.
La variance dans ce cas est donc de 50 . Cela nous indique qu’en moyenne, les scores s’éloignent en moyenne de 50 unités au carré de la moyenne, ce qui représente la dispersion ou la variabilité des données par rapport à la moyenne.
Écart-type
Comme nous l’avons étudié précédemment, l’écart type est simplement défini comme le résultat de la racine carrée de la variance . Il convient de mentionner que ce type de paramètre de dispersion est beaucoup plus efficace pour faire des estimations par rapport à l’écart moyen dans le cas d’une distribution normale.
Prenons l’exemple précédent des scores aux tests : 80, 85, 90, 95, 100. Nous avons déjà calculé la variance et elle est de 50. Pour obtenir l’écart type, nous prenons simplement la racine carrée de la variance.
√50 ≈ 7,07
L’écart type dans ce cas est donc d’environ 7,07 . Cela nous indique qu’en moyenne, les scores sont à environ 7,07 unités de la moyenne, mais dans la même unité de mesure que les scores originaux. Il s’agit d’une mesure plus facile à interpréter et à comparer avec les données d’origine, car elle est à la même échelle.
quantiles
En plus des mesures ci-dessus, nous prenons également en compte les paramètres de dispersion. La fonction des quantiles est la division de l’échantillon n en sections équivalentes . Grâce à cela, il est possible d’estimer les plages dans lesquelles il y a une plus grande concentration de valeurs. Selon la valeur de n, les quantiles sont définis de différentes manières.
- Déciles : sont chargés de séparer l’ensemble de données en dix sections égales.
- Quartiles : fonctionne de la même manière que le modèle précédent, sauf que la place de dix, se divise en quatre sections.
- Centiles – Enfin, les centiles sont utilisés pour séparer les données d’un ensemble en 100 sections identiques.
A quoi servent les paramètres statistiques ?
Comme nous l’avons mentionné précédemment, les paramètres statistiques sont très importants et leur utilisation est assez large. Ensuite, nous présentons certaines de ses applications les plus importantes.
Économie
Les paramètres statistiques sont utilisés pour analyser les indicateurs économiques, tels que le PIB, le taux de chômage, l’inflation , entre autres. Ces paramètres permettent de mesurer la santé économique d’un pays ou d’une région, d’identifier des tendances et de faire des prévisions pour la prise de décision en matière de politique économique.
Sciences De La Santé
Dans ce cas, ils sont utilisés dans des études cliniques et épidémiologiques pour analyser des données de santé , telles que la prévalence d’une maladie, l’efficacité d’un traitement, l’impact des facteurs de risque, entre autres. Ces paramètres sont essentiels pour la prise de décision dans la prévention, le diagnostic et le traitement des maladies.
sciences sociales
D’autre part, les paramètres statistiques sont utiles dans des disciplines telles que la psychologie, la sociologie, l’éducation, entre autres, pour analyser des données sur le comportement humain, les attitudes, les opinions , entre autres. Ces paramètres permettent d’obtenir des informations et de faire des inférences sur la population étudiée.
Marketing et publicité
En plus de ce qui précède, dans le monde de la publicité, ils sont également très importants. Dans ce cas, ils sont utilisés pour analyser les données du marché , telles que la segmentation des clients, l’analyse des préférences et du comportement des consommateurs, l’évaluation des campagnes publicitaires, entre autres. Ces paramètres aident à comprendre et à prendre des décisions éclairées dans les stratégies de marketing et de publicité.
Investigation scientifique
De plus, ils sont utilisés dans divers domaines de la recherche scientifique, tels que la biologie, la physique, la chimie, entre autres, pour analyser des données expérimentales, faire des inférences et valider des résultats . Ces paramètres sont essentiels pour la rigueur et la validité de la recherche scientifique.
Finance
Ils sont également utilisés pour analyser des données financières, telles que la rentabilité d’un investissement, la volatilité d’un actif, l’évaluation des risques , entre autres. Ces paramètres sont utilisés pour la prise de décision dans la gestion des investissements, la planification financière et l’évaluation des risques.
Ingénierie
Enfin, ils sont idéaux dans divers domaines de l’ingénierie, tels que l’ingénierie de la qualité, l’ingénierie des procédés, l’ingénierie des systèmes, entre autres, pour analyser les données de production, de qualité, de performance et d’optimisation des processus . Ces paramètres sont utilisés pour l’amélioration continue et la prise de décision dans la gestion de projet et l’optimisation du système.
Exemple de paramètres statistiques
Compte tenu des informations ci-dessus, il est temps d’utiliser un exemple pour mieux renforcer ce qui a été appris. Voyons, ensuite.
1. Exemple Moyenne (moyenne)
Supposons que vous ayez une liste des scores de 5 élèves à un test de mathématiques : 7, 8, 9, 6 et 10. Pour trouver la moyenne, nous additionnons tous les scores, puis nous divisons par le nombre d’élèves :
7 + 8 + 9 + 6 + 10 = 40
Moyenne = 40 ÷ 5 = 8
Par conséquent, la moyenne ou la moyenne des notes de ces 5 étudiants est de 8.
2. Exemple médian
Supposons que vous ayez une liste d’âges pour un groupe de 7 personnes : 12, 14, 15, 13, 12, 16 et 18. Pour trouver la médiane, nous classons d’abord les âges par ordre croissant : 12, 12, 13, 14, 15, 16, 18
Ensuite, nous trouvons la valeur médiane de la liste, qui dans ce cas est de 14 ans. Par conséquent, l’âge médian de ce groupe de personnes est de 14 ans.
3. Exemple de mode
Disons que vous avez une liste de couleurs de chemises portées par un groupe de 10 personnes : rouge, bleu, vert, rouge, jaune, bleu, vert, vert, rouge, bleu. Le mode est la valeur qui apparaît le plus fréquemment dans la liste. Dans ce cas, la couleur verte apparaît 3 fois, tandis que les autres couleurs n’apparaissent que 2 fois ou moins. Par conséquent, la mode pour les couleurs des t-shirts est verte.
4. Exemple de centiles
Supposons que vous ayez un ensemble de données qui représente les tailles en centimètres d’un groupe de 20 élèves du secondaire. Vous voulez trouver le 75e centile, qui représente la valeur en dessous de laquelle se situent 75 % des hauteurs. Après avoir trié les données, vous constatez que la valeur correspondant au 75e centile est de 168 cm. Cela signifie que 75 % des élèves mesurent 168 cm ou moins.
5. Exemple d’écart
Supposons que vous ayez un ensemble de données qui représente le nombre d’heures qu’un groupe de 10 étudiants étudie pour un test chaque jour. Les données sont : 2, 3, 4, 2, 5, 3, 4, 1, 2, 3. Pour trouver la variance, vous devez d’abord trouver la moyenne, qui est de 2,7 heures. Ensuite, vous soustrayez la moyenne de chaque valeur, mettez-la au carré et additionnez le tout. Enfin, vous divisez la somme par le nombre de données :
((2-2,7) 2 + (3-2,7) 2 + (4-2,7 ) 2 + (2-2,7) 2 + (5-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + ( 1-2,7 ) 2 + (2-2,7) 2 + ( 3-2,7 ) 2 ) ÷ 10 = 1,61
Par conséquent, la variance des heures d’étude pour ce groupe d’étudiants est de 1,61.
6. Exemple Écart-type
En continuant avec l’exemple précédent, pour trouver l’écart type, il suffit de prendre la racine carrée de la variance :
√1,61 ≈ 1,27
Par conséquent, l’écart type des heures d’étude pour ce groupe d’étudiants est d’environ 1,27 heure.