L’écart type ou standard est une mesure statistique qui indique à quel point les points de données individuels sont éloignés de la moyenne ou de la moyenne d’un ensemble de données. C’est une mesure de dispersion qui est utilisée pour comprendre à quel point les données varient par rapport à la moyenne de l’ensemble.
En termes plus complexes, l’écart type ou standard est la racine carrée de la variance . La variance est calculée comme la moyenne des différences au carré entre chaque élément de données et la moyenne de l’ensemble. Prendre la racine carrée de la variance donne l’écart type, qui est dans les mêmes unités que les données d’origine.
Il convient de mentionner qu’il s’agit d’une mesure importante dans les statistiques. Grâce à elle, il est possible de quantifier la dispersion des données et de comprendre comment elles se répartissent par rapport à la moyenne. Un écart-type faible indique que les données ont tendance à être proches de la moyenne. En revanche, un écart-type élevé indique que les données sont plus étalées ou éloignées de la moyenne.
En général, l’écart type est utilisé pour comprendre la variabilité des données dans un ensemble et pour faire des comparaisons.
A quoi sert l’écart type ?
L’écart-type est un outil statistique qui a plusieurs applications dans l’analyse des données. Certains des utilitaires les plus connus sont les suivants :
- Mesure de dispersion : permet de quantifier à quel point les données individuelles sont éloignées de la moyenne ou de la moyenne de l’ensemble. Un écart-type élevé indique une plus grande dispersion ou variabilité des données, tandis qu’un faible écart-type indique une moindre dispersion.
- Comparaison d’ensembles de données – Peut être utilisé pour comparer la variabilité entre différents ensembles de données. Un ensemble avec un écart type plus grand aura des données plus étalées qu’un ensemble avec un écart type plus petit.
- Identification des valeurs aberrantes – Cela peut également aider à identifier les valeurs aberrantes ou les extrêmes dans un ensemble de données. Si une donnée est à plusieurs écarts-types de la moyenne, cela peut indiquer qu’il s’agit d’une valeur inhabituelle ou aberrante.
- Évaluation de la précision d’un modèle – Dans certains cas, l’écart type est utilisé comme mesure de la précision d’un modèle ou d’une estimation. Par exemple, dans les statistiques inférentielles, l’écart type peut être utilisé pour calculer des intervalles de confiance ou effectuer des tests d’hypothèse.
Propriétés de l’écart type
L’écart type a plusieurs propriétés importantes qui méritent d’être mentionnées :
- L’écart type est une mesure de distance, il s’agit donc toujours d’une valeur non négative .
- Si toutes les données de l’ensemble ont la même valeur, l’écart type sera égal à zéro .
- Il est affecté par les valeurs aberrantes et peut être significativement influencé dans l’ensemble de données.
- Il est sensible à l’échelle des données . Si les données sont à grande échelle, l’écart type sera également important, et vice versa.
- Il s’agit d’une mesure de dispersion relative , puisqu’elle est exprimée dans les mêmes unités que les données d’origine.
Quelle est la formule de l’écart type ?
La formule mathématique de l’écart type est la suivante :
Où:
σ : Représente l’écart type.
Σ : Indique la somme.
xi : Ce sont les valeurs individuelles de l’ensemble de données.
Moyenne : C’est la moyenne ou la moyenne de l’ensemble de données.
n est le nombre total de données dans l’ensemble.
L’écart type est une mesure de dispersion qui nous permet de comprendre dans quelle mesure les données d’un ensemble diffèrent de sa moyenne ou moyenne. Il est obtenu en calculant la racine carrée de la somme des carrés des différences entre chaque valeur de l’ensemble et la moyenne de l’ensemble, divisée par le nombre total de données dans l’ensemble.
Comment l’écart type est-il calculé ?
L’écart type est calculé selon les étapes suivantes :
1. Calculer la moyenne ou la moyenne de l’ensemble de données
La moyenne est obtenue en additionnant toutes les valeurs de l’ensemble de données et en divisant le résultat par la valeur totale des données. Mathématiquement, il s’exprime par :
Où xi est chacune des valeurs de l’ensemble de données, n est le nombre de données dans l’ensemble et Σ représente la somme.
2. Soustraire la moyenne de chacune des valeurs de l’ensemble de données
Pour obtenir les différences entre chaque valeur de l’ensemble de données et la moyenne, la moyenne (calculée à l’étape précédente) est soustraite de chacune des valeurs de l’ensemble de données. Cela nous permet d’identifier à quel point les données sont éloignées de la moyenne.
3. Mettre au carré chacune des différences obtenues à l’étape précédente
Les différences obtenues à l’étape précédente sont mises au carré. Cette étape est effectuée pour éviter que les différences positives et négatives ne s’annulent et pour mettre l’accent sur les valeurs les plus éloignées de la moyenne.
4. Calculez la moyenne des valeurs obtenues à l’étape précédente
La moyenne des valeurs obtenues à l’étape précédente est calculée. Cette moyenne représente la somme des carrés des différences divisée par le nombre total de données. Mathématiquement, il s’exprime par :
Moyenne des carrés des différences = Σ((xi – moyenne)²) ÷ n
5. Obtenir la racine carrée de la valeur obtenue à l’étape précédente
La dernière étape consiste à obtenir la racine carrée de la valeur obtenue à l’étape précédente. Cela fournit l’écart type, qui est une mesure de la dispersion des données par rapport à la moyenne.
Comment l’écart type est-il interprété ?
Il est important de noter que l’interprétation de l’écart-type dépend du contexte et de la nature des données étudiées.
Par conséquent, il est essentiel de bien comprendre la signification de l’écart type et de l’utiliser conjointement avec d’autres mesures statistiques pour acquérir une compréhension complète et précise de la variabilité des données. Regardons quelques exemples ci-dessous.
Analyse de variabilité
L’écart type permet d’évaluer la variabilité ou la dispersion des données dans un ensemble . Si l’écart type est faible, cela indique que les données sont proches de la moyenne et présentent peu de variabilité. En revanche, si l’écart-type est élevé, cela indique que les données sont plus dispersées et présentent une plus grande variabilité.
comparaison de données
Il est utile pour comparer la variabilité entre différents ensembles de données . Par exemple, si l’écart type du revenu de deux pays est comparé, on peut en déduire lequel a une plus grande variabilité dans le revenu de sa population.
Identification des valeurs aberrantes
Aide à identifier les valeurs aberrantes ou les données inhabituelles dans un ensemble . Les données qui sont à plus de 1 ou 2 écarts-types de la moyenne peuvent être considérées comme des valeurs aberrantes.
Évaluation de la précision de mesure
Il est également utilisé comme mesure de la précision ou de la fiabilité d’une mesure ou d’une estimation . Par exemple, si vous faites des recherches et que vous obtenez des mesures avec un écart-type élevé, cela peut indiquer que les mesures sont moins précises et qu’il faut faire plus attention lors de la collecte des données.
Évaluation de la normalité des données
L’écart type est utilisé conjointement avec d’autres mesures pour évaluer si les données suivent une distribution normale . Si les données ont un faible écart type par rapport à la moyenne, cela peut indiquer que les données sont distribuées approximativement selon une distribution normale.
Exemples numériques d’écart type
S’il est vrai que, de manière générale, cela peut être complexe, l’écart type est compris de manière simple. Pour clarifier les doutes, nous partageons quelques exemples ci-dessous, en utilisant deux méthodes différentes.
racine carrée de la variance
Supposons que nous ayons les données suivantes : 9, 3, 8, 9 et 16.
Étape 1 : Calculez la moyenne arithmétique :
Moyenne arithmétique = (9 + 3 + 8 + 9 + 16) ÷ 5 = 9.
Étape 2 : Appliquez la formule de variance :
Écart = [(9 – 9) 2 + (3 – 9) 2 + (8 – 9) 2 + (9 – 9) 2 + (16 – 9) 2 ] ÷ 5 = 86 ÷ 5 = 17,2.
Étape 3 : Prenez la racine carrée de la variance :
Écart type = √(17,2) ≈ 4,14.
Somme des écarts et division par le nombre total d’observations
Supposons que nous ayons les données suivantes : 2, 4, 2, 4, 2 et 4.
Étape 1 : Calculez la moyenne arithmétique :
Moyenne arithmétique = (2 + 4 + 2 + 4 + 2 + 4) ÷ 6 = 3.
Étape 2 : Calculez l’écart type en additionnant les écarts et en divisant par le nombre total d’observations :
Écart type = [(2 – 3) + (4 – 3) + (2 – 3) + (4 – 3) + (2 – 3) + (4 – 3)] ÷ 6 = (1 + 1 + 1 + 1 + 1 + 1) ÷ 6 = 1.
Dans les deux cas, nous obtenons un écart-type d’environ 4,14 et 1 respectivement, en utilisant des méthodes de calcul différentes. Ceci illustre comment l’écart type peut être obtenu en utilisant la racine carrée de la variance ou en additionnant les écarts et en divisant par le nombre total d’observations.