Standard oder Standardabweichung ist ein statistisches Maß, das angibt, wie weit einzelne Datenpunkte vom Mittelwert oder Durchschnitt eines Datensatzes entfernt sind . Dabei handelt es sich um ein Maß für die Streuung, das verwendet wird, um zu verstehen, wie stark die Daten vom Ensemble-Mittelwert abweichen.
Komplexer ausgedrückt ist der Standard oder die Standardabweichung die Quadratwurzel der Varianz . Die Varianz wird als Durchschnitt der quadrierten Differenzen zwischen den einzelnen Datenelementen und dem Gesamtmittelwert berechnet. Das Ziehen der Quadratwurzel der Varianz ergibt die Standardabweichung, die in denselben Einheiten wie die Originaldaten vorliegt.
Es ist erwähnenswert, dass dies ein wichtiges Maß in der Statistik ist. Dadurch ist es möglich, die Streuung der Daten zu quantifizieren und zu verstehen, wie sie im Vergleich zum Durchschnitt verteilt sind. Eine niedrige Standardabweichung weist darauf hin, dass die Daten tendenziell nahe am Mittelwert liegen. Andererseits weist eine hohe Standardabweichung darauf hin, dass die Daten stärker gestreut oder weit vom Mittelwert entfernt sind.
Im Allgemeinen wird die Standardabweichung verwendet, um die Variabilität von Daten in einem Satz zu verstehen und Vergleiche anzustellen.
Wofür wird die Standardabweichung verwendet?
Die Standardabweichung ist ein statistisches Werkzeug, das in der Datenanalyse mehrere Anwendungen hat. Einige der bekanntesten Dienstprogramme sind:
- Streuungsmaß : Quantifiziert, wie weit einzelne Daten vom Mittelwert oder Mittelwert des Ganzen entfernt sind. Eine hohe Standardabweichung weist auf eine größere Streuung oder Variabilität der Daten hin, während eine niedrige Standardabweichung auf eine geringere Streuung hinweist.
- Datensatzvergleich – Kann verwendet werden, um die Variabilität zwischen verschiedenen Datensätzen zu vergleichen. Ein Satz mit einer größeren Standardabweichung weist mehr verteilte Daten auf als ein Satz mit einer kleineren Standardabweichung.
- Identifizierung von Ausreißern – Dies kann auch dabei helfen, Ausreißer oder Extreme in einem Datensatz zu identifizieren. Wenn ein Datenpunkt mehrere Standardabweichungen vom Mittelwert abweicht, kann dies darauf hindeuten, dass es sich um einen ungewöhnlichen oder Ausreißerwert handelt.
- Bewertung der Genauigkeit eines Modells – In einigen Fällen wird die Standardabweichung als Maß für die Präzision eines Modells oder einer Schätzung verwendet. Beispielsweise kann in der Inferenzstatistik die Standardabweichung zur Berechnung von Konfidenzintervallen oder zur Durchführung von Hypothesentests verwendet werden.
Eigenschaften der Standardabweichung
Die Standardabweichung hat mehrere wichtige Eigenschaften, die es zu erwähnen gilt:
- Die Standardabweichung ist ein Maß für die Entfernung und daher immer ein nicht negativer Wert .
- Wenn alle Daten im Satz den gleichen Wert haben, beträgt die Standardabweichung Null .
- Sie wird durch Ausreißer beeinflusst und kann im Datensatz erheblich beeinflusst werden.
- Es reagiert empfindlich auf den Umfang der Daten . Wenn es sich um große Datenmengen handelt, ist auch die Standardabweichung groß und umgekehrt.
- Dies ist ein Maß für die relative Streuung , da sie in denselben Einheiten wie die Originaldaten ausgedrückt wird.
Wie lautet die Formel für die Standardabweichung?
Die mathematische Formel für die Standardabweichung lautet:
Gold:
σ: Stellt die Standardabweichung dar.
Σ: Gibt die Summe an.
xi: Dies sind die einzelnen Werte des Datensatzes.
Mittelwert: Dies ist der Mittelwert oder Durchschnitt des Datensatzes.
n ist die Gesamtzahl der Daten im Satz.
Die Standardabweichung ist ein Maß für die Streuung, das es uns ermöglicht zu verstehen, wie stark die Daten in einem Satz von ihrem Mittelwert oder Mittelwert abweichen. Sie wird durch Berechnen der Quadratwurzel der Summe der Quadrate der Differenzen zwischen jedem Wert im Satz und dem Mittelwert des Satzes, dividiert durch die Gesamtzahl der Daten im Satz, ermittelt.
Wie wird die Standardabweichung berechnet?
Die Standardabweichung wird anhand der folgenden Schritte berechnet:
1. Berechnen Sie den Mittelwert oder Durchschnitt des Datensatzes
Der Durchschnitt wird ermittelt, indem alle Werte im Datensatz addiert und das Ergebnis durch den Gesamtdatenwert dividiert werden. Mathematisch wird es ausgedrückt durch:
Dabei ist xi jeder Wert im Datensatz, n die Anzahl der Datenelemente im Satz und Σ die Summe.
2. Subtrahieren Sie den Mittelwert von jedem Wert im Datensatz
Um die Differenzen zwischen jedem Wert im Datensatz und dem Mittelwert zu erhalten, wird der Mittelwert (im vorherigen Schritt berechnet) von jedem Wert im Datensatz subtrahiert. Dadurch können wir erkennen, wie weit die Daten vom Durchschnitt entfernt sind.
3. Quadrieren Sie jede der im vorherigen Schritt erhaltenen Differenzen
Die im vorherigen Schritt erhaltenen Differenzen werden quadriert. Dieser Schritt wird durchgeführt, um zu verhindern, dass sich positive und negative Unterschiede gegenseitig aufheben, und um die Werte hervorzuheben, die am weitesten vom Mittelwert entfernt sind.
4. Berechnen Sie den Durchschnitt der im vorherigen Schritt erhaltenen Werte
Der Durchschnitt der im vorherigen Schritt erhaltenen Werte wird berechnet. Dieser Durchschnitt stellt die Summe der Quadrate der Differenzen dividiert durch die Gesamtzahl der Daten dar. Mathematisch wird es ausgedrückt durch:
Mittlere quadratische Differenzen = Σ((xi – Mittelwert)²) ÷ n
5. Ermitteln Sie die Quadratwurzel des im vorherigen Schritt erhaltenen Werts
Der letzte Schritt besteht darin, die Quadratwurzel des im vorherigen Schritt erhaltenen Werts zu ermitteln. Daraus ergibt sich die Standardabweichung, die ein Maß für die Streuung der Daten vom Mittelwert ist.
Wie wird die Standardabweichung interpretiert?
Es ist wichtig zu beachten, dass die Interpretation der Standardabweichung vom Kontext und der Art der untersuchten Daten abhängt .
Daher ist es wichtig, die Bedeutung der Standardabweichung vollständig zu verstehen und sie in Verbindung mit anderen statistischen Maßen zu verwenden, um ein vollständiges und genaues Verständnis der Datenvariabilität zu erlangen. Schauen wir uns unten einige Beispiele an.
Variabilitätsanalyse
Die Standardabweichung wird verwendet , um die Variabilität oder Streuung von Daten in einem Satz zu bewerten . Wenn die Standardabweichung niedrig ist, bedeutet dies, dass die Daten nahe am Mittelwert liegen und nur eine geringe Variabilität aufweisen. Wenn andererseits die Standardabweichung hoch ist, deutet dies darauf hin, dass die Daten stärker gestreut sind und eine größere Variabilität aufweisen.
Datenvergleich
Es ist nützlich, um die Variabilität zwischen verschiedenen Datensätzen zu vergleichen . Wenn man beispielsweise die Standardabweichung des Einkommens zweier Länder vergleicht, kann man daraus schließen, welches Land eine größere Variabilität im Einkommen seiner Bevölkerung aufweist.
Ausreißer identifizieren
Hilft bei der Identifizierung von Ausreißern oder ungewöhnlichen Daten in einem Satz . Daten, die mehr als 1 oder 2 Standardabweichungen vom Mittelwert aufweisen, können als Ausreißer betrachtet werden.
Bewertung der Messgenauigkeit
Es wird auch als Maß für die Präzision oder Zuverlässigkeit einer Messung oder Schätzung verwendet. Wenn Sie beispielsweise eine Recherche durchführen und Messungen mit einer hohen Standardabweichung erhalten, kann dies darauf hindeuten, dass die Messungen weniger genau sind und bei der Datenerfassung mehr Sorgfalt angewendet werden muss.
Bewertung der Datennormalität
Die Standardabweichung wird in Verbindung mit anderen Maßen verwendet, um zu beurteilen, ob die Daten einer Normalverteilung folgen . Wenn die Daten eine geringe Standardabweichung vom Mittelwert aufweisen, kann dies darauf hindeuten, dass die Daten ungefähr gemäß einer Normalverteilung verteilt sind.
Numerische Beispiele für Standardabweichungen
Obwohl es im Allgemeinen zutrifft, dass es komplex sein kann, wird die Standardabweichung auf einfache Weise verstanden. Um Zweifel auszuräumen, geben wir unten einige Beispiele, die zwei verschiedene Methoden verwenden.
Quadratwurzel der Varianz
Angenommen, wir haben die folgenden Daten: 9, 3, 8, 9 und 16.
Schritt 1: Berechnen Sie das arithmetische Mittel:
Arithmetisches Mittel = (9 + 3 + 8 + 9 + 16) ÷ 5 = 9.
Schritt 2: Wenden Sie die Varianzformel an:
Abweichung = [(9 – 9) 2 + (3 – 9) 2 + (8 – 9) 2 + (9 – 9) 2 + (16 – 9) 2 ] ÷ 5 = 86 ÷ 5 = 17,2.
Schritt 3: Ziehen Sie die Quadratwurzel der Varianz:
Standardabweichung = √(17,2) ≈ 4,14.
Summe der Abweichungen und Division durch die Gesamtzahl der Beobachtungen
Angenommen, wir haben die folgenden Daten: 2, 4, 2, 4, 2 und 4.
Schritt 1: Berechnen Sie das arithmetische Mittel:
Arithmetisches Mittel = (2 + 4 + 2 + 4 + 2 + 4) ÷ 6 = 3.
Schritt 2: Berechnen Sie die Standardabweichung, indem Sie die Abweichungen addieren und durch die Gesamtzahl der Beobachtungen dividieren:
Standardabweichung = [(2 – 3) + (4 – 3) + (2 – 3) + (4 – 3) + (2 – 3) + (4 – 3)] ÷ 6 = (1 + 1 + 1 + 1 + 1 + 1) ÷ 6 = 1.
In beiden Fällen erhalten wir mit unterschiedlichen Berechnungsmethoden eine Standardabweichung von ca. 4,14 bzw. 1. Dies veranschaulicht, wie die Standardabweichung ermittelt werden kann, indem man die Quadratwurzel der Varianz verwendet oder die Abweichungen addiert und durch die Gesamtzahl der Beobachtungen dividiert.