Cos'è la deviazione standard?

La deviazione standard o standard è una misura statistica che indica la distanza dei singoli punti dati dalla media o dalla media di un set di dati. È una misura di dispersione che viene utilizzata per capire quanto i dati variano dalla media dell’insieme.

In termini più complessi, lo standard o la deviazione standard è la radice quadrata della varianza . La varianza viene calcolata come media delle differenze al quadrato tra ciascun dato e la media complessiva. Prendendo la radice quadrata della varianza si ottiene la deviazione standard, che è nelle stesse unità dei dati originali.

Vale la pena ricordare che questa è una misura importante nelle statistiche. Grazie ad esso è possibile quantificare la dispersione dei dati e capire come è distribuito rispetto alla media. Una deviazione standard bassa indica che i dati tendono ad essere vicini alla media. D’altro canto, una deviazione standard elevata indica che i dati sono più dispersi o lontani dalla media.

In generale, la deviazione standard viene utilizzata per comprendere la variabilità dei dati in un insieme e per effettuare confronti.

A cosa serve la deviazione standard?

La deviazione standard è uno strumento statistico che ha diverse applicazioni nell’analisi dei dati. Alcune delle utilità più conosciute sono:

  • Misura della dispersione : quantifica la distanza dei singoli dati dalla media o dalla media del tutto. Una deviazione standard elevata indica una maggiore dispersione o variabilità nei dati, mentre una deviazione standard bassa indica una minore dispersione.
  • Confronto di set di dati : può essere utilizzato per confrontare la variabilità tra diversi set di dati. Un insieme con una deviazione standard maggiore avrà dati più sparsi rispetto a un insieme con una deviazione standard minore.
  • Identificazione dei valori anomali : può anche aiutare a identificare valori anomali o estremi in un set di dati. Se un punto dati presenta diverse deviazioni standard dalla media, ciò potrebbe indicare che si tratta di un valore insolito o anomalo.
  • Valutazione dell’accuratezza di un modello – In alcuni casi, la deviazione standard viene utilizzata come misura della precisione di un modello o di una stima. Ad esempio, nelle statistiche inferenziali, la deviazione standard può essere utilizzata per calcolare gli intervalli di confidenza o eseguire test di ipotesi.

Proprietà della deviazione standard

La deviazione standard ha diverse proprietà importanti che vale la pena menzionare:

  • La deviazione standard è una misura della distanza, quindi è sempre un valore non negativo .
  • Se tutti i dati nell’insieme hanno lo stesso valore, la deviazione standard sarà zero .
  • È influenzato da valori anomali e può essere influenzato in modo significativo nel set di dati.
  • È sensibile alla scala dei dati . Se i dati sono su larga scala, anche la deviazione standard sarà ampia e viceversa.
  • Questa è una misura di dispersione relativa , poiché è espressa nelle stesse unità dei dati originali.

Qual è la formula per la deviazione standard?

La formula matematica per la deviazione standard è:

Formula standard o deviazione standard

Oro:

σ: rappresenta la deviazione standard.

Σ: Indica la somma.

xi: Questi sono i singoli valori del set di dati.

Media: questa è la media o la media del set di dati.

n è il numero totale di dati nel set.

La deviazione standard è una misura di dispersione che ci permette di capire quanto i dati in un insieme differiscono dalla sua media o media. Si ottiene calcolando la radice quadrata della somma dei quadrati delle differenze tra ciascun valore dell’insieme e la media dell’insieme, divisa per il numero totale di dati nell’insieme.

Come viene calcolata la deviazione standard?

La deviazione standard viene calcolata utilizzando i seguenti passaggi:

1. Calcolare la media o la media del set di dati

La media si ottiene sommando tutti i valori nel set di dati e dividendo il risultato per il valore totale dei dati. Matematicamente è espresso da:

formula della media aritmetica

Dove xi è ciascuno dei valori nell’insieme di dati, n è il numero di elementi di dati nell’insieme e Σ rappresenta la somma.

2. Sottrarre la media da ciascuno dei valori nel set di dati

Per ottenere le differenze tra ciascun valore nel set di dati e la media, la media (calcolata nel passaggio precedente) viene sottratta da ciascuno dei valori nel set di dati. Questo ci permette di identificare quanto i dati si discostano dalla media.

3. Eleva al quadrato ciascuna delle differenze ottenute nel passaggio precedente

Le differenze ottenute nel passaggio precedente vengono elevate al quadrato. Questo passaggio viene effettuato per evitare che le differenze positive e negative si annullino a vicenda e per enfatizzare i valori più lontani dalla media.

4. Calcola la media dei valori ottenuti nel passaggio precedente

Viene calcolata la media dei valori ottenuti nel passaggio precedente. Questa media rappresenta la somma dei quadrati delle differenze divisa per il numero totale di dati. Matematicamente è espresso da:

Differenze quadratiche medie = Σ((xi – media)²) ÷ n

5. Ottieni la radice quadrata del valore ottenuto nel passaggio precedente

L’ultimo passaggio è ottenere la radice quadrata del valore ottenuto nel passaggio precedente. Ciò fornisce la deviazione standard, che è una misura della dispersione dei dati dalla media.

Formula standard o deviazione standard

Come viene interpretata la deviazione standard?

È importante notare che l’interpretazione della deviazione standard dipende dal contesto e dalla natura dei dati studiati.

Pertanto, è essenziale comprendere appieno il significato della deviazione standard e utilizzarla insieme ad altre misure statistiche per ottenere una comprensione completa e accurata della variabilità dei dati. Diamo un’occhiata ad alcuni esempi di seguito.

Analisi della variabilità

La deviazione standard viene utilizzata per valutare la variabilità o la dispersione dei dati in un insieme . Se la deviazione standard è bassa, significa che i dati sono vicini alla media e presentano poca variabilità. D’altra parte, se la deviazione standard è elevata, indica che i dati sono più dispersi e presentano una maggiore variabilità.

confronto dei dati

È utile per confrontare la variabilità tra diversi set di dati . Ad esempio, se si confronta la deviazione standard del reddito di due paesi, si può dedurre quale presenta una maggiore variabilità nel reddito della sua popolazione.

Identificazione dei valori anomali

Aiuta a identificare valori anomali o dati insoliti in un set . I dati che sono più di 1 o 2 deviazioni standard dalla media possono essere considerati valori anomali.

Valutazione dell’accuratezza della misurazione

Viene anche utilizzato come misura della precisione o dell’affidabilità di una misurazione o stima . Ad esempio, se stai facendo una ricerca e ottieni misurazioni con una deviazione standard elevata, ciò potrebbe indicare che le misurazioni sono meno accurate e che è necessario prestare maggiore attenzione durante la raccolta dei dati.

Valutazione della normalità dei dati

La deviazione standard viene utilizzata insieme ad altre misure per valutare se i dati seguono una distribuzione normale . Se i dati hanno una piccola deviazione standard dalla media, ciò potrebbe indicare che i dati sono distribuiti approssimativamente secondo una distribuzione normale.

Esempi numerici di deviazione standard

Sebbene sia vero che, in generale, può essere complesso, la deviazione standard viene intesa in modo semplice. Per chiarire i dubbi, condividiamo di seguito alcuni esempi, utilizzando due metodi diversi.

radice quadrata della varianza

Supponiamo di avere i seguenti dati: 9, 3, 8, 9 e 16.

Passaggio 1: calcolare la media aritmetica:

Media aritmetica = (9 + 3 + 8 + 9 + 16) ÷ 5 = 9.

Passaggio 2: applicare la formula della varianza:

Deviazione = [(9 – 9) 2 + (3 – 9) 2 + (8 – 9) 2 + (9 – 9) 2 + (16 – 9) 2 ] ÷ 5 = 86 ÷ 5 = 17,2.

Passaggio 3: prendi la radice quadrata della varianza:

Deviazione standard = √(17,2) ≈ 4,14.

Somma delle deviazioni e divisione per il numero totale di osservazioni

Supponiamo di avere i seguenti dati: 2, 4, 2, 4, 2 e 4.

Passaggio 1: calcolare la media aritmetica:

Media aritmetica = (2 + 4 + 2 + 4 + 2 + 4) ÷ 6 = 3.

Passaggio 2: calcolare la deviazione standard sommando le deviazioni e dividendo per il numero totale di osservazioni:

Deviazione standard = [(2 – 3) + (4 – 3) + (2 – 3) + (4 – 3) + (2 – 3) + (4 – 3)] ÷ 6 = (1 + 1 + 1 + 1 + 1 + 1) ÷ 6 = 1.

In entrambi i casi otteniamo una deviazione standard rispettivamente di circa 4,14 e 1, utilizzando metodi di calcolo diversi. Questo illustra come la deviazione standard può essere ottenuta utilizzando la radice quadrata della varianza o sommando le deviazioni e dividendo per il numero totale di osservazioni.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto