La varianza è una misura statistica che ci dice quanto bene sono distribuiti i dati attorno alla media . È come misurare la “diffusione” dei dati rispetto al valore medio.
Immagina di avere un elenco di numeri, come i punteggi di un test. La varianza ti aiuta a capire quanto diversi sono questi punteggi l’uno dall’altro . Se i punteggi sono molto vicini tra loro, la varianza sarà bassa. Ma se ci sono molte differenze tra i punteggi, la varianza sarà elevata.
In generale, la varianza è uno strumento utile per comprendere la dispersione dei dati in un insieme di valori. Se la varianza è alta significa che i dati sono più dispersi, mentre se è bassa significa che i dati sono più vicini tra loro.
Come viene calcolato il divario?
Per calcolare la varianza è necessario eseguire alcuni passaggi matematici, ma non preoccuparti, è più semplice di quanto sembri. Innanzitutto, è necessario calcolare la media o la media dei dati. Quindi sottrai ciascun dato dalla media ed eleva al quadrato ciascuna differenza. Quindi sommi tutti questi quadrati e dividi per la quantità di dati. È la varianza.
Per capirlo un po’ meglio, vediamo un esempio di calcolo della varianza, di seguito:
Passaggio 1: ottenere i dati
Supponiamo di avere i seguenti dati: 5, 7, 9, 11, 13. Questi sono i valori di un campione di dati di cui vuoi calcolare la varianza.
Passaggio 2: calcolare la media
Somma tutti i valori e dividi per la quantità totale di dati per ottenere la media:
Media = (5 + 7 + 9 + 11 + 13) ÷ 5 = 45 ÷ 5 = 9
La media dei dati è 9.
Passaggio 3: sottrai la media da ciascun punto dati
Sottrai la media ottenuta nel passaggio precedente da ciascun dato nell’elenco:
5 – 9 = -4
7 – 9 = -2
9 – 9 = 0
11 – 9 = 2
13 – 9 = 4
Passaggio 4: quadrare ogni differenza
Eleva al quadrato ciascuna delle differenze ottenute nel passaggio precedente:
(-4) 2 = 16
(-2) 2 = 4
02 = 0
22 = 4
4 2 = 16
Passaggio 5: aggiungi i quadrati delle differenze
Somma tutti i risultati ottenuti nel passaggio precedente:
16 + 4 + 0 + 4 + 16 = 40
Passaggio 6: dividere per la quantità di dati
Dividi la somma dei quadrati delle differenze per la quantità totale di dati (in questo caso, 5):
Deviazione = 40 ÷ 5 = 8
La varianza dei dati è 8 .
Qual è la formula della varianza?
Prima di analizzare questo punto, è importante ricordare che la varianza è di grande importanza per la statistica. Nonostante sia una misura abbastanza semplice, fornisce informazioni interessanti basate su una variabile specifica.
L’unità di misura sarà sempre quella corrispondente ai dati, ma al quadrato. Inoltre, va notato che la varianza è sempre uguale o maggiore di zero. Questo perché i residui sono sempre al quadrato, quindi, in termini matematici, è impossibile che ci sia una varianza negativa.
Tenendo presente questo, di seguito vi mostriamo la formula della varianza:
S2 = divario
x i = termine del set di dati
X̄ = misurazione del campione
∑ = somma
n = dimensione del campione
Cos’è la varianza alta e bassa?
La varianza è considerata elevata quando i dati in un campione statistico o in una popolazione sono rari e lontani dalla media . Ciò significa che i valori individuali nei dati sono ampiamente distribuiti e che vi è una grande variabilità nei dati.
Al contrario, la varianza è considerata bassa quando i dati in un campione o in una popolazione sono più vicini alla media e c’è poca dispersione tra i valori individuali. Ciò implica che i dati sono più coerenti e presentano meno variabilità.
Quali sono gli usi principali della varianza?
La varianza è una misura statistica ampiamente utilizzata in vari campi grazie alla sua capacità di valutare la dispersione o la variabilità dei dati in un campione. Alcuni degli usi principali della varianza sono:
Nella statistica descrittiva – per descrivere la dispersione dei dati in un campione, aiutando a capire come i singoli valori si discostano dalla media e come sono distribuiti all’interno del campione.
Nelle statistiche inferenziali : per stimare la variabilità dei dati in una popolazione da un campione, consentendo di fare inferenze sulla popolazione nel suo insieme.
In finanza : nell’analisi del rischio e del rendimento dell’investimento, dove una varianza più elevata indica un rischio più elevato e una varianza più bassa indica un rischio più basso in un portafoglio di investimenti.
Nella ricerca scientifica : analizzare la variabilità dei dati negli studi scientifici, come la ricerca medica, la biologia, la psicologia e altre discipline, per comprendere la variabilità dei risultati e la coerenza dei dati.
Nel controllo della qualità del processo : nel controllo della qualità dei processi industriali per misurare la variabilità dei prodotti o servizi fabbricati, che consente di identificare problemi di coerenza e qualità del processo.
In econometria : nella modellazione e analisi dei dati economici per comprendere la variabilità delle variabili economiche e valutare l’affidabilità dei modelli econometrici.
Qual è il significato della varianza?
La varianza è importante perché consente di comprendere la variabilità dei dati in un campione . Se la varianza è elevata, significa che i dati sono scarsi e c’è molta variabilità. Ciò è importante per prendere decisioni informate in settori quali investimenti, gestione del rischio e analisi dei dati.
Inoltre, la varianza aiuta a comprendere la coerenza dei dati in un campione o in una popolazione. Una varianza bassa indica che i dati sono coerenti e presentano poca variabilità, mentre una varianza elevata indica che i dati sono meno coerenti e presentano maggiore variabilità.
La deviazione standard e la varianza sono la stessa cosa?
La deviazione standard e la varianza sono due misure statistiche correlate che descrivono la diffusione, o variabilità, dei dati in un campione o popolazione. La principale differenza tra loro è l’unità di misura e l’interpretazione dei risultati.
La varianza è una misura che rappresenta la dispersione dei dati dalla sua media, calcolata come la somma dei quadrati delle deviazioni dei singoli valori dalla media, divisa per il numero totale di dati.
Si calcola elevando al quadrato le differenze tra ciascun valore e la media, sommandole e dividendole per la dimensione del campione o della popolazione. La varianza è espressa in unità quadrate e può essere difficile da interpretare direttamente perché è su una scala diversa rispetto ai dati originali.
D’altra parte, la deviazione standard non è altro che la radice quadrata della varianza . Si calcola come radice quadrata positiva della varianza. La deviazione standard è espressa nelle stesse unità dei dati originali ed è una misura più intuitiva della dispersione dei dati.
Una deviazione standard più elevata indica una maggiore diffusione o variabilità nei dati, mentre una deviazione standard inferiore indica una minore diffusione o variabilità.
Divario per i dati raggruppati
La varianza per i dati raggruppati si riferisce al calcolo della variabilità o della dispersione dei dati raggruppati in intervalli o classi . Invece di avere dati individuali, come nel caso della varianza per dati non raggruppati, hai intervalli o intervalli in cui rientrano i dati.
Il calcolo della varianza per i dati raggruppati viene effettuato utilizzando una formula leggermente diversa. Innanzitutto viene calcolato il punto medio di ciascun intervallo, ovvero la media dei limiti inferiore e superiore di ciascun intervallo. Successivamente viene calcolata la media ponderata dei punti medi, utilizzando come pesi le frequenze relative o assolute degli intervalli.
Da questa media ponderata si calcola la varianza secondo la stessa formula dei dati non raggruppati , ovvero come media dei quadrati delle differenze tra i singoli valori e la media ponderata.
La varianza dei dati raggruppati è utile quando si lavora con set di dati presentati come intervalli o classi, come dati demografici, dati economici o qualsiasi altro tipo di dati raggruppati in categorie o intervalli.
Proprietà della varianza
La varianza è una misura statistica che ha diverse proprietà importanti. Alcune delle principali proprietà della varianza sono:
- Si tratta sempre di un valore non negativo , poiché definito come la media dei quadrati delle differenze tra i singoli dati e la media.
- È sensibile ai valori estremi o anomali nei dati , poiché è il quadrato delle differenze.
- Ha unità al quadrato , il che implica che è nella stessa unità al quadrato dei dati originali.
- Può essere influenzato da valori anomali o dati estremi, che possono renderlo una misura non affidabile della variabilità dei dati.
- Se i dati sono indipendenti e non correlati tra loro, la varianza della somma di due insiemi di dati è uguale alla somma delle varianze dei due insiemi di dati .
Esempi di deviazione
Ora che abbiamo compreso il concetto di varianza e la sua importanza, vediamo un esempio pratico per capire meglio come funziona.
Supponiamo di avere i seguenti dati sul risultato economico di un’azienda in milioni di dollari negli ultimi cinque anni: 8, 12, 6, -4, 10. Vogliamo calcolare la varianza di questo set di dati utilizzando la formula menzionata in precedenza.
Passaggio 1: calcolare la media aritmetica
Innanzitutto, calcoliamo la media aritmetica dei dati sommandoli e dividendoli per il numero totale di dati (in questo caso 5):
Media aritmetica (X̄) = (8 + 12 + 6 – 4 + 10) ÷ 5 = $ 6,4 milioni
Passaggio 2: utilizzare la formula della varianza
Successivamente, utilizziamo la formula della varianza per calcolare il quadrato delle differenze tra ciascun punto dati e la media aritmetica, quindi li sommiamo:
Dove x i è ciascun elemento di dati, X̄ è la media aritmetica e n è il numero totale di elementi di dati.
Sostituiamo i dati e la media aritmetica nella formula della varianza:
Deviazione (Var(X)) = [(8 – 6,4) 2 + (12 – 6,4) 2 + (6 – 6,4) 2 + (-4 – 6,4) 2 + (10 – 6,4) 2 ] ÷ (5 – 1)
Passaggio 3: risolvere le operazioni
Ora risolviamo le operazioni per ottenere il valore della varianza:
Deviazione (Var(X)) = [1,6 2 + 5,6 2 + 0,16 2 + (-10,4) 2 + 3,6 2 ] ÷ 4
Deviazione (Var(X)) = [2,56 + 31,36 + 0,0256 + 108,16 + 12,96] ÷ 4
Deviazione (Var(X)) = 155,072 ÷ 4
Varianza (Var(X)) = 38,768 milioni al quadrato
La varianza di questo set di dati è 38,768 milioni quadrati, che ci dà una misura della dispersione o variabilità dei dati rispetto alla media aritmetica.