Cosa sono i parametri statistici?

I parametri statistici sono valori numerici che riassumono caratteristiche importanti di un set di dati e ci aiutano a comprendere e descrivere le informazioni in esso contenute. In termini semplici, possiamo dire che sono “etichette” che ci permettono di comprendere meglio i dati e prendere decisioni sulla base di essi.

In altre parole, i parametri statistici sono misurazioni speciali utilizzate da matematici e scienziati per descrivere i dati in modo semplice . Fondamentalmente sono strumenti che ci aiutano a comprendere i numeri in modo più semplice e chiaro.

Ad esempio, supponiamo che tu abbia un sacchetto pieno di caramelle e desideri sapere quante caramelle ci sono in totale. È qui che entrano in gioco i parametri statistici. La media è il numero medio di caramelle , che si ottiene sommando tutte le caramelle e dividendo per l’importo totale. Questo ti dà un’idea del numero medio di caramelle che puoi aspettarti di trovare.

Ma c’è di più, un altro parametro importante è la deviazione standard , che aiuta a capire quanto sono lontane le caramelle dalla media . Ti mostra quanto sono diverse le caramelle rispetto al numero medio.

La cosa interessante è che i parametri statistici possono essere utilizzati anche per fare previsioni . Ad esempio, se vuoi sapere quante caramelle ci saranno nel sacchetto dopo una settimana, puoi utilizzare parametri statistici per stimarlo. Calcoli il numero medio di caramelle che hai adesso e usi la deviazione standard per avere un’idea di come cambia la media nel corso di una settimana.

Quali tipi di parametri statistici esistono?

In statistica esistono due tipi principali di parametri: parametri di tendenza centrale e parametri di dispersione.

Parametri di tendenza centrali

I parametri di tendenza centrale ci dicono quale valore è tipico o rappresentativo in un set di dati . Tra i parametri di tendenza centrale abbiamo tre misure importanti:

  • Media : la media è il valore del rapporto della popolazione (campione).
  • Mediana : abbiamo invece la mediana la cui funzione è quella di dividere il campione in due parti, una superiore ed una inferiore. In termini semplici, divide i dati in due.
  • Moda : Infine, la moda non è altro che il valore più frequente nel campione.

Utilizzeremo un esempio numerico per spiegare i parametri della tendenza centrale utilizzando la media, la mediana e la moda.

Supponiamo che tu abbia le seguenti età di un gruppo di persone: 25, 30, 32, 35, 40, 40, 42, 45, 50.

La media è l’età media . Per calcolarlo, aggiungiamo tutte le età e poi dividiamo per il numero totale di età. In questo caso, aggiungiamo 25 + 30 + 32 + 35 + 40 + 40 + 42 + 45 + 50 = 339, quindi dividiamo per 9 (qual è il numero di età in totale). La media è quindi 339 ÷ 9 = 37,67 anni.

La mediana è il valore medio quando le età sono ordinate dalla più piccola alla più grande. In questo caso, le età ordinate sarebbero: 25, 30, 32, 35, 40, 40, 42, 45, 50. Poiché esiste un numero dispari di età, la mediana sarebbe il valore nella posizione centrale, che è 40 anni.

La moda è il valore che appare più frequentemente nel set di dati . In questo caso la modalità è 40 anni, poiché compare due volte, mentre le altre età compaiono solo una volta.

Quindi, in sintesi, la media è 37,67 anni, la mediana è 40 anni e anche la moda è 40 anni.

Parametri di dispersione

D’altra parte, i parametri di dispersione ci dicono quanto sono dispersi o variati i dati in un insieme . Le più comuni sono la varianza e la deviazione standard.

Varianza

La varianza misura quanto i dati possono deviare dal quadrato . In questo caso, devi prima elevare al quadrato e poi calcolare la media in questione. Diamo un’occhiata al seguente esempio per comprendere meglio la spiegazione:

Supponiamo di avere i seguenti punteggi del test per cinque studenti: 80, 85, 90, 95, 100. Innanzitutto, troviamo la media sommando tutti i punteggi e dividendo per il numero totale di studenti: ( 80 + 85 + 90 + 95 + 100) ÷ 5 = 90.

Quindi, per calcolare la varianza, sottraiamo la media da ciascuna valutazione e eleviamo al quadrato i risultati. Quindi calcoliamo la media dei risultati al quadrato. In questo caso i calcoli sarebbero:

(80 – 90) 2 = 100

(85 – 90) 2 = 25

(90 – 90) 2 = 0

(95 – 90) 2 = 25

(100 – 90) 2 = 100

Sommiamo i risultati: 100 + 25 + 0 + 25 + 100 = 250. E poi dividiamo per il numero totale di punti dati (5) per ottenere la media: 250 ÷ 5 = 50.

La varianza in questo caso è quindi 50 . Questo ci dice che, in media, i punteggi si discostano di una media di 50 unità quadrate dalla media, che rappresenta la dispersione o variabilità dei dati dalla media.

Deviazione standard

Come abbiamo studiato in precedenza, la deviazione standard è semplicemente definita come il risultato della radice quadrata della varianza . Vale la pena ricordare che questo tipo di parametro di dispersione è molto più efficiente per effettuare stime rispetto alla deviazione media nel caso di una distribuzione normale.

Prendiamo l’esempio precedente dei punteggi dei test: 80, 85, 90, 95, 100. Abbiamo già calcolato la varianza ed è 50. Per ottenere la deviazione standard, prendiamo semplicemente la radice quadrata della varianza.

√50 ≈ 7,07

La deviazione standard in questo caso è quindi circa 7,07 . Questo ci dice che in media i punteggi sono distanti circa 7,07 unità dalla media, ma nella stessa unità di misura dei punteggi originali. Questa è una misura più semplice da interpretare e confrontare con i dati originali perché è sulla stessa scala.

quantili

Oltre alle misurazioni di cui sopra, consideriamo anche i parametri di dispersione. La funzione quantile è la divisione del campione n in sezioni equivalenti . Grazie a ciò è possibile stimare gli intervalli in cui vi è una maggiore concentrazione di valori. A seconda del valore di n, i quantili sono definiti in modi diversi.

  • Decili : sono responsabili della separazione del set di dati in dieci sezioni uguali.
  • Quartili : funziona come il modello precedente, tranne che il posto del dieci è diviso in quattro sezioni.
  • Percentili : infine, i percentili vengono utilizzati per separare i dati di un set in 100 sezioni identiche.

A cosa servono i parametri statistici?

Come accennato in precedenza, i parametri statistici sono molto importanti e il loro utilizzo è piuttosto ampio. Successivamente, presentiamo alcune delle sue applicazioni più importanti.

Economia

I parametri statistici vengono utilizzati per analizzare indicatori economici, come il PIL, il tasso di disoccupazione, l’inflazione , tra gli altri. Questi parametri consentono di misurare la salute economica di un paese o di una regione, identificare le tendenze e fare previsioni per il processo decisionale di politica economica.

Scienze della salute

In questo caso, vengono utilizzati negli studi clinici ed epidemiologici per analizzare dati sanitari , come la prevalenza di una malattia, l’efficacia di un trattamento, l’impatto dei fattori di rischio, tra gli altri. Questi parametri sono essenziali per il processo decisionale nella prevenzione, diagnosi e trattamento delle malattie.

Scienze sociali

D’altra parte, i parametri statistici sono utili in discipline come la psicologia, la sociologia, l’educazione, tra gli altri, per analizzare i dati sul comportamento umano, gli atteggiamenti, le opinioni , tra gli altri. Questi parametri consentono di ottenere informazioni e fare inferenze sulla popolazione studiata.

Marketing e pubblicità

Oltre a quanto sopra, anche nel mondo della pubblicità sono molto importanti. In questo caso vengono utilizzati per analizzare dati di mercato , come ad esempio la segmentazione della clientela, l’analisi delle preferenze e del comportamento dei consumatori, la valutazione delle campagne pubblicitarie. Queste metriche aiutano a comprendere e prendere decisioni informate nelle strategie di marketing e pubblicitarie.

Ricerca scientifica

Inoltre, vengono utilizzati in vari campi della ricerca scientifica, come la biologia, la fisica, la chimica, tra gli altri, per analizzare dati sperimentali, fare inferenze e convalidare i risultati . Questi parametri sono essenziali per il rigore e la validità della ricerca scientifica.

Finanza

Vengono utilizzati anche per analizzare dati finanziari, come la redditività di un investimento, la volatilità di un asset, la valutazione del rischio , tra gli altri. Questi parametri vengono utilizzati per il processo decisionale nella gestione degli investimenti, nella pianificazione finanziaria e nella valutazione del rischio.

Ingegneria

Infine, sono ideali in vari campi dell’ingegneria, come ingegneria della qualità, ingegneria di processo, ingegneria dei sistemi, tra gli altri, per analizzare la produzione, la qualità, le prestazioni e l’ottimizzazione dei processi . Questi parametri vengono utilizzati per il miglioramento continuo e il processo decisionale nella gestione dei progetti e nell’ottimizzazione del sistema.

Esempio di parametri statistici

Date le informazioni di cui sopra, è tempo di utilizzare un esempio per rafforzare meglio ciò che è stato appreso. Vediamo, allora.

1. Esempio Media (media)

Supponiamo che tu abbia un elenco dei punteggi di 5 studenti in un test di matematica: 7, 8, 9, 6 e 10. Per trovare la media, sommiamo tutti i punteggi e poi dividiamo per il numero di studenti:

7 + 8 + 9 + 6 + 10 = 40

Media = 40 ÷ 5 = 8

Pertanto, il voto medio di questi 5 studenti è 8.

2. Esempio mediano

Supponiamo che tu abbia un elenco di età per un gruppo di 7 persone: 12, 14, 15, 13, 12, 16 e 18. Per trovare la mediana, ordiniamo prima le età in ordine crescente: 12, 12, 13, 14, 15, 16, 18

Successivamente troviamo il valore mediano della lista, che in questo caso è di 14 anni. Pertanto, l’età media di questo gruppo di persone è di 14 anni.

3. Esempio di moda

Supponiamo che tu abbia un elenco dei colori delle magliette indossate da un gruppo di 10 persone: rosso, blu, verde, rosso, giallo, blu, verde, verde, rosso, blu. La modalità è il valore che appare più frequentemente nell’elenco. In questo caso, il colore verde appare 3 volte, mentre gli altri colori appaiono solo 2 volte o meno. Pertanto, la moda per i colori delle magliette è il verde.

4. Esempio di percentili

Supponiamo di avere un set di dati che rappresenta l’altezza in centimetri di un gruppo di 20 studenti delle scuole superiori. Vuoi trovare il 75° percentile, ovvero il valore al di sotto del quale cade il 75% delle altezze. Dopo aver ordinato i dati, vedi che il valore corrispondente al 75° percentile è 168 cm. Ciò significa che il 75% degli studenti è alto 168 cm o meno.

5. Esempio di deviazione

Supponiamo di avere un set di dati che rappresenta il numero di ore che un gruppo di 10 studenti studia ogni giorno per un test. I dati sono: 2, 3, 4, 2, 5, 3, 4, 1, 2, 3. Per trovare la varianza, devi prima trovare la media, che è 2,7 ore. Quindi sottrai la media da ciascun valore, la elevi al quadrato e sommi il tutto. Infine, dividi la somma per il numero di punti dati:

((2-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (2-2,7) 2 + (5-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (1-2,7) 2 + (2-2,7) 2 + ( 3-2,7 ) 2 ) ÷ 10 = 1,61

Pertanto, la varianza delle ore di studio per questo gruppo di studenti è 1,61.

6. Esempio Deviazione standard

Continuando con l’esempio precedente, per trovare la deviazione standard, prendi semplicemente la radice quadrata della varianza:

√1,61 ≈ 1,27

Pertanto, la deviazione standard delle ore di studio per questo gruppo di studenti è di circa 1,27 ore.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto