Salta al contenuto

Gli indici di variabilità: varianza e deviazione standard

Agostino Sapienza

Agostino Sapienza

INSEGNANTE DI MATEMATICA

Sono nato a Reggio Calabria il 07/10/85. Mi sono diplomato nel 2005 all'Istituto Magistrale Statale Tommaso Gulli. Ho conseguito la laurea triennale in Relazioni Internazionali a Messina e in Economia Internazionale a Padova. Dopo un pò di anni negli studi commercialisti sono stato chiamato per una supplenza covid nella classe di insegnamento A47. Ho poi conseguito l'abilitazione a Trieste nel sostegno e sono entrato di ruolo nel 2023

Gli indici di variabilità, come la deviazione standard, lo scarto semplice medio e il campo di variazione, sono strumenti cruciali nell’analisi statistica per comprendere quanto i dati si discostino dalla media.

Questi concetti forniscono informazioni preziose sulla dispersione dei dati attorno alla media e sulla consistenza della distribuzione. La varianza misura la dispersione dei dati calcolando la media dei quadrati delle differenze tra ciascun valore e la media, mentre la deviazione standard è la radice quadrata della varianza, rappresentando quindi la misura della dispersione dei dati in termini della stessa unità di misura dei dati stessi. Queste metriche sono fondamentali per comprendere la distribuzione e l’affidabilità dei dati in un set.

La varianza e la deviazione standard sono molto legate: la varianza è la media aritmetica dei quadrati della differenza tra ogni singolo valore della sequenza e la media aritmetica della sequenza:

£$ \sigma^{2}=\frac{(X_1- M)^2+…+(X_n-M)^2}{n} $£

Gli indici di variabilità: il campo di variazione

Stai analizzando i dati a disposizione. Sai calcolare la media, la moda e la mediana. Ma sai quanto sono "lontani" i tuoi dati? Per capirlo, devi calcolare il campo di variazione: è semplicemente la differenza, in valore assoluto tra il valore maggiore e quello minore.

Un campo di variazione piccolo mi dice che i dati sono abbastanza "vicini" mentre se è grande abbiamo dati molto lontani tra loro.

Gli indici di variabilità: lo scarto semplice medio

Lo scarto semplice medio S di una sequenza di n numeri X_1, X_2, …, X_n è la media aritmetica dei valori assoluti delle differenze tra ogni singolo valore della sequenza e la media aritmetica M della sequenza.

Quanto sono distanti i valori che hai dalla media? Per calcolare questa distanza, basta fare la differenza tra ciascun valore a disposizione e la media di tutti i valori, e poi mettere il valore assoluto (perché vogliamo una distanza).

Ma possiamo fare la media di queste distanze? Certo! Basta sommare le distanze trovate e dividere per in numero di valori.

La formula per calcolare lo scarto semplice medio è £$ \frac{|x_{1}-M|+\ldots + |x_{n}-M|}{n}$£

dove £$x_{i}$£ sono i nostri valori, £$M$£ la loro media aritmetica e £$n$£ il numero di valori che abbiamo.

Varianza e deviazione standard

Cos’è la varianza?

Cos’è la deviazione standard?

Per analizzare i dati statistici, gli indici di variabilità più usati sono la varianza e la deviazione standard (o scarto quadratico medio). La varianza è la somma delle differenze al quadrato tra i valori e la media, il tutto diviso £$n$£ cioè il numero di dati che abbiamo. La varianza si indica con £$\sigma^2$£ (sigma al quadrato). Però, l’informazione che ci dà la varianza non è allo stesso piano della media (perché abbiamo la somma delle distanze al quadrato) e non possiamo confrontarli facilmente.

Per un confronto migliore, usiamo la radice quadrata della varianza £$\sigma = \sqrt{\sigma^2}$£ e chiamiamo questo valore deviazione standard. Quale informazione ci dà? Ci dice in maniera più precisa degli altri indici, quanto e come i dati sono sparpagliati (o distribuiti) intorno alla media aritmetica.

Trovi gli esercizi su questi argomenti nella lezione successiva.