Salta al contenuto

Analisi dei dati: errore standard e intervalli di confidenza

Agostino Sapienza

Agostino Sapienza

INSEGNANTE DI MATEMATICA

Sono nato a Reggio Calabria il 07/10/85. Mi sono diplomato nel 2005 all'Istituto Magistrale Statale Tommaso Gulli. Ho conseguito la laurea triennale in Relazioni Internazionali a Messina e in Economia Internazionale a Padova. Dopo un pò di anni negli studi commercialisti sono stato chiamato per una supplenza covid nella classe di insegnamento A47. Ho poi conseguito l'abilitazione a Trieste nel sostegno e sono entrato di ruolo nel 2023

Pensavi che, dopo aver imparato come calcolare la media,fosse tutto finito? E invece no. O almeno, non basta solo la media aritmetica (o ponderata che sia) ad analizzare i dati statistici. Ti serve sapere anche come i dati sono distribuiti, cioè come variano. Ed è qui che entrano in gioco gli indici di variabilità che, come la deviazione standard, lo scarto semplice medio e il campo di variazione, sono molto importanti per riassumere alcune caratteristiche dei dati raccolti.

Ma se abbiamo solo un campione di dati e non l’intera popolazione? Tranquilli, possiamo stimare la media della popolazione calcolando la media di un suo campione! La media aritmetica di un campione (o media campionaria £$M_{c}$£) è però una stima: il passaggio dalla popolazione al campione comporta un’incertezza, quindi un errore.

Scopri cos’è l’errore standard e come utilizzarlo per trovare un intervallo di confidenza. Trovi tutto questo nella lezione, ricca di esempi e di esercizi svolti!

Che cos’è l’errore standard

Molto spesso, è difficile fare analisi sulla popolazione per via della grossa mole di dati. Quindi si fanno analisi sul campione, cioè su un numero ridotto di dati.
Ma questo porta a un errore: infatti la media del campione dipende dall’insieme di valori che prendiamo e da quanti ne prendiamo. Per questo, dobbiamo calcolare l’errore che compiamo in questo calcolo. Come si fa? Ecco la spiegazione:

  1. calcolo della deviazione standard del campione, che indichiamo con £$s$£;
  2. l’errore nella stima della media della popolazione è £$s_{M}=\frac{s}{\sqrt{n-1}}$£.

£$s_{M}$£ è l’errore sulla stima della media della popolazione, fatta sulla media aritmetica del campione.
Questo valore influisce sulla probabilità di trovare la media della popolazione "vicino" alla media del campione considerato.

Intervallo di confidenza

Quanto possiamo essere sicuri che la media della popolazione abbia un certo valore? Per rispondere a questa domanda, dobbiamo usare la probabilità! Possiamo, a partire dalla media del campione e dall’errore standard, calcolare un intervallo che comprenderà il valore della media della popolazione con una certa probabilità.

Questo intervallo, centrato nella media campionaria, si chiama intervallo di confidenza (IC), ed è un vero e proprio intervallo all’interno del quale ci si aspetta di trovare il valore della media della popolazione con una certa probabilità, che è proporzionale all’ampiezza dell’intervallo.

Come si fa un’indagine statistica dei dati

Ora che hai visto molte cose (non tutto) di come si fa un’indagine statistica, prova a rispondere a queste domande. Potrebbero essere quelle che ti farà il prof in classe!
Se hai dei dubbi, riguarda la spiegazione che trovi nei video oppure quella negli esercizi.

Sfida sull’analisi dei dati

Ecco la sfida:

Soluzione:

Studia studia e i voti migliorano! Ma come sono questi voti? Costanti o altalenanti? Riuscirai a prendere il tanto agognato £$6$£ in pagella? Prova a risolvere la sfida sugli indici di variabilità: guarda le lezioni se hai dei dubbi e allenati con gli esercizi!