INTRODUZIONE
Mai come in questi giorni di Pandemia da Covid-19,
l’opinione pubblica si è interessata d’informazione medica, di numeri e di
statistiche.
Ci
vengono quotidianamente riservate enormi quantità di dati, di stime, di
valutazioni, di percentuali, insieme a pareri e opinioni di esperti non di rado
in contrario tra di loro.
Questa
attenzione è senza dubbio un bene, un segno di quanto seriamente venga vissuta
questa condizione nazionale causata dal Coronavirus, ma quanta parte di questa
enorme mole di dati e notizie si trasforma in informazione? Il numero dei nuovi
contagiati, per esempio, rappresenta un dato ma diventa informazione solo se
messo in relazione con il dato dei giorni precedenti, perché solo in questo
modo si può capire se la Pandemia è in fase espansiva o calante.
Ad una visione chiara ed
efficace del problema, ci viene in aiuto la statistica che spesso e
volentieri si avvale di grafici. Vengono rappresentati per mezzo di immagini
simboliche e sono assai utili perché permettono di visualizzare molto
facilmente le “intensità dei fenomeni rappresentati”, per una lettura più
veloce e diretta a tutti.
LA STATISTICA
La statistica studia un fenomeno con lo scopo di metterne in
evidenza gli aspetti essenziali, risalendo eventualmente alle leggi che lo
regolano. Nella maggior parte dei casi rappresenta il mezzo più efficace per
ridurre il margine di incertezza delle nostre scelte. Il metodo statistico era
usato anche nell’antichità ed ha avuto il suo maggior sviluppo nella seconda
metà del 1800. Indaga su fenomeni collettivi, cioè su fenomeni che riguardano
un insieme di individui, raccogliendo informazioni relative ad essi e
traducendole poi in un modello numerico che possa essere analizzato
semplicemente.
L’INDAGINE STATISTICA
Il primo problema che ci si pone in una indagine statistica
è in relazione a quale aspetto, chiamato carattere, del fenomeno bisogna
indagare. Il secondo problema da affrontare è quello di identificare con
precisione la popolazione, cioè le persone alle quali fare domande su questo
carattere. Ogni elemento della popolazione è definito unità statistica.
I possibili modi con cui si può presentare un carattere sono
detti modalità. Quindi un’indagine statistica si può riassumere nelle
seguenti 3 fasi:
- individuare uno o più caratteri sui quali acquisire
informazioni;
- individuare le unità statistiche portatrici del carattere;
- individuare le modalità in cui il carattere si può
presentare.
CARATTERI DELLA STATISTICA
Si può fare una prima distinzione fra due tipi di caratteri:
quelli qualitativi, le cui modalità sono generalmente espresse da aggettivi o
nomi, e quelli quantitativi, le cui modalità sono espresse tramite numeri. I
caratteri qualitativi si possono classificare in sconnessi (relazioni di
diversità) e ordinati (relazioni d’ordine). I caratteri quantitativi, invece,
si possono classificare in discreti (insieme finito o infinito numerabile) e
contigui (carattere espresso con un numero reale).
DATI STATISTICI
Fatte queste prime distinzioni, rimane il problema di
raccogliere i dati necessari all’indagine. Alcuni tipi di indagine statistica
richiedono il contributo di tutta la popolazione. Per altri tipi di indagine,
l’analisi di tutta la popolazione risulta troppo dispendiosa in tempo, denaro e
numero di persone addette. Risulta però necessario ricorrere ad un suo
sottoinsieme, denominato campione, i cui elementi siano in qualche modo
rappresentativi dell’intera popolazione. Una volta scelto il campione, resta da
stabilire come raccogliere le informazioni. Eseguita la raccolta dei dati,
occorre procedere al loro spoglio per poterli organizzare in modo che essi
diano informazioni sintetiche sul fenomeno che si sta analizzando. Il numero
che ne risulta prende il nome di frequenza assoluta di quella modalità.
LA FREQUENZA
L’insieme delle coppie ordinate (frequenza assoluta) si dice
distribuzione di frequenze, cioè una funzione che può essere rappresentata
elencandone tutte le coppie organizzate in una tabella. Accanto alla colonna
delle frequenze assolute si è soliti riportare anche le frequenze relative,
intese come rapporto fra la frequenza assoluta ed il numero totale delle
osservazioni.
In base al tipo di carattere rappresentato, le distribuzioni
di frequenza prendono il nome di:
- mutabile statistica, se il carattere è di tipo
qualitativo;
- variabile statistica, se il carattere è di tipo
quantitativo.
Il modo più semplice per elaborare un insieme da dati
statistici è quello di rappresentarli graficamente, ad esempio con diagrammi a
rettangoli distanziati, diagrammi circolari, ideogrammi, cartogrammi, diagrammi
cartesiani o istogrammi.
LA MEDIA
Avere raccolto dei dati, averli organizzati e averne dato
una rappresentazione grafica non è spesso sufficiente quando si devono fare dei
confronti fra diverse situazioni. Ci sono diversi modi per calcolare e definire
un valore medio, o semplicemente media. Secondo la definizione di Lagrange, si
dice media di un insieme di n grandezze, fra loro omogenee, disposte in ordine
crescente, un qualunque valore che sia compreso fra il valore più piccolo e
quello più grande delle grandezze considerate.
MODA O VALORE MODALE
Si dice moda, o valore modale, di una distribuzione di
frequenza il termine, se esiste, cui corrisponde la massima frequenza nella
distribuzione. Si definisce mediana di una distribuzione di frequenza il
termine che, disposti i dati in ordine crescente (oppure decrescente), occupa
il posto centrale. La mediana ha un’importante proprietà, cioè la somma dei valori
assoluti degli scarti dalla mediana è minima.
MEDIANA
Si definisce la mediana (o valore mediano) come il valore
assunto dalle unità statistiche che si trovano nel mezzo della distribuzione.
La mediana è un indice di posizione e rientra nell'insieme delle statistiche
d'ordine.
Le medie, la moda e la mediana sono utili come valori di
sintesi di una distribuzione o per confrontare distribuzioni diverse. Non danno
informazioni sulla variabilità dei dati, dove con questo termine si intende la
tendenza che hanno i dati ad essere diversi uno dall’altro. Tale variabilità è
data dalla differenza tra il valore più piccolo e quello più grande: ciò viene
definito campo di variabilità ed è un numero positivo espresso nella stessa
unità di misura dei dati.
GLI ISTOGRAMMI
Gli istogrammi Un istogramma è un grafico che si sviluppa
verso l'alto. In un istogramma la distribuzione delle frequenze è rappresentata
mediante dei rettangoli all'interno degli assi cartesiani. Nell'asse delle
ascisse sono elencate le modalità mentre nell'asse delle ordinate sono misurate
le frequenze per ciascuna modalità
Nessun commento:
Posta un commento