venerdì 5 giugno 2020

Ludovica Benini - LA STATISTICA


INTRODUZIONE
Mai come in questi giorni di Pandemia da Covid-19, l’opinione pubblica si è interessata d’informazione medica, di numeri e di statistiche.                                                                                   Ci vengono quotidianamente riservate enormi quantità di dati, di stime, di valutazioni, di percentuali, insieme a pareri e opinioni di esperti non di rado in contrario tra di loro.                                                                                                     Questa attenzione è senza dubbio un bene, un segno di quanto seriamente venga vissuta questa condizione nazionale causata dal Coronavirus, ma quanta parte di questa enorme mole di dati e notizie si trasforma in informazione? Il numero dei nuovi contagiati, per esempio, rappresenta un dato ma diventa informazione solo se messo in relazione con il dato dei giorni precedenti, perché solo in questo modo si può capire se la Pandemia è in fase espansiva o calante.                                        Ad una visione chiara ed efficace del problema, ci viene in aiuto la statistica che spesso e volentieri si avvale di grafici. Vengono rappresentati per mezzo di immagini simboliche e sono assai utili perché permettono di visualizzare molto facilmente le “intensità dei fenomeni rappresentati”, per una lettura più veloce e diretta a tutti.

LA STATISTICA
La statistica studia un fenomeno con lo scopo di metterne in evidenza gli aspetti essenziali, risalendo eventualmente alle leggi che lo regolano. Nella maggior parte dei casi rappresenta il mezzo più efficace per ridurre il margine di incertezza delle nostre scelte. Il metodo statistico era usato anche nell’antichità ed ha avuto il suo maggior sviluppo nella seconda metà del 1800. Indaga su fenomeni collettivi, cioè su fenomeni che riguardano un insieme di individui, raccogliendo informazioni relative ad essi e traducendole poi in un modello numerico che possa essere analizzato semplicemente.

L’INDAGINE STATISTICA
Il primo problema che ci si pone in una indagine statistica è in relazione a quale aspetto, chiamato carattere, del fenomeno bisogna indagare. Il secondo problema da affrontare è quello di identificare con precisione la popolazione, cioè le persone alle quali fare domande su questo carattere. Ogni elemento della popolazione è definito unità statistica.

I possibili modi con cui si può presentare un carattere sono detti modalità.   Quindi un’indagine statistica si può riassumere nelle seguenti 3 fasi:
- individuare uno o più caratteri sui quali acquisire informazioni;
- individuare le unità statistiche portatrici del carattere;
- individuare le modalità in cui il carattere si può presentare.

CARATTERI DELLA STATISTICA 
Si può fare una prima distinzione fra due tipi di caratteri: quelli qualitativi, le cui modalità sono generalmente espresse da aggettivi o nomi, e quelli quantitativi, le cui modalità sono espresse tramite numeri. I caratteri qualitativi si possono classificare in sconnessi (relazioni di diversità) e ordinati (relazioni d’ordine). I caratteri quantitativi, invece, si possono classificare in discreti (insieme finito o infinito numerabile) e contigui (carattere espresso con un numero reale).

DATI STATISTICI  
Fatte queste prime distinzioni, rimane il problema di raccogliere i dati necessari all’indagine. Alcuni tipi di indagine statistica richiedono il contributo di tutta la popolazione. Per altri tipi di indagine, l’analisi di tutta la popolazione risulta troppo dispendiosa in tempo, denaro e numero di persone addette. Risulta però necessario ricorrere ad un suo sottoinsieme, denominato campione, i cui elementi siano in qualche modo rappresentativi dell’intera popolazione. Una volta scelto il campione, resta da stabilire come raccogliere le informazioni. Eseguita la raccolta dei dati, occorre procedere al loro spoglio per poterli organizzare in modo che essi diano informazioni sintetiche sul fenomeno che si sta analizzando. Il numero che ne risulta prende il nome di frequenza assoluta di quella modalità.

LA FREQUENZA 
L’insieme delle coppie ordinate (frequenza assoluta) si dice distribuzione di frequenze, cioè una funzione che può essere rappresentata elencandone tutte le coppie organizzate in una tabella. Accanto alla colonna delle frequenze assolute si è soliti riportare anche le frequenze relative, intese come rapporto fra la frequenza assoluta ed il numero totale delle osservazioni.
In base al tipo di carattere rappresentato, le distribuzioni di frequenza prendono il nome di:
- mutabile statistica, se il carattere è di tipo qualitativo;
- variabile statistica, se il carattere è di tipo quantitativo.
Il modo più semplice per elaborare un insieme da dati statistici è quello di rappresentarli graficamente, ad esempio con diagrammi a rettangoli distanziati, diagrammi circolari, ideogrammi, cartogrammi, diagrammi cartesiani o istogrammi.

LA MEDIA
Avere raccolto dei dati, averli organizzati e averne dato una rappresentazione grafica non è spesso sufficiente quando si devono fare dei confronti fra diverse situazioni. Ci sono diversi modi per calcolare e definire un valore medio, o semplicemente media. Secondo la definizione di Lagrange, si dice media di un insieme di n grandezze, fra loro omogenee, disposte in ordine crescente, un qualunque valore che sia compreso fra il valore più piccolo e quello più grande delle grandezze considerate. 

MODA O VALORE MODALE  
Si dice moda, o valore modale, di una distribuzione di frequenza il termine, se esiste, cui corrisponde la massima frequenza nella distribuzione. Si definisce mediana di una distribuzione di frequenza il termine che, disposti i dati in ordine crescente (oppure decrescente), occupa il posto centrale. La mediana ha un’importante proprietà, cioè la somma dei valori assoluti degli scarti dalla mediana è minima.

MEDIANA
Si definisce la mediana (o valore mediano) come il valore assunto dalle unità statistiche che si trovano nel mezzo della distribuzione. La mediana è un indice di posizione e rientra nell'insieme delle statistiche d'ordine.

Le medie, la moda e la mediana sono utili come valori di sintesi di una distribuzione o per confrontare distribuzioni diverse. Non danno informazioni sulla variabilità dei dati, dove con questo termine si intende la tendenza che hanno i dati ad essere diversi uno dall’altro. Tale variabilità è data dalla differenza tra il valore più piccolo e quello più grande: ciò viene definito campo di variabilità ed è un numero positivo espresso nella stessa unità di misura dei dati.


GLI ISTOGRAMMI
Gli istogrammi Un istogramma è un grafico che si sviluppa verso l'alto. In un istogramma la distribuzione delle frequenze è rappresentata mediante dei rettangoli all'interno degli assi cartesiani. Nell'asse delle ascisse sono elencate le modalità mentre nell'asse delle ordinate sono misurate le frequenze per ciascuna modalità





Nessun commento:

Posta un commento