Grafologia teorica e pratica

La statistica - la base del pensiero critico \ razionale

Che cos’è la statistica? Molti vi potrebbero fornire una risposta scientifica a questo quesito, ma io vorrei fare qualcosa di un po’ più vicino al sentire comune e definirla come una lente, ossia qualcosa che permette di vedere la realtà sotto altri aspetti, ingrandendo, correggendo e permettendo di osservare altri aspetti della realtà.
 
La statistica si basa sulla probabilità, ossia quante volte si può ottenere un determinato tipo di risultato dato un determinato numero di ripetizioni un certo tipo di evento, quindi alla fine dei conti, la statistica è fatta da numeri, ma questi numeri vanno interpretati e ci sono vari modi per interpretarli, alcuni corretti, alcuni sbagliati, molti fuorvianti.
 
Dato questo tipo di definizione che non mi sembra difficile da intuire, possiamo fare un esempio abbastanza tipico che serve ad illustrare quanto sopra: il lancio di una moneta.
Se si suppone che la moneta sia perfettamente bilanciata e che non possa rimanere in equilibrio sulla circonferenza, avremo che la teoria dei giochi ci fornisce una probabilità del 50% che la moneta caschi sulla faccia o sulla croce. Per ottenere la statistica sulla moneta (e quindi determinare come veritiera la nostra assunzione sulla probabilità) faremo un certo numero di lanci, ad esempio 100, e vedremo come si comporta la moneta.
Nel caso ideale si avranno 50 teste e 50 croci, ma raramente la realtà è ideale, quindi è certo (statistica anche qui) che ci saranno dei casi in sui le teste saranno 47 e le croci 53, oppure 78 teste e 22 croci.
Date queste discrepanze importanti si deve introdurre un altro fondamentale fattore della statistica che è l’errore. L’errore è un valore che si calcola a partire dalla strumentazione e dal metodo utilizzato per fare l’analisi statistica, ma, al contrario di quanto possa far pensare il nome, l'errore non rappresenta quanto sbagliamo a causa dell’incapacità, ma bensì di quanto può variare un determinato valore in base alla circostanza che stiamo prendendo in esame.
 
So che il concetto di errore può essere complicato da intendere e per questo vi farò un esempio numerico. Vogliamo misurare un foglio di carta con un righello e il risultato finale è: 15,3 ±0,1 cm
Cosa rappresenta il numero scritto sopra? 15,3 rappresenta il numero che noi abbiamo misurato, quindi la nostra affermazione è che il foglio è lungo 15,3 cm.
0,1 rappresenta l’errore sulla misura, questo è dovuto al fatto che la distanza più piccola misurabile dal nostro righello è di 0,1 cm, ossia 1 mm; benché il nostro occhio possa vedere dimensioni più piccole, queste non sono segnate sul righello, quindi non possono essere considerate valide e attendibili perché lo strumento non è tanto sensibile. In questo caso il righello è l’elemento limitante della misura ed il fautore del nostro errore, di conseguenza, la vera lunghezza del foglio ricade in un valore compreso fra 15,2 e 15,4 cm.
Strumenti molto più sensibili possono dare risultati molto più precisi, ad esempio un misuratore laser potrebbe darci un valore di 15,300019438 ±0,000000006 cm (è un numero a caso, non sono andato a controllare quanto possa essere preciso).
 
Perfetto, detto tutto ciò e premettendo che in statistica tutto ha una probabilità diversa da zero da capitare, vediamo un po’ che l’interpretazione della statistica sia fondamentale, soprattutto per comprendere quanto sia o meno probabile un determinato fenomeno e quanto essa venga manipolata alle volte per incutere terrore o fiducia ingiustificata.
 
Negli esempi seguenti non riporterò valori realistici, anzi spesso e volentieri li esagererò per far rendere evidente il modo in cui viene usata la statistica, detto ciò, cominciamo.
 
Quando uscì Windows 11, Microsoft richiese come requisito di abilitare un piccolo modulo di sicurezza chiamato TPM, il quale, secondo la stessa Microsoft riduce il rischio di essere hackerati del 50%, alche uno potrebbe pensare che sia una cosa fantastica, da avere assolutamente, ma la realtà è ben diversa.
La percentuale fornita da Microsoft non è falsa, ma non è contestualizzata, perché se io di base ho una probabilità che il mio PC venga violato del 66%, questo modulo mi ridurrà il rischio al 33%, che è moltissimo e quindi farei molto bene ad usarlo! MA! Se la mia probabilità di base è dello 0,00000066%, con il modulo sarei a 0,00000033%; ho dimezzato una probabilità già prossima allo zero e quindi per me diventa una perdita di tempo inutile.
 
Più grave invece è quando non si presta proprio attenzione alla statistica e si preferisce far parlare il proprio istinto. In questi casi si parla di percezione ed una cosa estremamente pericolosa.
Il caso più tipico è quello delle centrali nucleari rispetto a quelle a carbone\petrolio\gas e anche rinnovabili o molto più semplicemente il rischio percepito fra rifiuti radioattivi e rifiuti chimici.
Il senso comune parte dal presupposto che l'energia nucleare ed i suoi rifiuti facciano migliaia di morti e siano super pericolosi (memorie erronee basate su bombe atomiche ed incidenti relativamente contenuti), anche se confrontati fra ciò che fanno le altre sorgenti.
Se si prendesse la briga di andare a controllare, si vedrebbe che quella nucleare è una delle sorgenti più sicure e pulite che attualmente possiamo sfruttare, ma non dovete credere a me:
https://ourworldindata.org/grapher/death-rates-from-energy-production-per-twh
Una cosa molto simile la si osserva nel pericolo percepito degli aerei rispetto alle macchine, si crede che muoiano migliaia di persone nei viaggi aerei, mentre la realtà è tutto l’opposto, sono gli incedenti stradali che causano migliaia di morti ogni giorno.
 
Quindi, dette tutte queste cose, come usiamo la statistica?
Non pretendo che impariate a fare statistica, è una cosa complicata e richiede un certo livello di studio per essere fatta correttamente, ma capirla è una cosa molto semplice.
Prendete il dato, capite quanto sia significativo l’errore e capite come essa venga usata.
 
Grazie a Tima Miroshnichenko per l’imamgine

Grazie da Luca e Iro.
...