Dati – dati – dati. Se alla scienza togli i dati, affidabili e certi, cosa resta del metodo scientifico?

Uno studio dell’Università di Bergamo sta cercando di ricostruire il numero di morti per Coronavirus nella provincia, uno dei focolai più colpiti d’Italia, usando non i dati ufficiali, ma il numero di necrologi pubblicati sull’Eco di Bergamo. Oggi un altro giornale locale riporta un articolo secondo cui l’Avis di Castiglione D’Adda (Lodi, altro focolaio del cosiddetto Paziente 1, il signora Mattia) ha rilevato che il 70% dei donatori di sangue sarebbe risultato positivo al Covid-19. Non parliamo poi del controverso rapporto dell’Imperial College che ha svolto un apparentemente “brillante”, quanto “indecifrabile” Reverse Engineering sui dati in possesso, attraverso un cammino a ritroso, dall’indice di letalità alla platea dei contagiati: “uno studio scolastico che non tiene conto delle specificità nazionali, della demografia (età), degli eventi particolari (gli ospedali che hanno fatto da incubatori)”, mi ha fatto notare un giornalista esperto di dati. Aver dato per buono l’indice di letalità (anche se i dati ufficiali sembrano convergere: ma quali dati ufficiali, quelli cinesi, che la CIA ha definito del tutto inaffidabili? Quelli italiani, dove i test sono stati fatti solo ai pazienti con sintomi relativamente gravi e non sono stati fatti i tamponi nemmeno ai defunti?) è già un salto nel buio: un professore di Statistica del Politecnico di Milano mi ha scritto: “Per essere affidabile occorrerebbe un criterio uniforme per imputare le morti al Covid-19, e già questo manca” (basta guardare alla discrepanza fra Italia e Germania, “troppo accentuata a prima vista”, nonostante alcune spiegazioni finora illustrate: l’ampia disponibilità di ICU in Germania – mentre in Lombardia l’alto numero di perdite è da attribuire anche alla carenza di posti in terapia intensiva rispetto alla domanda -, lo stile di vita degli anziani tedeschi, che vivono vite più separate rispetto ai giovani e ai nipoti, mentre in Italia pesa la co-residenza di anziani e giovani nella famiglia allargata italiana oltre alla frequenza di contatto fisico nelle interazioni sociali).

Lavoce.info ha osservato che il numero di pazienti ospedalizzati è più che quadruplicato, mentre il numero di pazienti in terapia intensiva è solo più che triplicato. Vuol dire che il rapporto fra ospedalizzati e pazienti in Terapia Intensiva dovrebbe essere rimasto costante, mentre nella realtà ha subito un andamento decrescente.

Inoltre, le morti da Coronavirus dichiarate in Italia sono state sottostimate? In un primo tempo, sembravano sovrastimate, ma poi (e l’ultima analisi, per quanto “ingegnosa” dell’Università di Bergamo, lo confermerebbe) è stato appurato che non è stato effettuato il tampone ai tantissimi morti in casa o nelle case di riposo: le dichiarazioni di morte per Covid-19 sono irrealistiche e sottostimate.

Il punto dolente è che mancano i dati. Gli unici dati certi sono il numero di ospedalizzati e di persone in Terapia Intensiva (TI o ICU), mentre i dati di contagiati e morti sono sottostimati, non affidabili e non accertati, se non in parte.

Gli scienziati, senza dati certi ed affidabili, raccolti seguendo il metodo scientifico, brancolano nel buio. I dati da “prendere con le molle” rappresentano un vulnus al metodo scientifico: un singolo numero, in un processo a ritroso, può far saltare tutte le stime.

https://platform.twitter.com/widgets.js

Torniamo al tema di partenza: il metodo scientifico, che coniuga l’osservazione sperimentale con la costruzione di un linguaggio coerente e rigoroso, ha bisogno di dati, affidabili e certificati, al fine di garantire sempre la riproducibilità e la verificabilità delle osservazioni su cui i processi di acquisizione teorica si basano. Nel Discorso sul Metodo, Cartesio parla dell’evidenza e della necessità di accogliere solo le conoscenze chiare e distinte. Ma qui sembra che ci costringano a tornare indietro di secoli: pare che si debba tornare al naturalismo antico e medievale, dove l’indagine si fonda dell’osservazione, diretta o indiretta, delle proprietà empiriche in condizioni naturali: dov’è la razionalità, dove sono i criteri generali di razionalità ed obiettività, dove la significatività e la comunicabilità? In che misura sono garantite le condizioni del metodo sperimentale per verificare determinati fenomeni al fine di sottoporre a controllo (confermandole o al contrario smentendole con una confutazione) le previsioni teoriche? Ma soprattutto come possiamo procedere all’elaborazione statistica dei dati raccolti nella misurazione di determinate grandezze, al fine di stabilirne il valore più probabile con il relativo intervallo di indeterminazione (o errore di misura), se i dati raccolti sono incompleti?

Rimane un vulnus nello studio di questa pandemia: non aver raccolto tutti i dati, non aver saputo mettere a punto un campione significativo, non aver identificato un bias che servirebbe a stimare, per esempio, la percentuale di positivi asintomatici nella popolazione.

Un ingegnere mi ha spiegato che non si è fatto alcuno sforzo di “normare” un metodo di selezione dei campioni statistici da misurare e ciò comporta un’inevitabile conseguenza: senza un metodo, chiunque otterrà i dati che fanno comodo per sempre. “Sembriamo quelli che commercializzano tessuti vendendoli a lunghezza, ma ogni sartyo utilizza, come “metro”, un pezzo di legno trovato in giardino”: non ha senso. E conclude: “Tanta enfasi sugli asintomatici, ma non si capisce perché non si decida di scegliere un campione di un migliaio o due mila persone apparentemente sane, per capire quanti siano i ‘malati silenti’… Senza un dato sui tamponi, valutato in modo statistico, chiunque può scrivere ciò che vuole al denominatore, ma a quel punto l’indice di letalità diventa un’incognita”.

Ecco, oltre ai troppi morti e alle famiglie dei defunti (che neanche hanno potuto dare l’estremo saluto ai propri cari), oltre a 3,5 miliardi di persone (metà della popolazione mondiale!) in quarantena, c’è un’altra illustre vittima in questa pancemia del XXI Secolo: il metodo scientifico. Che non è il tabellone di un flipper, ma la modalità con cui la scienza procede, attraverso la fese induttiva e deduttiva (il principio di falsificabilità di Popper), per raggiungere una conoscenza oggettiva, affidabile, verificabile e condivisibile. Ma tutto ciò è possibile se si raccolgono i dati in maniera rigorosa. Dati, dati, dati.

L’appello dei 150 accademici e scienziati per raccogliere dati trasparenti, indagini demoscopiche su camipioni, tracciamento dei contagi è già un importante passo avanti.

@CastigliMirella