L’APPROFONDIMENTO – Il valore p
Andando in ordine alfabetico, dopo il fattore K (che negli anni ’70 postulava l’impossibilità dell’alternanza di governo nei paesi dove il partito comunista fosse la seconda forza politica) e la parola N (un modo gentile per far riferimento a un termine razzista estremamente offensivo), troviamo il valore p.
Già il fatto che questo valore venga riportato in minuscolo, fa intuire che è meno legato a forti connotati ideologici o simbolici. Infatti, il valore p è un termine scientifico che viene utilizzato comunemente in statistica e consiste in un numero decimale che indica la probabilità che l’ipotesi che si vuole verificare attraverso uno studio sia effettivamente vera: tanto più basso è il valore p, tanto più alta è questa probabilità.
Nonostante la sua natura apparentemente non controversa, il valore p è stato di recente oggetto di polemiche, anche in considerazione della sua enorme importanza in aree scientifiche che vanno dall’economia e dalla fisica fino alla medicina: se una ricerca stabilisce che il valore p è inferiore a 0,05 il risultato osservato viene definito “statisticamente significativo” e sulla base di questo si prendono decisioni di grande rilevanza. Per esempio, l’utilizzo di un farmaco nuovo in alternativa a uno meno recente non è pensabile fino a che una serie di studi clinici condotti rigorosamente abbia accertato che l’aumento delle guarigioni abbia un valore p inferiore a 0,05 e quindi sia effettivamente dovuto al farmaco nuovo e non all’inevitabile casualità introdotta dal campionamento effettuato negli studi.
Il valore p è diventato negli anni un riferimento ineludibile negli articoli scientifici, ma si è anche rivelato una possibile trappola per ricercatori poco accorti: infatti la significatività statistica di un dato non basta a garantirne l’importanza dal punto di vista scientifico. Per contro la non significatività statistica (ovvero un valore p superiore a 0,05) non significa che un dato sia necessariamente improbabile, falso o privo di importanza scientifica.
Si conferma anche in questo caso quanto possano essere pericolosi l’uso di scorciatoie cognitive e la preferenza per risultati ottenuti in modo quasi automatico piuttosto che con l’impiego di un rigoroso vaglio critico. Per descrivere questa preferenza nella lingua inglese c’è una formula molto efficace: “picking the low-hanging fruit”, ovvero cogliere comodamente solo la frutta che pende dai rami più bassi.
In un recente articolo che riassume il dibattito in corso sul ruolo del valore p nella ricerca medica, vengono indicati alcuni correttivi utili per evitarne un uso troppo semplicistico. Un primo correttivo è quello di dare importanza alla valutazione precisa del valore p e non limitarsi alla sua collocazione binaria rispetto alla soglia (ovvero superiore o inferiore a 0,05), lasciando in tal modo più spazio alle necessarie sfumature. Un altro correttivo proposto è quello di intervenire sulla formazione dei ricercatori e di promuovere la preregistrazione degli studi clinici, in modo da spostare l’attenzione dalla significatività statistica dei risultati raggiunti alla condivisione “a priori” della metodologia scelta. Questo importante cambio di paradigma servirebbe a ridurre la ridondanza di pubblicazioni scientifiche difficilmente paragonabili tra di loro, a utilizzare in modo più razionale i finanziamenti dedicati alla ricerca e a incoraggiare la cooperazione scientifica tra gruppi che oggi si considerano rivali.
Nell’articolo viene fatta anche un’interessante osservazione riguardante gli studi condotti con l’impiego di algoritmi di intelligenza artificiale: in questo tipo di studi, è opportuno abbassare drasticamente il valore p necessario per raggiungere la soglia di significatività statistica, con la finalità di impedire alla formidabile potenza degli algoritmi di trovare con troppa frequenza associazioni di dati che potrebbero poi rivelarsi non corrette.
Davide Caramella