Scegliere correttamente un campione per una ricerca è cosa veramente improba. Difficilmente si riesce a farlo in modo soddisfacente. Il campione è piccolo – Se ci sono pochi dati, se cioè il campione è composto da poche unità statistiche, ci sono anche poche possibili combinazioni del valore delle variabili e quindi la probabilità di ottenere per caso una combinazione di valori che indica una forte relazione è piuttosto alta. Se, per esempio, abbiamo due uomini e due donne che devono giudicare (buono-cattivo) un prodotto, la probabilità che casualmente entrambi gli uomini lo giudichino “buono” ed entrambe le donne “cattivo”, o viceversa, è di 1/8. Se invece consideriamo 500 soggetti, la probabilità che casualmente tutte gli uomini scelgano “buono” e tutte le donne “cattivo”, o viceversa, è praticamente nulla. Un noto esempio (Nisbett et al., 1987) è ambientato in due ospedali pediatrici: nel primo nascono 120 bambini, nel secondo solo 12. In media il rapporto maschi/femmine dei nati per giorno nei due ospedali è di 1/1. In un determinato giorno dell’anno, in uno dei due ospedali nasce un numero doppio di femmine rispetto ai maschi. In quale ospedale è più probabile che sia accaduto? Chi ha ben compreso quanto detto sulla dimensione del campione non avrà difficoltà a concludere che è molto più probabile che accada nell’ospedale più piccolo. Tecnicamente parlando, la probabilità di una deviazione casuale X dalla media della popolazione decresce all’aumentare della dimensione del campione.
Il campione è grande – Da quanto detto, sembrerebbe che la soluzione sia scegliere un campione di ampie dimensioni. Purtroppo, la scelta di un campione grande va incontro ad altri problemi. I principali sono l’ambiguità e l’errore della classe di riferimento.
Se una ricerca correlativa che intende correlare B ad A vuole evitare ogni ambiguità dovrebbe scorrelare dalla variabile su cui si è appuntata l’attenzione tutte le n altre variabili Ci (con i che va da 1 a n) che sono correlate ad A; per esempio, se voglio indagare il ruolo del sovrappeso nella genesi dei tumori dovrò scorrelare il fumo che, come tutti sappiamo, è un fortissimo agente tumorale.
Fin qui tutto facile e infatti molti ricercatori… scorrelano. Purtroppo non si è in grado di conoscere a priori le cause di A o comunque tutto ciò che è correlato a esso: quanto più il campione è grande tanto più non si possono studiare le caratteristiche dei singoli elementi del campione e quindi non si può eliminare l’ambiguità. Si supponga, per esempio, di voler valutare l’importanza dell’alimento B nella prevenzione di un determinato tipo di tumore (A). I ricercatori scorrelano le cause note di A, ma supponiamo che il tumore A si presenti in percentuali drasticamente basse in chi è stato allattato al seno. Ovviamente i ricercatori non hanno tenuto conto di questo (l’allattamento al seno è una delle migliaia di variabili di cui si dovrebbe tener conto!). L’allattamento al seno si presenta in maggior misura nella popolazione non benestante e se l’alimento B (supponiamo le fave) è consumato in misura maggiore da chi non è benestante rispetto a chi lo è, ecco che le fave sembreranno proteggerci dal tumore, mentre in realtà è l’allattamento al seno che lo fa.
Utilizzare campioni di grandi dimensioni paradossalmente servirebbe di più a dimostrare che qualcosa non funziona (principio di falsificabilità di Popper): se su un campione di 100.000 soggetti che assumono la sostanza X trovo la stessa incidenza tumorale che nel resto della popolazione, posso ragionevolmente concludere che X è ininfluente.
L’altro errore con un campione grande è quello della classe di riferimento. Spesso il campione numeroso viene scelto per motivi concreti in una regione o addirittura in una città (i partecipanti alla ricerca devono essere monitorati). Il risultato ottenuto si estende poi arbitrariamente a tutta la popolazione (per esempio si dice che la ricerca è stata condotta su 12.000 soggetti, ma si tace quasi sempre la provenienza, per esempio 12.000 soggetti lombardi). ovviamente le caratteristiche di una regione possono celare altri fattori correlati con il fattore indagato e quindi generare risultati che, se la ricerca fosse condotta altrove, non sarebbero confermati.

I ricercatori scientifici sono talmente immersi nel loro universo limitato da non poter in nessun modo vedere il quadro generale di nulla, nemmeno della propria ricerca. Arthur Bloch, Principio del quadro generale, La legge di Murphy, 1977
Il campione ideale – La statistica ci dice che il campione deve essere rappresentativo della popolazione. Se nello studio del gradimento di un’automobile scegliessi un campione di sole donne (o di soli uomini), sicuramente partirei con il piede sbagliato.
Un metodo molto usato per scegliere un campione rappresentativo è quello di scegliere in modo che ogni rappresentante della popolazione abbia la medesima probabilità di far parte del campione (campionamento casuale). In realtà, non è così semplice eseguire un campionamento casuale se non si possiede un elenco di tutti i rappresentanti la popolazione. Tali elenchi sono facilmente ottenibili se la popolazione è numericamente ristretta; si pensi invece alla popolazione degli italiani e si comprenderà che scegliere un campione veramente casuale non è facile (per esempio, gli elenchi telefonici non sono affatto completamente casuali per il semplice fatto che non tutti gli italiani vi sono inclusi). In presenza dell’elenco, assegnato a ogni voce dell’elenco un numero, basta generare una sequenza di numeri a caso e associare la scelta dei rappresentanti ai numeri usciti.
Si comprende che un campionamento veramente casuale è impossibile da gestire per diversi motivi:
- distanza geografica fra soggetto e ricercatore; in molti casi è infatti necessaria una forte interazione.
- Indisponibilità del soggetto; si ricorre quasi sempre a “volontari” che, in quanto tali non sono (sia per caratteristiche fisiche, psicologiche ed economiche) del tutto neutri.
Va da sé che, anche in presenza di campionamento veramente casuale sugli italiani, i risultati della ricerca varrebbero per gli italiani e non per tutta la popolazione; per esempio caratteristiche della razza potrebbero far sì che i risultati non siano confermati su asiatici.
Come si vede, è veramente arduo avere un campione “buono” e i ricercatori, prima ancora di gettarsi nella ricerca, dovrebbero spendere molto tempo per avvicinarsi a esso. Probabilmente le ricerche più serie sono quelle dove si spendono più parole a convincere sulla bontà del campione che sui risultati ottenuti!
Attualmente (ma la cosa non è cambiata dai primi successi dell’epidemiologia) le ricerche più valide sono quelle che utilizzano il doppio cieco su un campione non piccolo e in cui l’effetto sul placebo è nullo.
Indice materie – Medicina – Ricerca scientifica – Errori nel campione della ricerca