Il termine probabilità è sicuramente noto a tutti, ma pochi sanno darne una definizione chiara e immediata. Un primo motivo di questa situazione risiede nel fatto che ci sono diversi modi di intendere il concetto.
Un modo sicuramente discutibile (e che non riscuote la nostra approvazione) è quello che lo identifica con il grado di credenza di un singolo evento. Frasi come “c’è il 30% di probabilità che la squadra X batta la squadra Y” esprimono una credenza basata non tanto su dati statistici quanto sull’esperienza di chi la esprime. Questa interpretazione soggettivistica ha alcuni problemi.
Il primo, non grave e teoricamente superabile, è il rispetto delle leggi del calcolo delle probabilità, per esempio che la somma delle probabilità di un insieme di alternative esaustivo ed esclusivo debba essere uguale a 1.
In realtà, quando le alternative sono molte, le probabilità per credenza sono date a caso. Se nel caso della squadra si comprende che se il 30% è la probabilità di X di vincere, la somma di quelle del pareggio e della sconfitta deve essere il 70%, quando si considera per esempio la probabilità di non retrocedere delle ultime 5 squadre in base ai risultati delle ultime 4 partite di campionato di cui si vanno a “stimare” le probabilità dei risultati, si scopre sempre che alla fine la somma delle probabilità di salvezza delle squadre coinvolte non è conforme alle leggi generali del calcolo delle probabilità (soprattutto se per esempio si salvano due squadre): un utile esercizio che si può fare leggendo un qualunque giornale sportivo alla fine del campionato di calcio.
Il secondo problema è più grave e risiede nel fatto che uno scenario incerto viene trasformato arbitrariamente in uno di rischio. Che il valore sia del 30% o del 20% o del 40% è tutto da dimostrare.
Il terzo problema è quello che definitivamente dovrebbe affossare la definizione soggettivistica: partendo dal secondo punto, non è possibile trattare l’argomento (probabilità di vittoria della squadra X nell’incontro con Y) con tecniche statistiche perché si tratta di un evento singolo, che non ha caratteristiche di regolarità e ripetibilità. Certo, possiamo dire statisticamente che negli ultimi 20 campionati X ha battuto Y solo nel 30% dei casi, ma tutti capiscono che da questo dato non si può desumere nulla sul prossimo incontro poiché le condizioni (per esempio la formazione delle squadre) sono cambiate.
Se la definizione soggettivistica è troppo ampia, quella basata sulla propensità è troppo ristretta. Le propensità sono proprietà degli oggetti studiati, per esempio la simmetria cubica di un dado. La struttura di riferimento dà la probabilità di un evento, per cui, per esempio, diciamo che c’è 1/6 di probabilità che esca il 3.
Purtroppo le propensità non sono poi così comuni ed è necessario essere un po’ più elastici e riferirsi ai fenomeni cercando di individuare comunque caratteristiche di prevedibilità interagendo con essi, cioè facendo esperimenti. Ecco allora che la probabilità si identifica con le frequenze di un grande numero di osservazioni.
Come si calcola
Per completezza, occorre citare le principali definizioni che sono note dalla matematica. La prima, quella classica, risale a Laplace e la definisce come il rapporto tra il numero dei casi favorevoli all’evento e il numero dei casi possibili, purché questi ultimi siano tutti equiprobabili.
La seconda, quella frequentista, risale a von Mises e definisce la probabilità di un evento come il limite cui tende la frequenza relativa dell’evento al crescere del numero degli esperimenti.
Nota è poi la definizione assiomatica di Kolmogorov che, peraltro, non consente di calcolare la probabilità.
Se la definizione di von Mises è sostanzialmente equivalente a quella che definiamo “empirica”, quella di Kolmogorov non rispetta i principi di concretezza della raziologia e non può esserci utile. Per chi volesse trovare un fondamento logico (non empirico) al concetto non resta che quella classica di Laplace, ma è evidente la circolarità della definizione: che senso ha definire la probabilità parlando di eventi equiprobabili?
Definizione empirica
Consideriamo
- un evento
- un elevato numero di osservazioni (o di prove)
- una classe di riferimento.
Si definisce probabilità dell’evento il valore costante cui tende la frequenza relativa al crescere del numero delle osservazioni (prove) nella classe di riferimento osservata.
La classe di riferimento è fondamentale perché, senza di essa, esprimere la probabilità non ha senso. Nel linguaggio comune si dice che un soggetto ha 1 probabilità su 10.000 di morire quest’anno in un incidente stradale. Tale affermazione non è corretta perché non si indica la classe di riferimento. Se è vero che di solito si dà per scontata, si possono commettere grossolani errori. Per esempio, il dato può sottintendere “soggetto italiano”, cioè in Italia. A un esame più attento si potrebbe scoprire che il valore cambia da regione a regione, per cui nella regione X sarebbe di 1 su 7.000. Poi si potrebbe considerare solo la classe di riferimento di chi ha la patente e scoprire che nella regione X un soggetto patentato ha 1 probabilità su 5.000; riduciamo la classe e consideriamo i patentati sotto ai 30 anni di età e scopriamo che Claudio, abitante nella regione X, patentato, 28 anni, ha 1 probabilità su 3.000 di morire quest’anno in un incidente stradale. Lo stesso Claudio con la classe di riferimento iniziale (italiani) aveva 1 probabilità su 10.000! Come si vede, la scelta della corretta classe di riferimento consente una migliore comprensione del problema.

La probabilità che esca un nove è di 1/9 (4 casi sui 36 possibili)
Definizione formale
La probabilità che accada un evento è data dal rapporto fra il numero dei casi favorevoli e il numero dei casi possibili.
Se h sono i casi favorevoli e k quelli possibili, la probabilità che si manifesti l’evento X è indicata con:
p(X)=h/k.
Si deve notare che quando esistono propensità (per esempio, la caratteristica di un mazzo di carte di avere 4 assi su 52 carte) la definizione empirica è superflua, anzi, piuttosto complessa perché sarebbe necessario un gran numero di prove per scoprire che, estraendo una carta da un mazzo, ho una probabilità su 13 di estrarre un asso. Con la definizione formale ci si arriva subito.
La definizione formale che abbiamo proposto è una netta semplificazione della definizione classica; a essa però assoceremo una condizione di applicabilità che è tipica della raziologia:
se si possiede un’informazione per cui gli eventi possibili non sono equivalenti rispetto al loro presentarsi, la definizione formale perde ogni significato.
Tornando al nostro mazzo, se è truccato non esiste nessuna possibilità di dare una probabilità all’uscita di un sei: non ho che la strada empirica per scoprire la probabilità associata all’uscita di un asso.
La condizione di applicabilità potrebbe sembrare una scappatoia pratica dalle difficoltà della definizione classica di Laplace, ma non è così perché non c’è più nessuna circolarità. Si parla di informazione su eventi non equivalenti, informazione che necessariamente non coinvolge la probabilità dell’evento stesso. L’approccio è raziologico perché la definizione formale diventa un’arma che si deve usare con cura, verificando, innanzitutto, di muoversi in uno scenario di rischio e non in uno scenario incerto.
Probabilità composta – Probabilità condizionata
Si può paralre anche di probabilità composta o condizionata. Si veda l’articolo Probabilità composta.