«

»

lug 17

Il paradosso del compleanno: una variante

Pinocchio e Colombina, dopo aver risolto il dilemma di Mangiafuoco del capitolo 5, furono finalmente liberati dal burattinaio. Il quale, nonostante la nomea, non era poi così cattivo come voleva sembrare.

«Chissà quanti burattini nascono in un certo giorno» si chiese Colombina, pensierosa.

«Non saprei» replicò Pinocchio. «Dici che ogni giorno ne nascono tanti?».

«Forse dipenderà dal legname che viene prodotto» rispose la compagna di viaggio.

«Perché?».

«Ti ricordo che siamo fatti di legno, amico mio».

«Ah, già, è vero. Ma dici che ci sono giorni in cui si taglia più legna?».

«Probabilmente in estate, quando il tempo è migliore».

«Chissà se anche per gli umani vale una cosa simile» si chiese il burattino.

«Non lo so, Pinocchio. Non ho idea di come gli umani vengano prodotti. Magari ci sono stagioni più prolifiche di altre anche per loro».

«E dici che questo potrebbe modificare il ragionamento di cui hai parlato capitolo 4?».

«Magari sì» rispose. «D’altra parte, una delle ipotesi più forti del ragionamento era proprio quella secondo la quale la distribuzione delle nascite è più o meno uniforme, ovvero in ogni giorno dell’anno nascono più o meno gli stessi burattini».

«E cosa succederebbe se ci fossero più o meno burattini nati nello stesso giorno, per esempio il 31 novembre?».

«Penso nulla, visto che il 31 novembre non esiste» rispose prontamente Colombina, sorridendo all’ingenuo Pinocchio. Poi continuò: «In generale, comunque, una qualsiasi quantità che si discosti dalla distribuzione uniforme cambierebbe il problema a vantaggio del mio calcolo. Potrebbe anche capitare che, in caso di grande discrepanza, il numero minimo per cui valga la pena scommettere sia minore di 23».

«Davvero? E perché?».

«Pensa al caso estremo. Immagina ad esempio che più di metà dei burattini siano nati in uno stesso giorno, per esempio il 31 gennaio, mentre l’altra metà sia uniformemente distribuita sugli altri giorni. È chiaro che trovare due burattini nati lo stesso giorno è molto più facile, no?».

«In effetti sì».

«Peccato non poter sapere quando sono nati tutti i burattini, vero?» si chiese Colombina.

«Già, si potrebbero fare gli auguri puntualmente a tutti» rispose Pinocchio, ridendo.

I due, così dicendo, proseguirono per la loro strada.

L’angolo del Grillo parlante

Il problema posto da Colombina è forse difficile per i burattini, ma può essere ben approssimato per gli esseri umani. Il punto sta nel trovare dati statistici affidabili sul numero di persone nate ogni giorno. L’ideale sarebbe poter accedere all’anagrafe di qualche comune, ma non si tratta sicuramente di dati facilmente ottenibili con una semplice richiesta (o forse sì, chissà). C’è un modo molto più semplice per ottenere questo tipo di dati aggregati, e ci è offerta dalla più vasta enciclopedia del mondo: Wikipedia. In essa si trovano infatti decine di migliaia di biografie di persone sparse per il mondo, e per ognuna di essere è facilmente individuabile la data di nascita. Esiste addirittura un progetto parallelo di Wikipedia, dbpedia, che si è preoccupato di raccogliere tutti questi dati e renderli fruibili in maniera schematica e comoda per una rapida analisi, proprio come in questo caso.

È stato quindi facile calcolare la probabilità che una persona sia nata in un determinato giorno e, conseguentemente, capire quale sia la probabilità che in gruppo dato di n persone ce ne siano due che condividono il compleanno.

Nonostante la buona volontà di chi ha scritto questi dati e di chi li ha raccolti e aggregati, ci sono alcuni errori: non mancano, per la gioia di Pinocchio, biografie di persone nate il 31 novembre o, addirittura, il 31 febbraio. Sono stati quindi eliminati questi dati, insieme con quelli relativi al 29 febbraio, che complicano solamente i calcoli senza aggiungere significatività statistica (come già fatto notare in vari studi facilmente reperibili online).

Ebbene, sono uscite alcune particolarità nella distribuzione: nei giorni “normali” questa distribuzione oscilla tra il 2,5 e il 3 per mille, tranne nel primo giorno dell’anno, in cui questa probabilità è del 4,8 per mille, quasi il doppio del normale. Ci stupisce questa informazione? Assolutamente no: è una semplice conferma della celebre “corsa” che le madri fanno per avere il primo nato dell’anno (che ogni volta finisce inevitabilmente protagonista di qualche servizio sul telegiornale nazionale).

Per il resto, però, purtroppo nessuna novità: il numero di persone presenti a una festa per il quale conviene scommettere sul compleanno “sincronizzato” rimane 23. Varia solo di poco la probabilità: in caso di distribuzione uniforme la probabilità di vittoria in caso di 22 persone è del 46,94%, mentre con la distribuzione reale questa percentuale sale 47,14%, ancora inferiore al 50% e quindi non conveniente per una scommessa.

(I dati utilizzati per questo calcolo sono stati presi da dbpedia 3.6, che ha raccolto e uniformato le informazioni di Wikipedia in lingua inglese di ottobre 2010)

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

Puoi usare i seguenti tag HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>