Avui fa un mes de l’aparició mediàtica del numero 1515. De cop, tothom va començar a parlar de si un empat a 1515 vots era o no probable. Sembla impossible que només faci un mes, oi?. Amb la quantitat de coses que han passat…
Hi va haver molt debat a les xarxes a partir d’una pregunta de Gerard Piqué, que va demanar quina probabilitat hi havia que l’assemblea dels Cupaires acabés en empat. El debat va incloure intervencions, entre d’altres, d’en Xavier Sala-i-Martin i dos supòsits que va publicar l’Ara amb raonaments relacionats amb el llançament d’una moneda. Malauradament, les votacions no es poden analitzar amb models de monedes, perquè els humans anem canviant d’opinió, a diferència de les boles i monedes.
Escric aquest article aprofitant l’avinentesa que avui, com deia, fa un mes de tot plegat, i també perquè alguns companys m’ho han demanat. En tot cas, vull deixar clar que es tracta única i simplement d’un exercici de càlcul de probabilitats per mostrar que moltes afirmacions que es van fer i que deien que l’empat era molt i molt improbable, eren falses.
No podem parlar de llançament de monedes perquè els humans som força més complicats, però també perquè les probabilitats depenen de la informació prèvia que tinguem. No és el mateix la probabilitat de tenir un retard de més de 15 minuts en el tren que he d’agafar demà si no tinc cap més informació, que aquesta mateixa probabilitat si sé el tipus de tren i/o el lloc on sóc, perquè les probabilitats de retard d’un rodalies, d’un TGV o d’un tren Alemany o Suïs són totalment diferents.
Diuen que per tal de poder trobar una solució, cal abans saber quin és el problema. Cèsar ho va fer, tot posant en evidència que calia considerar la informació prèvia que ja teníem (vegeu el comentari del 28/12/2015 a les 18:25). Va explicar que calia partir dels resultats de la segona votació, que de fet eren una evolució bastant previsible dels resultats de la primera: 1512 vots en contra d’investir a Mas, 1510 vots a favor d’investir-lo (1482 + 28 = 1510) i 20 blancs i nuls. La pregunta de Cèsar era un bon plantejament del problema: “tot sabent aquests resultats de la segona votació, quin resultat es pot esperar a la tercera votació?”.
Però no n’hi ha prou. Encara cal fer més hipòtesis, i alguns supòsits addicionals que es van fer a les xarxes socials no són correctes. No es pot aplicar la llei binomial, perquè les persones no som boles blanques i negres. Les persones canviem d’opinió, i en un cas tan ajustat com el que estem considerant, aquests canvis són els que determinen el resultat. No podem pensar que el vot de 3022 de persones (1512+1510) ja era conegut, per la mateixa raó: és ben probable que algú canviés el seu vot entre la segona i la tercera votació. I no crec que puguem pensar que els 28 que havien votat sí a Mas però no a l’acord votarien sí a la tercera votació, o que hi hauria un canvi de vot només en vuit dels 20 vots nuls.
L’element clau que ens aniria bé saber és quantes de les 3022 persones que van votar una opció definida a la segona votació, van canviar el seu vot a l’hora de votar per tercera vegada. Segurament hi va haver canvis en els dos sentits, encara que el que a nosaltres ens interessa és el còmput total. I com que no tenim manera de saber el que va passar, ho hem d’expressar en forma de probabilitats. Per fer-ho fàcil, proposo anomenar PC(0) la probabilitat que, a la tercera votació, les 3022 persones continuessin repartint-se en 1512 vots en contra i 1510 a favor (parlo de totals, no de persones concretes). De la mateixa manera, PC(1) és la probabilitat que, a la tercera votació, les 3022 persones es repartissin en 1511 vots en contra i 1511 a favor, i PC(-1), la probabilitat que el resultat fos un vot menys a favor i un vot més en contra. En general, PC(x) és la probabilitat que els 3022 vots es repartissin en 1510+x vots a favor i 1512-x vots en contra, on x és qualsevol valor enter, positiu o negatiu. És bastant plausible que PC(0) sigui un valor petit, que PC(x) creixi per valors petits del valor absolut de x, i que després torni a ser petit a mesura que aquest valor absolut de x va creixent, perquè és rar que moltes persones a la vegada vagin canviant de vot.
La probabilitat condicionada ens permet, ara sí, calcular la probabilitat d’empat en base a la probabilitat d’empat quan coneixem el nombre de canvis en el grup de 3022 vots (que anomenaré PE), i a aquesta probabilitat de canvi PC(x). En concret, la probabilitat d’empat és la suma de PE(0)*PC(0) + PE(1)*PC(1) + PE(-1)*PC(-1) + PE(2)*PC(2) + PE(-2)*PC(-2) +…, per tots els valors de x fins que PC(x) sigui suficientment petit. Estic suposant que ningú de les 3022 persones va deixar de votar a la darrera votació, però si volem incloure aquest supòsit és ben fàcil, només cal afegir termes a la suma anterior. En tot cas, els valors de PE són les probabilitats d’empat sabent el resultat de la segona votació i sabent el còmput total dels canvis de vot de les 3022 persones (fixeu-vos que el que estem fent és sumar per totes les possibilitats d’aquest còmput de les 3022 persones, que no coneixem). Per exemple, PE(0) és la probabilitat d’empat sabent que les 3022 persones van continuar repartint-se en 1512 vots en contra i 1510 a favor, mentre que PE(2) és la probabilitat d’empat sabent que les 3022 persones van repartir-se en 1510 vots en contra i 1512 a favor. En el primer cas, el que calia és que, dels 20 vots restants, 3 fossin en contra i 5 a favor (o bé 4 en contra i 6 a favor, etc., vegeu la nota al final), mentre que en el segon cas hi hauria empat si, d’aquests 20 vots, 5 fossin per exemple en contra i 3 fossin a favor. No sabem el comportament d’aquestes 20 persones i el que van fer, però és clar que els valors de PE(y) no són massa petits, perquè no estem parlant del comportament de 3030 persones sinó del que van fer 20 persones (suposant, és clar, que ningú marxés entre les dues votacions), vegeu la nota la final. En concret, PE(0) és del 9,7%. En d’altres paraules, si el grup de 3022 persones que ja havia votat sí o no hagués mantingut el seu total de vots afirmatius i negatius, la probabilitat d’empat a la tercera votació era del 9,7%, quasi un 10%.
Algunes conclusions. En primer lloc podem afirmar que, com que alguns valors de PC(x) no són petits i com que els valors de PE(y) tampoc ho són, la probabilitat d’empat després d’una segona votació 1512-1510 no és pas tan petita com es va dir (a la nota del final podeu veure el resultat amb alguna hipòtesi addicional). En segon lloc, hem d’acceptar que no tenim prou dades per a calcular les PC(x) i les PE(y) i que per tant no podrem saber amb exactitud la probabilitat final d’empat, perquè aquests valors depenen del comportament de cada grup humà en concret i no disposem d’estudis sociomètrics suficients.
En poques paraules: l’empat era molt més probable del que molta gent va dir.
Per cert, acabo amb una frase que m’ha agradat: l’Albert Sàez diu que, amb la crisi dels refugiats, els tolerants països nòrdics han deixat de ser-ho. Pensa també que la mort de Schengen és la mort d’Europa.
———
NOTA: Una primera consideració és que, com que la suma de totes les PC(x) (que representen tots els comportaments possibles de les 3022 persones) ha de ser la unitat, podem afirmar que la probabilitat d’empat és superior al mínim de tots els valors PE(y).
Pel que fa a la probabilitat d’empat PE(y), la podem calcular si encara fem alguna hipòtesi extra. El que segueix ho concretaré a dos casos concrets, PE(0) i PE(2), però el raonament és fàcilment extrapolable a qualsevol altre valor de y. Aquest valor de PE(y) depèn del comportament de les 20 persones que havien votat nul o blanc a la segona votació que, com és evident, no podem analitzar ni descriure amb les poques dades que tenim. Però un cop més, i concretant-nos al cas PE(0), podem escriure que PE(0) = Prob(2,0)*PV(2) + Prob(3,1)*PV(4) + Prob(4,2)*PV(6) + Prob(5,3)*PV(8) + Prob(6,4)*PV(10) + … + Prob(11,9)*PV(20). És una suma de 10 termes, on PV(k) és la probabilitat que un total de k de les 20 persones votessin a la tercera votació, i Prob(5,3), per exemple, és la probabilitat que les vuit persones que van votar ho fessin en forma de 5 vots afirmatius i 3 vots negatius. Tot plegat és degut a que estem calculant la probabilitat d’empat en general, no pas la d’empat a 1515. Observeu també que totes les k dels factors PV(k) són parells, perquè en el cas PC(0) i PE(0), l’empat era impossible si el nombre de vots del grup dels 20 era senar. Podríem fer ara la hipòtesi extra que, del grup de 20, era tan probable que votessin dues persones com que votéssim tres persones, o qualsevol altre nombre de persones. No ho sabem, però alguna cosa hem de suposar. En aquest cas, és clar que totes les PV(k) són iguals a la fracció 1/21, perquè hi ha 21 casos (podien votar 0, 1, 2, .. o 20 persones). I els valors Prob(i,j) = Prob (j,i) són fàcils de calcular usant la combinatòria, perquè si suposem que i>j i diem n=i+j, el valor de Prob(i,j) és igual al nombre combinatori “n sobre j” (casos favorables) dividit per “2 elevat a n” (total de casos possibles).
En resum, PE(0) = (Prob(2,0) + Prob(3,1) + Prob(4,2) + … + Prob(11,9) )/21. Si feu el càlcul, el resultat és PE(0) = (0,25 + 0,25 + 0,2344 + 0,219 + 0,205 + 0,1933 + 0,1833 + 0,1746 + 0,1670 + 0,1602)/21 = 0,09699. En d’altres paraules, si el grup de 3022 persones que ja havia votat sí o no va mantenir el seu total de vots afirmatius i negatius, la probabilitat d’empat a la tercera votació era del 9,7%, quasi un 10%.
El cas PE(2) és molt similar, així com tots els altres: PE(2) = Prob(0,2)*PV(2) + Prob(1,3)*PV(4) + Prob(2,4)*PV(6) + Prob(3,5)*PV(8) + Prob(4,6)*PV(10) + … + Prob(9,11)*PV(20). Per cert, és fàcil veure que sempre es compleix que PE(0) = PE(2) = 0,09699. I de la mateixa manera podríem calcular tots els altres PE(k) que necessitem per a saber la probabilitat d’empat. Però com que ja es veu que les PE(k) seran del mateix ordre, podem afirmar que la probabilitat d’empat era molt més elevada del que la gent va acabar pensant…