Alla ricerca di un sistema bayseano.

Come applicare il sistema bayseano alla politica italiana per predire le elezioni future.

Una collaboratrice del Termometro Politico tempo fa mi passò un articolo sui sistemi bayseani applicati alla politica USA. L’articolo di Kari Lock e Andrew Gelman mi fece pensare ad un qualche sistema per applicare il sistema bayseano, molto diretto da applicare in un sistema bipolare come quello statunitense con rumore di fondo dovuto al terzo incomodo, ma ben più difficile in un sistema multipolare ed estremamente dinamico come quello italiano. A pagina 3 dell’articolo compaiono alcuni grafici interessanti: rappresentano la dispersione del voto negli stati in funzione del vincitore alla Casa Bianca. Come si nota, la dispersione è pressoché lineare con, come spiegano gli autori, correlazioni maggiori o minori a seconda che lo stato in questione sia storicamente pro-Democrat o pro-Republican. Da pagina 4 in poi si mostra il modello basato su dati storici per poi predirre il risultato di Obama nel 2009 (leggermente sottostimante sia sulla percentuale sia sul numero di delegati). Tuttavia il modello appare promettente.

Per poterlo applicare anche all’Italia bisogna inventarsi un modo, sicuramente non triviale, di ripesare i micropartiti che vanno e vengono, le nuove formazioni che si aggregano di anno in anno, etc. etc.. Tuttavia, come primo discriminante che mi sono posto, vorrei riuscire a dimostrare che anche in Italia, nazione dal voto politico spesso aleatorio, la dispersione sull’esito finale segua un andamento rettilineo. Questo sarebbe un buon viatico per poi creare un modello bayseano.

Qui di seguito si osservano le dispersioni, comune per comune, per i primi 9 partiti, rispetto al dato nazionale di EUR09. La scala è logaritmica, con il log della frequenza sulle ordinate ed il log della dispersione sulle ascisse. I risultati, come si può leggere dai grafici, sono a dir poco sorprendenti per la precisione e la costanza del coefficiente angolare, con uno scarto di pochi percentuali rispetto all’unità. La massima differenza relativa è dell’8,82%, tra il valore più basso del coefficiente (Italia dei Valori: 0.09668) ed il più alto (Popolo della Libertà: 1.096), che tra l’altro sono negativamente correlati come si noterà più in là. Perciò non mi stupisco che siano anche anti-correlati nel coefficiente angolare. Mi sarei stupito dell’opposto.

Gli intervalli di dispersione sono scelti in un range tra l’1‰ ed il 20% sul dato nazionale di EUR09.

AUTONOMIE

 

ITALIA DEI VALORI

 

LEGA NORD

 

PARTITO DEMOCRATICO

 

POPOLO DELLA LIBERTA’

 

RADICALI/LISTA BONINO/PANNELLA

 

(per continuare la lettura cliccare su “2”)

RIFONDAZIONE COMUNISTA-PARTITO DEI COMUNISTI ITALIANI

 

SINISTRA E LIBERTA’

 

UNIONE DI CENTRO

 

La matrice di correlazione tra i vari partiti indica i seguenti coefficienti

SEL AUT RC-PDCI PDL RAD PD UDC LEGA IDV
SEL 1,0000 -0,0012 0,1710 -0,1014 -0,1417 0,0321 -0,0002 -0,3761 0,1044
AUT -0,0012 1,0000 -0,0400 0,0034 -0,2083 -0,0774 0,2044 -0,2801 -0,0710
RC-PDCI 0,1710 -0,0400 1,0000 -0,0646 -0,0250 0,3320 -0,0196 -0,3497 0,0826
PDL -0,1014 0,0034 -0,0646 1,0000 -0,0107 -0,1764 -0,0399 -0,2631 0,0719
RAD -0,1417 -0,2083 -0,0250 -0,0107 1,0000 0,0085 -0,1638 0,1690 0,0233
PD 0,0321 -0,0774 0,3320 -0,1764 0,0085 1,0000 -0,0758 -0,4063 -0,0336
UDC -0,0002 0,2044 -0,0196 -0,0399 -0,1638 -0,0758 1,0000 -0,1880 -0,0504
LEGA -0,3761 -0,2801 -0,3497 -0,2631 0,1690 -0,4063 -0,1880 1,0000 -0,2718
IDV 0,1044 -0,0710 0,0826 0,0719 0,0233 -0,0336 -0,0504 -0,2718 1,0000

da cui si evince che anche all’interno delle stesse coalizioni i vari partiti si danno battaglia: il PDL è negativamente correlato con la Lega, addirittura -27%, l’IDV ha correlazione del -3% con il PD ma +10% con SEL e +8% con RC-PDCI. L’UDC si correla al 20% con le AUT, -16% con i Radicali, -7% con il PD, -17% con il PDL e -18% con la Lega.

Ogni partito mostra un distribuzione t di Pearson (tranne PD e PDL, più distribuiti normalmente) con un coefficiente di verosimiglianza molto buono con valori di V.a.R. ed Expected short-fall l 5% secondo la seguente tabella riepilogativa (ovvero, qual’è il minimo tra i risultati peggiori sul 5% del campione e quale il risultato medio tra i peggiori)

VAR al 5% MEAN MAX
SEL -0,9124 -0,80668
AUT -1 -1
RC-PDCI -0,92117 -0,80611
PDL -0,68233 -0,4656
RAD -0,94833 -0,8446
PD -0,78876 -0,65466
UDC -0,79324 -0,61904
LEGA -0,99716 -0,98787
IDV -0,7571 -0,64727

Il PDL perciò ha il VAR/Expected short-fall più basso, mentre le AUT quello più alto. In pratica, con il PDL c’è meno rischio nominale di non trovarsi sulla retta di massima interpolazione; il contrario con le AUT, sebbene anche la Lega mostri ampi margini di errore, dovuti alla sua alta localizzazione elettorale. Se dovessimo scommettere un euro su quale partito potrebbe disperdersi di più sul 5% dei comuni italiani, quell’euro andrebbe molto probabilmente al PDL, se vogliamo metterla sul piano più da bookmaker. Tuttavia, il PD e l’IDV mostrano valori meno discordanti tra il valor medio ed il massimo, indicando che sono partiti con un minor tasso di dispersione tra i valori estremi. Quindi, un bookmaker più oculato potrebbe puntare su questi due partiti. Con AUT e Lega, rischio quasi certo di sbancare.

Ora bisogna solo trovare il sistema bayseano più adatto alla conformazione partitica italiana!

Se qualcuno dei lettori è interessato a collaborare alla stesura del modello, ci contatti per favore alla nostra email

redazione@termometropolitico.it

Grazie.

Sinistra e Libertà Autonomie Rifondazione Comunista/Partito dei Comunisti Italiani Popolo della Libertà Radicali/Lista Bonino-Pannell Partito Democratico Unione di Centro Lega Nord Italia dei Valori
Sinistra e Libertà 1 -0,00124 0,17103 -0,1014 -0,14166 0,032104 -0,00017 -0,37614 0,10441
Autonomie -0,00124 1 -0,03998 0,003427 -0,20825 -0,07741 0,20437 -0,28011 -0,07102
Rifondazione Comunista/Partito dei Comunisti Italiani 0,17103 -0,03998 1 -0,06459 -0,02497 0,33204 -0,01958 -0,34965 0,08259
Popolo della Libertà -0,1014 0,003427 -0,06459 1 -0,01071 -0,17644 -0,03986 -0,2631 0,071916
Radicali/Lista Bonino-Pannell -0,14166 -0,20825 -0,02497 -0,01071 1 0,008501 -0,1638 0,16895 0,023276
Partito Democratico 0,032104 -0,07741 0,33204 -0,17644 0,008501 1 -0,07582 -0,40627 -0,0336
Unione di Centro -0,00017 0,20437 -0,01958 -0,03986 -0,1638 -0,07582 1 -0,18797 -0,05036
Lega Nord -0,37614 -0,28011 -0,34965 -0,2631 0,16895 -0,40627 -0,18797 1 -0,27184
Italia dei Valori 0,10441 -0,07102 0,08259 0,071916 0,023276 -0,0336 -0,05036 -0,27184 1